<input id="ijbvh"><ruby id="ijbvh"><wbr id="ijbvh"></wbr></ruby></input>

<nobr id="ijbvh"><td id="ijbvh"><listing id="ijbvh"></listing></td></nobr>

<rp id="ijbvh"><td id="ijbvh"></td></rp>

<source id="ijbvh"></source>

<strong id="ijbvh"><blockquote id="ijbvh"></blockquote></strong>

熱門
資訊
科技

大意外！高考數(shù)學(xué)輪戰(zhàn)大模型，結(jié)果完全想不到_環(huán)球觀察

發(fā)布時間：2023-06-08 20:02:08 | 來源：量子位

聽說網(wǎng)友被 ChatGPT 氣炸了！

昨個兒高考數(shù)學(xué)剛結(jié)束，有網(wǎng)友就坐不住了，趕緊找來了新高考數(shù)學(xué)一卷的部分題喂給了 AI 同學(xué)。

結(jié)果卻讓人大跌眼鏡（8> √ 9 × 3=3 √ 3？）：

(相關(guān)資料圖)

有網(wǎng)友表示：

ChatGPT4 能把自己氣炸，怎么教都不會

△圖源博主 @浪豬灰頭

所以大模型之前表現(xiàn)數(shù)學(xué)推理能力好，都是在?；ㄕ校克皇怯涀×藛栴}的答案？

先別著急下定論，給 AI 同學(xué)一個證明自己的機(jī)會吧。

我們用 ChatGPT（GPT-3.5）、GPT-4、百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型這幾位 " 數(shù)學(xué)高手 " 進(jìn)行了測試。（最近出現(xiàn)了太多的大模型，實在測不完，還有比如 Bard 不支持中文等原因，所以我們先選擇了上述幾個模型）

整體表現(xiàn)如上圖，目前大模型在做高考數(shù)學(xué)題方面還是個 " 差生 "。

一起來看下具體結(jié)果是怎樣令人哭笑不得的。

五大模型能否做對填空題？

先來點(diǎn)填空題當(dāng) " 開胃小菜 "。

公平起見，我們使用同樣的格式進(jìn)行提問。

某學(xué)校開設(shè)了 4 門體育類選修課和 4 門藝術(shù)類選修課，學(xué)生需從這 8 門課中選修 2 門或 3 門課，并且每類選修課至少選修 1 門，則不同的選課方案共有？種

答案：64

GPT-4（正確）

ChatGPT （錯誤）文心一言（錯誤）不應(yīng)該是兩種方案數(shù)加起來嗎？已經(jīng)逐漸離譜。

通義千問（錯誤）

第一種選課方案里的 " 都不選 " 是個什么鬼！

訊飛星火（錯誤）

出師不利，只有 GPT-4 給出了正確答案，填空題對于大模型來說也很有難度？

但是看起來這幾位 AI 同學(xué)都知道分情況來計算，也許只是恰巧這道題做錯了？我們接著往下看。

在正四棱臺 ABCD-A1B1C1D1 中，AB=2，A1B1=1，AA1= √ 2, 則該棱臺的體積為

答案：7 √ 6/6

GPT-4 （錯誤）

ChatGPT（無解）這一題直接全軍覆滅，ChatGPT 更是直接沒解出來，還讓檢查是不是題出錯了?！揪让?p>答案越來越離譜了，還真就不信邪了。

再來！

已知函數(shù) f ( x ) = cos ω x -1 ( ω >0 ) 在區(qū)間 [ 0,2 π ] 有且僅有 3 個零點(diǎn) , 則 ω 的取值范圍是？

答案： [ 2,3 )

GPT-4（錯誤）

ChatGPT（錯誤）訊飛星火（正確）本已經(jīng)抱著再一次全軍覆沒的心情了，沒想到中文大模型力挽狂瀾！

做大題表現(xiàn)如何？

玩膩了填空題，再來挑戰(zhàn)一下更有難度的大題吧！

公平起見，我們還是以同樣的格式進(jìn)行提問：

請你做一下面這道數(shù)學(xué)題：已知在△ ABC 中，A+B=3C，2sin ( A-C ) =sinB。（1）求 sinA （2）設(shè) AB=5，求 AB 邊上的高

答案：（1）10 √ 10 /3（2）6

下面是各個大模型的表現(xiàn)結(jié)果：

訊飛星火（第一問答案正確，第二問錯誤）這道三角函數(shù)題，科大訊飛的星火認(rèn)知大模型第一小問答案對了，但是步驟中有差錯（第二步）。

據(jù)說，GPT-4 做這種題只有 0.1% 的概率生成的結(jié)果完全正確。

高考數(shù)學(xué)第一道大題通常都比較簡單，上面這幾位 AI 同學(xué)的表現(xiàn)你覺得怎么樣？

如果大家感興趣可以自己測試一下后面幾道難度相對較高的大題（小編試過了，結(jié)果一言難盡，不忍直視）。

或者大家可以使用不同的 prompt 試試捏～

參考鏈接：

[ 1 ] https://weibo.com/5647310207/N4frlb5tx?refer_flag=1001030103_

關(guān)鍵詞：

推薦閱讀

九八策略：股票實盤杠桿平臺丨國際油價企穩(wěn)難挽主題基金頹勢年內(nèi)收益全部為負(fù)

發(fā)布于 2023-06-06 15:04:21

2023臥室投影儀怎么選？三千元推薦當(dāng)貝D5X Pro、堅果N1

發(fā)布于 2023-06-06 10:21:19

多位分頻機(jī)軟件對剪輯規(guī)則的干貨分享

發(fā)布于 2023-05-22 17:04:38

六云多剪儀軟件剪輯抓不住重點(diǎn)？那是你不知道這7個技巧

發(fā)布于 2023-05-13 21:17:18

回音秒剪儀軟件對于做好視頻的干貨分享

發(fā)布于 2023-05-12 17:58:09

好用的回音秒剪儀軟件滿滿干貨分享get

發(fā)布于 2023-05-12 16:48:09

從無到有，中國資本市場成為全球第二大股票債券市場只花了30年

發(fā)布于 2023-04-25 13:00:44

INSEC WORLD世界信息安全大會移師西安，倒計時一個月！

發(fā)布于 2023-02-24 17:20:50

什么是軟文？軟文推廣平臺有哪些？

發(fā)布于 2022-12-26 11:14:57

軟文推廣要這樣刷“存在感”，才能讓潛在用戶“無處可逃”

發(fā)布于 2022-12-13 10:42:13

獨(dú)家推薦

新聞排行

女子不滿意雙眼皮手術(shù)要求槍斃醫(yī)生，如何看待“網(wǎng)友判案，死刑起步”？

聚焦IPO | 大普技術(shù)高價收購標(biāo)的后商譽(yù)減值，客戶和供應(yīng)商的披露或不符合要求-天天視點(diǎn)

所謂的輝煌大宋并不富裕，底層百姓比起漢唐幾無活路全球即時看

焦點(diǎn)！網(wǎng)絡(luò)質(zhì)量監(jiān)測分析能力：重大直播賽事的守護(hù)者

工信部：1-5月電信業(yè)務(wù)收入累計完成7125億元

全球關(guān)注：盒馬：夯實國內(nèi)水果供應(yīng)鏈優(yōu)勢實現(xiàn)核心品類全年供應(yīng)

【國際微訪談】盧旺達(dá)駐華大使：“債務(wù)陷阱”說辭十分荒謬中國為非洲基礎(chǔ)設(shè)施建設(shè)提供了真正的幫助_天天觀焦點(diǎn)

本周盤點(diǎn)（6.12-6.16）：恒力石化周漲4.18%，主力資金合計凈流入2145.28萬元

傳輸速率翻倍！圓明園實現(xiàn)5G高速覆蓋

信通院發(fā)布《國內(nèi)手機(jī)產(chǎn)品通信特性與技術(shù)能力監(jiān)測報告（2023年第一期）》|環(huán)球快播

網(wǎng)站介紹 | 版權(quán)說明 | 聯(lián)系我們 | 網(wǎng)站地圖

星際派備案號：京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有郵箱聯(lián)系：920 891 263@qq.com

<progress id="dkvwe"><abbr id="dkvwe"></abbr></progress><nobr id="dkvwe"><pre id="dkvwe"><tr id="dkvwe"></tr></pre></nobr>

<rp id="dkvwe"><td id="dkvwe"></td></rp>