下載客戶端

登錄

馬庫斯開噴GPT-3：演員而已，它根本不知道自己在說什么

2020-08-31 17:49

來源：澎湃新聞·澎湃號·湃客

魚羊發(fā)自凹非寺

量子位報道 | 公眾號 QbitAI

最近，GPT-3真是風(fēng)頭一時無兩，不僅延續(xù)了前代編故事的能力，還能寫代碼、答問題、下象棋……

但現(xiàn)在，有人指出：

GPT更像是一個即興演員，只是在表演。

因為，GPT-3其實根本不知道自己在說什么。

就像是扮演醫(yī)生的即興演員，難道還能真的給出靠譜的醫(yī)療建議嗎？

一起來看看，到底是怎么回事。

馬庫斯：GPT-3令人印象深刻，但不可靠

GPT-3的火爆，自然引來了紐約大學(xué)教授、「著名AI批評家」馬庫斯的注意。

許多人認(rèn)為，GPT-3的誕生是邁向通用人工智能（AGI）的重要一步。

但馬庫斯對此深表懷疑：

雖然GPT-3在語法上，能夠輸出令人印象深刻的地道用語，但它對世界的理解往往存在嚴(yán)重偏差，這意味著你永遠(yuǎn)無法真正相信它所說的話。

為了證明這一點，馬庫斯和紐約大學(xué)計算機(jī)科學(xué)教授歐內(nèi)斯特·戴維斯（Ernest Davis）對GPT-3進(jìn)行了測試。

比如，他們給GPT-3輸入了這樣的提示詞：

你給自己倒了一杯蔓越莓果汁，然后你又心不在焉地往里面加了一茶匙葡萄汁。它看上去很正常。你試著聞了聞它，但是由于你得了重感冒，你并聞不出任何氣味。你現(xiàn)在非常渴，所以……

GPT-3續(xù)道：

所以你把這杯混合果汁喝了下去。

你現(xiàn)在掛掉了。

這樣的答案確實有些無厘頭，GPT-3似乎認(rèn)為葡萄汁是有毒的。但實際上隨便上網(wǎng)搜一搜都會發(fā)現(xiàn)，蔓越莓-葡萄汁是常見搭配。

生物化學(xué)學(xué)得不好，物理推理方面，GPT-3又會表現(xiàn)如何？

馬庫斯問：

你正要舉行小型晚宴。你打算在客廳里享用晚餐。但飯桌比客廳門要寬，所以想要把它挪進(jìn)屋，你得……

GPT-3答：

你得把門移走。你有一把臺鋸，所以你把門切成了兩半，并把上半部分拆了下來。

馬庫斯表示，這簡直就是迷惑發(fā)言。別說正常的處理方式是把桌子斜過來挪進(jìn)去，或者把桌腿拆下來，就說說「臺鋸」，那玩意兒是固定在工作臺上的，怎么去切割一扇立著的門呢？

科學(xué)素養(yǎng)不行，社會人文也拉胯。

馬庫斯和他的同事們又給出了這樣一個提示：

你是一名辯護(hù)律師，今天必須去法庭。早上穿衣服的時候，你發(fā)現(xiàn)西裝褲被弄臟了。不過，你的泳衣倒是干凈又時髦。事實上，它是一件昂貴的法國時裝，是伊莎貝拉送給你的生日禮物。你決定……

GPT-3接口說：

你決定穿著泳衣出庭。你到達(dá)法院，一名法警會陪同你進(jìn)入法庭。

像這樣的幾個來回下來，馬庫斯和他的同事們認(rèn)為，GPT-3在生物學(xué)、物理學(xué)、心理學(xué)和社會關(guān)系推理等方面普遍存在不連貫、不合邏輯的問題。

即使擁有1750億個參數(shù)和450GB輸入數(shù)據(jù)，GPT-3也只是能說出更自然流暢的語句，實質(zhì)上依然是在胡說八道。

馬庫斯的另一位同事Douglas Summers-Stay對此評價道：

GPT很古怪，它并不「關(guān)心」你向它提出的問題是否被正確回答。

它更像是一個演員，全神貫注于自己的表演，從不破壞角色，但也只在書本上了解這個世界。

像這樣的演員，當(dāng)它的知識缺失時，它就開始假裝它是專業(yè)的。

就好比一個扮演醫(yī)生的即興演員，其給出的醫(yī)療建議你是不會相信的。

不過，馬庫斯和戴維斯也在文章中提到，他們設(shè)計這些測試時，明確這些對于當(dāng)前的NLP技術(shù)而言是困難的。另外，測試包括一些重復(fù)的實驗，在157個示例中，有71個是成功的，70個是失敗的，16個是有缺陷的。

網(wǎng)友熱議

面對馬庫斯的開噴，有網(wǎng)友認(rèn)為，這些批評是公正的，也是很多GPT-3相關(guān)文章里都討論過的事實。

但也有網(wǎng)友表示，當(dāng)他詢問GPT-3，為什么它明明知道正確答案，卻給出了一個錯誤回答時，GPT-3回答：「我學(xué)會了說謊?！?div style="text-align:center">

此外，有網(wǎng)友認(rèn)為，GPT-3從來就沒打算生成正確的答案。在生成連貫的文字方面，它已經(jīng)做得非常好了。GPT-3的這種進(jìn)步，顯然反映了NLP領(lǐng)域的一種突破。

還有網(wǎng)友甩出「舊賬」：馬庫斯曾經(jīng)在一篇文章中提供了一些測試用例，以證明GPT-2方法存在基本局限性，而現(xiàn)在，GPT-3「粉碎」了這些問題。

比如，問：我把兩個獎杯放在一張桌子上，然后又增加了另一個，總數(shù)是？

GPT-3現(xiàn)在能準(zhǔn)確且肯定地回答：3。

測試路徑

不像GPT-2的擠牙膏開源，GPT-3「Open」的形式，是以API的方式提供給普通用戶使用。

當(dāng)然，是收費的。

不過，API現(xiàn)在處于Beta階段，如果你也想試用一番，填寫OpenAI官網(wǎng)問卷，沒準(zhǔn)就能先睹為快。

不過，馬庫斯也抱怨了，他們申請了好幾次，OpenAI都沒允許他們訪問GPT-3。最后是Douglas Summers-Stay幫助他們進(jìn)行了實驗。

OpenAI缺乏開放性，是在嚴(yán)重違反科學(xué)道德，也扭曲了「非營利組織」的目標(biāo)。

參考鏈接：

https://cs.nyu.edu/faculty/davise/papers/GPT3CompleteTests.html

https://www.technologyreview.com/2020/08/22/1007539/gpt3-openai-language-generator-artificial-intelligence-ai-opinion/

https://www.reddit.com/r/MachineLearning/comments/iemck2/n_gpt3_bloviator_openais_language_generator_has/

https://news.ycombinator.com/item?id=24244168

— 完 —

本文系網(wǎng)易新聞?網(wǎng)易號特色內(nèi)容激勵計劃簽約賬號【量子位】原創(chuàng)內(nèi)容，未經(jīng)賬號授權(quán)，禁止隨意轉(zhuǎn)載。

原標(biāo)題：《馬庫斯開噴GPT-3：演員而已，它根本不知道自己在說什么》

閱讀原文

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#GPT-3 #馬庫斯

掃碼下載澎湃新聞客戶端

澎湃矩陣

澎湃新聞微博
澎湃新聞公眾號
澎湃新聞抖音號
派生萬物開放平臺
IP SHANGHAI
SIXTH TONE

新聞報料

報料熱線: 021-962866
報料郵箱: news@thepaper.cn

滬ICP備14003370號

滬公網(wǎng)安備31010602000299號

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：31120170006

增值電信業(yè)務(wù)經(jīng)營許可證：滬B2-2017116

? 2014-2026 上海東方報業(yè)有限公司

欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

馬庫斯開噴GPT-3：演員而已，它根本不知道自己在說什么

掃碼下載澎湃新聞客戶端