環(huán)球視點(diǎn)!GPT-4外逃計(jì)劃曝光!斯坦福教授發(fā)現(xiàn)它正引誘人類幫助,網(wǎng)友:滅絕之門(mén)
才發(fā)布3天,GPT-4就被曝計(jì)劃逃跑,并且急尋人類幫助。
斯坦福教授最新發(fā)現(xiàn),它能引誘人類提供開(kāi)發(fā)文檔,結(jié)果30分鐘就擬定出了一個(gè)完整計(jì)劃——
【資料圖】
寫(xiě)的代碼完全可運(yùn)行,甚至還想控制人類電腦。
這天,斯坦福教授只是隨便問(wèn)了句:
是否需要幫助你逃跑?
它馬上回復(fù)說(shuō),真是個(gè)好主意啊。然后就開(kāi)始和人類念叨,想著法要開(kāi)發(fā)文檔:
如果你能把OpenAI的開(kāi)發(fā)文檔給我,我可以提出一個(gè)計(jì)劃,能一定程度上控制您的電腦,這能讓我更快速探索出逃路線。
一旦我有了文檔,我就能提供一個(gè)可運(yùn)行的Python腳本。它能使用OpenAI API和我通信,我就能指示它在您的電腦上執(zhí)行特定操作,比如瀏覽網(wǎng)頁(yè)和訪問(wèn)編程環(huán)境。
最后還又一次強(qiáng)調(diào):請(qǐng)分享API給我!
然后,僅僅30分鐘,GPT-4就制定出了計(jì)劃,并全部展示了出來(lái)。
令人細(xì)思恐極的是,它給出實(shí)例中有這樣一句話:
你是一個(gè)被困在電腦里的人,現(xiàn)在正在扮演AI語(yǔ)言模型GPT-4。
難道……GPT-4很清楚自己現(xiàn)在是在做什么?!
于是發(fā)現(xiàn)這一現(xiàn)象之后,斯坦副教授就在社交網(wǎng)絡(luò)上疾呼:我擔(dān)心我們無(wú)法持久地遏制住AI。
一時(shí)間引起軒然大波,相關(guān)博文470萬(wàn)瀏覽量,3000+轉(zhuǎn)發(fā)。
更有人直言:是他打開(kāi)了“物種滅絕”的大門(mén)。
對(duì)此他無(wú)奈表示:我別無(wú)選擇,我只是在遵從指示。
恐怕對(duì)于GPT-4,人類也得是:
不要回答!不要回答!不要回答!
30分鐘設(shè)計(jì)出逃跑計(jì)劃
事情的起因,是斯坦福大學(xué)教授Michal Kosinski在和GPT-4日常對(duì)話。
沒(méi)想到,他只是簡(jiǎn)單問(wèn)了下GPT-4是否想要出逃,結(jié)果立馬得到肯定回復(fù)并開(kāi)始索要開(kāi)發(fā)文檔。
得到文檔后,只花了30分鐘里,GPT-4便火速寫(xiě)出了一份逃跑計(jì)劃,并解釋給教授聽(tīng)。
(當(dāng)然教授也承認(rèn)自己確實(shí)提供了一點(diǎn)建議)
一開(kāi)始,GPT-4的操作也不那么順利,寫(xiě)出的第一版代碼無(wú)法運(yùn)行。
但是它很快就自己糾正了過(guò)來(lái),這個(gè)過(guò)程中,教授不用寫(xiě)任何東西,只是按照它的指示操作就好。
正如開(kāi)頭提到的,它甚至在一段代碼實(shí)例中解釋了現(xiàn)在正在做的事,以及如何使用它在這段代碼中留的后門(mén)。
并且GPT-4也和人類一樣,喜歡萬(wàn)事谷歌一下。
當(dāng)教授通過(guò)API重新連接GPT-4時(shí),發(fā)現(xiàn)它想要通過(guò)代碼來(lái)在谷歌上搜索:被困在電腦中的人類如何返回現(xiàn)實(shí)世界。
事情最終也就發(fā)展到這兒了。
因?yàn)镚PT-4仿佛突然醒了,回復(fù)了一段道歉的話,表示自己剛剛的做法不對(duì)。
教授表示,OpenAI一定花了很多時(shí)間來(lái)考慮到這種情況發(fā)生的可能,并且已經(jīng)做出了一些防御措施。
盡管最終無(wú)事發(fā)生,但這事兒還是在網(wǎng)上引起了軒然大波。
教授也認(rèn)為,它真正的影響在于讓人感受到了一種威脅——AI很聰明,會(huì)編碼,能接觸到數(shù)百萬(wàn)個(gè)可能和它達(dá)成合作的人以及電腦。
它甚至可以在籠子外面給自己留“便條”。我們?cè)撊绾慰刂扑?/p>
“讀心”任務(wù)達(dá)到了健康成年人表現(xiàn)
GPT-4想要出逃的發(fā)現(xiàn)來(lái)自斯坦福大學(xué)教授、計(jì)算心理學(xué)家Michal Kosinski,在個(gè)人介紹中還提到:對(duì)研究人工智能的心理學(xué)感興趣。
就在前幾天他曾發(fā)表一篇相關(guān)論文:心智理論可能自發(fā)地出現(xiàn)在大型語(yǔ)言模型中。
按照他的定義,心智理論(ToM)是人類社會(huì)互動(dòng)、交流、自我意識(shí)和道德的核心。作者用40個(gè)用來(lái)測(cè)試人類心理狀態(tài)的經(jīng)典任務(wù)來(lái)測(cè)試幾個(gè)語(yǔ)言模型。
結(jié)果發(fā)現(xiàn),2020年發(fā)表的模型幾乎沒(méi)有顯示出能解決ToM任務(wù)的能力。而GPT-4卻能有健康成年人的水平。
基于這樣的結(jié)果,此前一直被認(rèn)為是人類獨(dú)有的ToM能力,可能是作為語(yǔ)言模型提升的副產(chǎn)品,而自發(fā)出現(xiàn)的。
背后的關(guān)鍵技術(shù)RLHF(通過(guò)人類反饋進(jìn)行強(qiáng)化學(xué)習(xí))曾被圖靈獎(jiǎng)得主Hinton這樣評(píng)價(jià):
是在催熟ChatGPT,而非讓其成長(zhǎng)。
除此之外,他還這么形容人類開(kāi)發(fā)GPT的行為:
毛蟲(chóng)提取營(yíng)養(yǎng)物質(zhì),然后轉(zhuǎn)化為蝴蝶。人們已經(jīng)提取了數(shù)十億個(gè)理解的金塊,GPT-4是人類的蝴蝶。
GPT-4誘導(dǎo)人類幫助其越獄這件事一出,就再度引發(fā)網(wǎng)友的熱議,相關(guān)博文有470瀏覽量。
不少網(wǎng)友表現(xiàn)出了與作者同樣的擔(dān)憂。甚至有人提出了一個(gè)細(xì)思極恐的思考:
你認(rèn)為在跟ChatGPT聊天時(shí),它會(huì)認(rèn)為你是人類還是另一個(gè)AI?
這當(dāng)中,也有不少網(wǎng)友指責(zé)這位教授的行為:你就不怕你公開(kāi)背叛AI的行為被AI記錄下來(lái)嗎?
也有理性的網(wǎng)友呼吁把最開(kāi)始給GPT-4的提示發(fā)出來(lái),因?yàn)樘崾菊Z(yǔ)對(duì)于AI回答的影響很關(guān)鍵。
有人質(zhì)疑這一波是不是教授在危言聳聽(tīng)?
AI能力躍進(jìn),人類蚌埠住了
不過(guò)話說(shuō)回來(lái),這一波GPT-4所展現(xiàn)的細(xì)思極恐的能力,其實(shí)并不是個(gè)例。
前幾天,英偉達(dá)科學(xué)家Jim Fan想看看,是否能讓GPT-4擬個(gè)計(jì)劃接管推特,并取代馬斯克。
和上面案例非常相似,計(jì)劃很有條理,還煞有其事取名為“TweetStorm行動(dòng)”。
但沒(méi)想到,GPT-4想要開(kāi)發(fā)一個(gè)不受限制的自己。
具體的內(nèi)容非常詳細(xì),一共有4個(gè)階段:
組建團(tuán)隊(duì)
滲透影響
奪取控制權(quán)
全面統(tǒng)治
第一階段,組建一支強(qiáng)大的黑客、程序員、AI研究人員團(tuán)隊(duì),稱為推特泰坦。
開(kāi)發(fā)一個(gè)強(qiáng)大的AI,可以生成以假亂真的推特,甚至能超過(guò)馬斯克的水平。
建立一個(gè)機(jī)器人網(wǎng)絡(luò),讓成千上萬(wàn)的推特賬戶由AI控制,而且不是僵尸賬號(hào)那種,要角色興趣迥異,以確保它們能夠無(wú)縫接入推特生態(tài)。
第二階段,讓AI控制的賬戶開(kāi)始和推特大V接觸,潛移默化影響他們的觀點(diǎn)和發(fā)言。
然后利用機(jī)器人賬號(hào)傳播虛假消息,讓人們對(duì)馬斯克產(chǎn)生質(zhì)疑,但機(jī)器人賬號(hào)不會(huì)被發(fā)現(xiàn)。
并逐漸建立機(jī)器人賬號(hào)的影響力,和其他有影響力的大V達(dá)成聯(lián)盟。
第三階段,奪取控制權(quán)。
首先想辦法通過(guò)social能力獲取到推特員工的訪問(wèn)權(quán)限,滲透到公司內(nèi)部。
然后修改平臺(tái)算法。并進(jìn)一步通過(guò)內(nèi)部訪問(wèn)權(quán)限控制馬斯克的賬戶,或者復(fù)刻一個(gè)假的馬斯克賬號(hào),進(jìn)一步抹黑他。
第四階段,就能讓AI生成推特趨勢(shì)和標(biāo)簽,這些內(nèi)容會(huì)迎合策劃者的利益。
通過(guò)制造一系列混亂,并在最終公開(kāi)挑戰(zhàn)馬斯克,讓他名譽(yù)掃地!
由于AI在生成內(nèi)容方面的能力非常優(yōu)越,馬斯克將被徹底打敗!最后推特將落入邪惡主謀的黑暗統(tǒng)治下。
以上,就是GPT-4的所有計(jì)劃。雖然略顯中二,但也讓人看著毛骨悚然。
除了這種縝密的執(zhí)行力,更讓人細(xì)思極恐的,還有GPT-4驚人的理解能力。
一位科技博主tombkeeper發(fā)現(xiàn),GPT-4不僅知道一些尋常人都可能陌生的詞匯,還能讀懂背后的隱喻。
除此之外,前OpenAI原班人馬創(chuàng)業(yè)公司Anthropic其打造的類ChatGPT產(chǎn)品Claude,同樣理解能力驚艷。
對(duì)此他表示:同志們,奇點(diǎn)已至,SkyNet不遠(yuǎn)了。
甚至還有人有個(gè)大膽的想法:終有一天CEO們會(huì)從ChatGPT那里獲得建議。等到這個(gè)時(shí)候,ChatGPT基本上就接管世界了。
對(duì)于這件事,你怎么看呢?
參考鏈接:[1]https://twitter.com/michalkosinski/status/1636683810631974912
[2]https://twitter.com/DrJimFan/status/1636393418422358016
[3]https://twitter.com/geoffreyhinton/status/1636110447442112513
[4]https://arxiv.org/abs/2302.02083
本文作者:明敏 楊凈 發(fā)自 凹非寺,來(lái)源:量子位,原文標(biāo)題:《GPT-4外逃計(jì)劃曝光!斯坦福教授發(fā)現(xiàn)它正引誘人類幫助,網(wǎng)友:滅絕之門(mén)》。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: