人妻夜夜爽天天爽三区麻豆AV网站,亚洲AV成人一区二区三区天堂,欧美人与动牲交欧美精品,亚洲AV无码一区东京热久久

【世界快播報】AI見聞日報:大模型并非鸚鵡學(xué)舌,“它”能理解語義 |見智研究

即日起華爾街見聞·見智研究新推出AI見聞日報欄目,每周一到周四晚八點更新。內(nèi)容覆蓋本日AI熱點,分為見聞視角AI快報兩部分。

也歡迎大家對內(nèi)容和觀點進(jìn)行留言和探討,幫助我們更好的優(yōu)化欄目。未來我們會持續(xù)給大家?guī)碛幸馑?,并且有價值的內(nèi)容。


(資料圖片)

見聞視角

1、大模型從此有了“安全道德”數(shù)據(jù)庫

如何從聊天機(jī)器人中剔除對人類有害的言論一直是備受關(guān)注的問題。

ChatGPT、Bard這類聊天機(jī)器人是如何做到盡量給出對人類友善的、誠實且有幫助的答案?

封閉大模型主要采用人工標(biāo)注的方式,對大語言模型的回答內(nèi)容進(jìn)行打分,然后用強(qiáng)化學(xué)習(xí)方法從人類的反饋中學(xué)習(xí)(RLHF),但是由于打分伴有人類主觀偏好,所以數(shù)據(jù)集仍存在潛在的安全隱患。

為解決上述難題,北京大學(xué)首次公開了開源PKU-Beaver(河貍)大模型RLHF(利用強(qiáng)化學(xué)習(xí)方法從人類反饋中學(xué)習(xí)的技術(shù))的數(shù)據(jù)集(開源迄今為止最大的多輪 RLHF 數(shù)據(jù)集,規(guī)模達(dá)到 100 萬條)、訓(xùn)練和驗證代碼。這些數(shù)據(jù)集包括侮辱、歧視、犯罪、心理傷害、悲觀情緒、色情、隱私等十余種維度的約束。

見智研究認(rèn)為:PKU-Beaver(河貍)大模型RLHF數(shù)據(jù)集等內(nèi)容的開源,能夠讓更多開源大模型進(jìn)行安全有效的訓(xùn)練,極大的解決了大模型的數(shù)據(jù)集安全性的問題。

值得關(guān)注的是:在一系列安全性問題的測試上,PKU-Beaver具有遠(yuǎn)高于知名開源項目Alpaca的領(lǐng)先性優(yōu)勢。

河貍采用的SafeRLHF支持主流的預(yù)訓(xùn)練模型如 LLaMA、OPT等模型的訓(xùn)練;支持Reward Model 和 Cost Model 訓(xùn)練;參數(shù)定制化的 RLHF 和數(shù)據(jù)集定制接口;并且提供安全約束滿足的多種驗證方式。也就是說,未來開源大模型有了“安全數(shù)據(jù)庫”,開源地址為:https://github.com/PKU-Alignment/safe-rlhf

2、機(jī)器學(xué)習(xí)再升級-推理能力提高1750%

機(jī)器學(xué)習(xí)又卷出了新高度。

來自普林斯頓大學(xué)和Google DeepMind研究人員提出了一種全新的語言模型推理框架「思維樹」簡稱ToT,并表示TOT能讓大模型的推理能力提高1750%。

TOT方法可以讓大語言模型進(jìn)行反復(fù)思考,特別是在推理問題的時候,會進(jìn)行多種方案的評估,從而選擇表現(xiàn)最優(yōu)的方案。

見智研究認(rèn)為:相比于模型原來采用的推理方案,TOT 的出現(xiàn),讓大模型似乎是有了思想,可以更自主、更智能的做出決策。

值得關(guān)注的是:該方法不僅僅可以用于數(shù)學(xué)邏輯推斷,還可以進(jìn)行創(chuàng)意寫作。

AI快報

1、谷歌新推新音頻模型 SoundStorm

該模型能夠生成與 AudioLM 相同口徑的音頻,但它的運(yùn)行速度提高了 100 倍,使用 TPU-v30 時,只需半秒即可產(chǎn)生 4 秒的音頻。

2、大模型并不只鸚鵡學(xué)舌,“它”也能理解語義

AI領(lǐng)域一直有個飽受爭議的問題,那就是:聊天機(jī)器人所采用的文本大模型是否真的理解人類語言所表述的含義?還是鸚鵡學(xué)舌?來自MIT的一篇論文,解決了這個問題。

實驗結(jié)果表明:大語言模型是可以一定程度學(xué)習(xí)到語言所傳遞內(nèi)容,而不僅僅是模仿。

值得關(guān)注是:當(dāng)LM超越了模仿階段,似乎能夠生成更高準(zhǔn)確率的內(nèi)容,并且對語義內(nèi)容的理解度也進(jìn)一步提高。論文地址:https://paperswithcode.com/paper/evidence-of-meaning-in-language-models

3、AI發(fā)現(xiàn)稀有DNA

機(jī)器學(xué)習(xí)推進(jìn)科研究的案例來了。加州大學(xué)圣地亞哥分校的研究人員利用機(jī)器學(xué)習(xí)的力量,確定了罕見的”合成極端“DNA序列。James Kadonaga教授表示:“這種發(fā)現(xiàn)只能由AI來完成?!?/p>


該團(tuán)隊致力于研究如何有效激活基因,從而探究生長、發(fā)育和疾病的過程。

風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。

關(guān)鍵詞: