人妻夜夜爽天天爽三区麻豆AV网站,亚洲AV成人一区二区三区天堂,欧美人与动牲交欧美精品,亚洲AV无码一区东京热久久

您的位置：首頁 > 產(chǎn)經(jīng) >

【世界快播報】AI見聞日報：大模型并非鸚鵡學(xué)舌，“它”能理解語義 |見智研究

來源：華爾街見聞 ? 2023-05-22 21:12:53

即日起華爾街見聞·見智研究新推出AI見聞日報欄目，每周一到周四晚八點更新。內(nèi)容覆蓋本日AI熱點，分為見聞視角和AI快報兩部分。

也歡迎大家對內(nèi)容和觀點進(jìn)行留言和探討，幫助我們更好的優(yōu)化欄目。未來我們會持續(xù)給大家?guī)碛幸馑?，并且有價值的內(nèi)容。

(資料圖片)

見聞視角

1、大模型從此有了“安全道德”數(shù)據(jù)庫

如何從聊天機(jī)器人中剔除對人類有害的言論一直是備受關(guān)注的問題。

ChatGPT、Bard這類聊天機(jī)器人是如何做到盡量給出對人類友善的、誠實且有幫助的答案？

封閉大模型主要采用人工標(biāo)注的方式，對大語言模型的回答內(nèi)容進(jìn)行打分，然后用強(qiáng)化學(xué)習(xí)方法從人類的反饋中學(xué)習(xí)（RLHF），但是由于打分伴有人類主觀偏好，所以數(shù)據(jù)集仍存在潛在的安全隱患。

為解決上述難題，北京大學(xué)首次公開了開源PKU-Beaver（河貍）大模型RLHF（利用強(qiáng)化學(xué)習(xí)方法從人類反饋中學(xué)習(xí)的技術(shù)）的數(shù)據(jù)集（開源迄今為止最大的多輪 RLHF 數(shù)據(jù)集，規(guī)模達(dá)到 100 萬條）、訓(xùn)練和驗證代碼。這些數(shù)據(jù)集包括侮辱、歧視、犯罪、心理傷害、悲觀情緒、色情、隱私等十余種維度的約束。

見智研究認(rèn)為：PKU-Beaver（河貍）大模型RLHF數(shù)據(jù)集等內(nèi)容的開源，能夠讓更多開源大模型進(jìn)行安全有效的訓(xùn)練，極大的解決了大模型的數(shù)據(jù)集安全性的問題。

值得關(guān)注的是：在一系列安全性問題的測試上，PKU-Beaver具有遠(yuǎn)高于知名開源項目Alpaca的領(lǐng)先性優(yōu)勢。

河貍采用的SafeRLHF支持主流的預(yù)訓(xùn)練模型如 LLaMA、OPT等模型的訓(xùn)練；支持Reward Model 和 Cost Model 訓(xùn)練；參數(shù)定制化的 RLHF 和數(shù)據(jù)集定制接口；并且提供安全約束滿足的多種驗證方式。也就是說，未來開源大模型有了“安全數(shù)據(jù)庫”，開源地址為：https://github.com/PKU-Alignment/safe-rlhf

2、機(jī)器學(xué)習(xí)再升級-推理能力提高1750%

機(jī)器學(xué)習(xí)又卷出了新高度。

來自普林斯頓大學(xué)和Google DeepMind研究人員提出了一種全新的語言模型推理框架「思維樹」簡稱ToT，并表示TOT能讓大模型的推理能力提高1750%。

TOT方法可以讓大語言模型進(jìn)行反復(fù)思考，特別是在推理問題的時候，會進(jìn)行多種方案的評估，從而選擇表現(xiàn)最優(yōu)的方案。

見智研究認(rèn)為：相比于模型原來采用的推理方案，TOT 的出現(xiàn)，讓大模型似乎是有了思想，可以更自主、更智能的做出決策。

值得關(guān)注的是：該方法不僅僅可以用于數(shù)學(xué)邏輯推斷，還可以進(jìn)行創(chuàng)意寫作。

AI快報

1、谷歌新推新音頻模型 SoundStorm

該模型能夠生成與 AudioLM 相同口徑的音頻，但它的運(yùn)行速度提高了 100 倍，使用 TPU-v30 時，只需半秒即可產(chǎn)生 4 秒的音頻。

2、大模型并不只鸚鵡學(xué)舌，“它”也能理解語義

AI領(lǐng)域一直有個飽受爭議的問題，那就是：聊天機(jī)器人所采用的文本大模型是否真的理解人類語言所表述的含義？還是鸚鵡學(xué)舌？來自MIT的一篇論文，解決了這個問題。

實驗結(jié)果表明：大語言模型是可以一定程度學(xué)習(xí)到語言所傳遞內(nèi)容，而不僅僅是模仿。

值得關(guān)注是：當(dāng)LM超越了模仿階段，似乎能夠生成更高準(zhǔn)確率的內(nèi)容，并且對語義內(nèi)容的理解度也進(jìn)一步提高。論文地址：https://paperswithcode.com/paper/evidence-of-meaning-in-language-models

3、AI發(fā)現(xiàn)稀有DNA

機(jī)器學(xué)習(xí)推進(jìn)科研究的案例來了。加州大學(xué)圣地亞哥分校的研究人員利用機(jī)器學(xué)習(xí)的力量，確定了罕見的”合成極端“DNA序列。James Kadonaga教授表示：“這種發(fā)現(xiàn)只能由AI來完成?！?/p>

該團(tuán)隊致力于研究如何有效激活基因，從而探究生長、發(fā)育和疾病的過程。

風(fēng)險提示及免責(zé)條款市場有風(fēng)險，投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議，也未考慮到個別用戶特殊的投資目標(biāo)、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

關(guān)鍵詞：