人妻夜夜爽天天爽三区麻豆AV网站,亚洲AV成人一区二区三区天堂,欧美人与动牲交欧美精品,亚洲AV无码一区东京热久久

您的位置：首頁 > 產經(jīng) >

【世界播資訊】22人估值10億！對話Character.ai CEO：與其直接研究醫(yī)學，不如研究人工智能

來源：華爾街見聞 ? 2023-07-03 16:18:02

(資料圖)

華爾街見聞按：

Character.ai是當下AI熱潮里最炙手可熱的創(chuàng)企明星之一。公司主打產品為可定制的AI聊天機器人，面向C端消費者娛樂需求，具備情感陪伴與設定虛構人物的能力。Charater.AI允許用戶自行創(chuàng)建具有特定個性、人設和知識儲備的聊天機器人，例如世界名人、歷史人物、文學影視虛構人物乃至動物，為用戶提供新奇、強帶入感的聊天體驗。

今年年初，Charater.ai完成1.5億美元A輪融資，估值突破10億美元，晉升獨角獸，團隊僅有22人。

4月份，Character.ai首席執(zhí)行官Noam Shazeer、前谷歌大腦團隊成員，接受了播客No Priors的采訪。

核心觀點：
1. 早在2021年，谷歌就已經(jīng)有能力在OpenAI之前搶先推出AI聊天機器人，但卻由于安全方面的顧慮而放棄，大公司畏首畏尾也成了他離開谷歌、選擇創(chuàng)業(yè)的原因。
2. Character最大的優(yōu)勢在于其用戶導向的產品策略。完全可定制的AI聊天機器人成了許多人派遣孤獨的方式，一些用戶甚至表示，Character是他們的新任心理咨詢師。Noam認為，AI在情感支持方面有著巨大的潛力。情感支持工作不需要很高的智力，例如，寵物狗能很好地完成情感支持工作，雖然狗并不聰明，也不會說話，同理，一個參數(shù)有限的AI也能完成這項任務。
3.?數(shù)據(jù)要求往往會隨著算力而指數(shù)級上升，但數(shù)據(jù)并不稀缺，互聯(lián)網(wǎng)能提供幾乎無限的數(shù)據(jù)，Character也在考慮用AI生成更多的數(shù)據(jù)。
4.?Character.ai目前還處在燒錢換規(guī)模階段，商業(yè)模式仍在探索中，未來團隊規(guī)模擴大后考慮開拓TOB業(yè)務。
5.?Noam認為，AGI是很多AI創(chuàng)企的目標。但他創(chuàng)業(yè)的真正原因是想推動技術發(fā)展，用技術攻克難題，如醫(yī)學上的疑難雜癥。他指出，AI能加速許多研究的進程，與其直接研究醫(yī)學，不如研究AI。

以下為播客音頻逐字稿，ELAD與SARAH為節(jié)目主持人，為便于理解，部分段落有刪改。

早年谷歌工作經(jīng)歷，與transformer的誕生

ELAD：

你在NLP和AI方面工作了很長時間。你在谷歌斷斷續(xù)續(xù)工作了17年，在谷歌的面試問題圍繞著拼寫檢查解決方案。當我加入谷歌時，當時用于廣告定位的主要系統(tǒng)之一菲爾集群，我想這是你和喬治·赫瑞克寫的。我想了解一下你在人工智能NLP語言模型方面的工作歷史，這一切是如何演變的，你是如何開始的，是什么激發(fā)了你的興趣？

NOAM：

謝謝ELAD。是的，只是，總是自然而然地被吸引到AI上。希望它能讓電腦做一些聰明的事情。似乎是周圍最有趣的游戲。我很幸運地在早期發(fā)現(xiàn)了谷歌，參與了很多那里的早期項目，也許你現(xiàn)在不會稱之為人工智能。從2012年開始，我加入了谷歌大腦團隊。和一群非常聰明的人，做一些有趣的事情。我以前從未做過深度學習或神經(jīng)網(wǎng)絡。

ELAD：

你是在2017年transformer論文的參與者之一，然后你參與了Mesh-TensorFlow的工作。你能談一下所有這些是如何進行的嗎？

NOAM：

深度學習之所以成功，是因為它真的很適合現(xiàn)代硬件，你有這一代的芯片，在矩陣乘法和其他形式的東西，需要大量的計算相對于通信。因此，基本上深度學習真的起飛了，它的運行速度比其他任何東西都快成千上萬倍。一旦我掌握了這方面的知識，就開始設計那些真正聰明且運行速度快的東西。目前最令人興奮的問題是語言建模。因為有無限量的數(shù)據(jù)，只要刮開網(wǎng)絡，你就能得到所有你想要的訓練數(shù)據(jù)。

問題的定義非常簡單，就是預測下一個詞，胖貓咪坐在上面，下一個是什么。它非常容易定義，如果你能把它做得很好，那么你就能得到你現(xiàn)在看到的一切，而且你可以直接和這個東西對話，它真的是人工智能了。因此，大約在2015年左右，我開始研究語言建模，并與循環(huán)神經(jīng)網(wǎng)絡打交道，這就是當時的偉大之處。然后transformer就出現(xiàn)了。

我無意中聽到隔壁同事聊天，他們想用更好的東西來取代循環(huán)神經(jīng)網(wǎng)絡。我當時想，這聽起來不錯，我想幫忙，循環(huán)神經(jīng)網(wǎng)絡很煩人，這將會更有趣。

ELAD：

你能快速描述一下循環(huán)神經(jīng)網(wǎng)絡和基于transformer或基于注意力的模型之間的區(qū)別嗎？

NOAM：

循環(huán)神經(jīng)網(wǎng)絡是連續(xù)的計算，每一個詞你都會讀到下一個詞，你會根據(jù)你大腦的舊狀態(tài)和下一個詞的內容來計算你當前的大腦狀態(tài)。然后你，你預測下一個詞。因此，你有這個非常長的計算序列，必須按順序執(zhí)行，所以，transformer的神奇之處在于，你可以一次處理整個序列。

對后面的詞的預測取決于前面的詞是什么，但它發(fā)生在一個恒定的步驟中，你可以利用這種并行性，你可以一次看完整個事情，就像現(xiàn)代硬件所擅長的并行性。

現(xiàn)在你可以利用序列的長度，你的并行性，一切都工作得非常好。注意力本身。這有點像你在創(chuàng)建這個大的內存鍵值關聯(lián)，你就像在建立這個大的表格，在序列中的每個詞都有一個條目。然后你就在這個表中尋找東西。這一切都像模糊的、微分的和一個大的、法國的函數(shù)，你可以通過它來進行反推。人們一直在使用這個方法來解決有兩個序列的問題，在那里你有機器翻譯，你就像把英語翻譯成法語，所以當你產生法語序列時，你就像在看英語序列并試圖注意該序列中的正確位置。但這里的洞察力是，你可以用同樣的注意力來回顧你試圖制作的這個序列的過去。美中不足的是，它在GPU和GPU上運行得很好，這與深度學習的發(fā)展是并行的，因為它在現(xiàn)有的硬件上很好。而這也給序列帶來了同樣的東西。

SARAH：

是的，我認為幫助人們想象它的經(jīng)典例子是，用法語和英語說同一個句子，單詞的排序是不同的，你不是在那個序列中一對一的映射，并且要弄清楚如何在沒有信息損失的情況下用并行計算做這個。所以這就像一個非常優(yōu)雅的事情。

ELAD：

似乎該技術也被應用于各種不同的領域。明顯的是這些多模態(tài)的語言模型。所以它是像聊天GPT或你正在做的一個角色。我也對一些應用感到驚訝，比如阿爾法折疊，谷歌所做的蛋白質折疊工作，它實際上是以一種巨大的性能方式工作的。是否有任何應用領域，你發(fā)現(xiàn)相對于transformer的工作方式和相對于它們能做的事情來說，真的是意想不到的？

NOAM：

我只是在語言上低下了頭，就像這里你有一個問題，可以做任何事情。我希望這個東西足夠好。所以我就問它，你怎么治好癌癥？然后它就像發(fā)明了一個解決方案。所以，我一直完全忽略了大家在所有這些其他模式下所做的事情，我認為很多深度學習的早期成功都是在圖像方面，人們對圖像都很興奮，但卻完全忽略了它。因為，一張圖片勝過千言萬語，但它有一百萬個像素，所以文字的密度是它的一千倍。所以，我是一個大的文字粉絲。但是，看到它在所有這些其他方式中起飛，非常令人興奮。這些東西是偉大的。它對建立人們想要使用的產品超級有用，但我認為很多核心的智能將來自這些文本模型。

大模型的局限性：算力不是問題，數(shù)據(jù)也不是

ELAD：

你認為這些模型的局限性在哪里？人們經(jīng)常談論的只是規(guī)模，就像你只是扔了更多的算力，這個東西將進一步擴展。有數(shù)據(jù)和不同類型的數(shù)據(jù)，可能有也可能沒有。還有算法上的調整，還有添加新的東西，如內存或回環(huán)或類似的東西。你認為什么是人們仍然需要建立的大事情，你認為作為一個架構，它在哪里被挖掘出來？

NOAM：

是的，我不知道它是否會被淘汰。我的意思是，我們還沒有看到它退出來。與進入它的工作量相比，可能不算什么。因此，很可能會有各種像兩個低效率的因素，人們會通過更好的訓練算法、更好的模型架構、更好的構建芯片和使用量化的方法以及像所有這些來獲得。然后會有10個、100個和1000個的因素，就像擴展和金錢一樣，人們會扔到這個東西上，因為嘿，每個人都剛剛意識到這個東西是非常有價值的。同時，我認為沒有人看到這東西有多好的一面墻。所以我認為它只是，它只是會繼續(xù)變得更好。我沒有，我不知道是什么阻止了它。

SARAH：

你怎么看這種想法，我們可以增加算力，但最大的模型訓練數(shù)據(jù)不夠。我們已經(jīng)使用了互聯(lián)網(wǎng)上所有容易獲得的文本數(shù)據(jù)。我們必須去提高質量，我們必須去做人類反饋。你是怎么想的。

NOAM：

100億人，每個人產出一千或者一萬個單詞，就是天量級的數(shù)據(jù)。大家都會做很多與人工智能系統(tǒng)的對話。所以我，我有一種感覺，很多數(shù)據(jù)將進入一些人工智能系統(tǒng)，我的意思是以保護隱私的方式，我希望可以去的這些數(shù)據(jù)。然后，數(shù)據(jù)要求往往會隨著算力而指數(shù)級上升，因為你要訓練一個更大的模型，然后你要向它扔更多的數(shù)據(jù)。我并不擔心缺少數(shù)據(jù)，我們也許可以用AI生成更多的數(shù)據(jù)。

ELAD：

然后你認為這些模型今后要解決的主要問題是什么？是幻覺，是記憶，還是別的什么？

NOAM：

我不知道。我有點喜歡幻覺。

SARAH：

這也是一個特點。

NOAM：

我們最想做的是記憶，因為我們的用戶肯定希望他們的虛擬朋友能記住他們。你可以在個性化方面做很多事情，你想傾倒大量的數(shù)據(jù)并有效地使用它。在試圖弄清什么是真實的，什么是幻覺方面，有大量的工作正在進行。當然，我認為我們會解決這個問題。

Character.ai的創(chuàng)業(yè)故事

ELAD：

談一談 LaMDA和你在其中的角色，你是怎么想到創(chuàng)辦Character的？

NOAM：

我的聯(lián)合創(chuàng)始人丹尼爾·弗雷塔斯，是我見過最勤奮、最努力、最聰明的人。他一生都在做這個建立聊天機器人的任務。從他還是個孩子的時候，他就一直在嘗試建立聊天機器人。所以他加入了谷歌大腦。他讀了一些論文，并認為這種神經(jīng)語言模型技術是一些可以真正普及和建立真正開放領域的東西。

雖然他并沒有得到很多人的支持，所以只把這個項目當成副業(yè)，在上面花20%的時間。

然后他就招募了一支由20%的助手組成的軍隊，他們幫助他建立系統(tǒng)。

他甚至到處去搶別人的TPU配額，他把他的項目稱為米娜，因為他喜歡，我猜是在夢中想到的。在某個時候我看著記分牌，想這是什么東西叫米娜，為什么它有30個TPU積分？

ELAD：

LaMDA是這樣的，我知道它是谷歌在GPT之前就做出來的內部聊天機器人。這條新聞很有名，因為一位工程師認為它有智慧。

NOAM：

是的，我們把它放在一些大語言模型上，然后在公司內部轟動一時，米娜被重新命名為LaMDA，那時候，我們已經(jīng)離開了，有人相信它有生命。

SARAH：

后來為什么沒有發(fā)布，有些什么擔憂？

NOAM：

對大公司來說，推出一個知無不言的產品有點兒危險。我猜這只是一個風險的問題。所以，想來想去，創(chuàng)業(yè)似乎是個正確的想法。

SARAH：

Character的起源故事是什么樣的？

NOAM：

我們只是想打造一個東西，并且把它盡快推向市場。我組建了一個由工程師、研究人員組成的朋克團隊，得到了一些算力，然后就開始創(chuàng)業(yè)了。

ELAD：

你是怎么做招聘的？

NOAM：

我們在谷歌認識的一些人碰巧被介紹給以前來自Meta的Myat，他推出了很多，以及建立了很多他們的大型語言模型的東西和他們的神經(jīng)語言模型基礎設施，其他一些Meta的人跟著他，他們很不錯。

ELAD：

你們在尋找人才時是否有具體的要求或測試方式？還是只是常規(guī)的面試方式？

NOAM

我覺得很大程度上是看動力的。我認為丹尼爾非?？粗貏恿Γ麑ふ业氖且环N介于強烈渴望和童年夢想之間的狀態(tài)，所以有很多優(yōu)秀的人我們沒有聘用，因為他們沒有達到那個程度，但我們也聘用了許多人，他們非常適合加入一家初創(chuàng)公司，他們非常有才華和動力。

市面上已經(jīng)有了Siri和Alexa，別在功能性上和大公司硬碰硬

SARAH：

說到童年的夢想，你想描述一下這個產品嗎？你有這些機器人，它們可以是用戶創(chuàng)建的，也可以是角色創(chuàng)建的，可以是公眾人物，歷史人物，虛構的人物，你怎么想到這個模式的？

NOAM：

用戶往往比你更清楚，他們想用這個東西做什么。市面上已經(jīng)有了Siri和Alexa和谷歌助手，不需要在功能性上和這些大公司競爭。

如果你試圖呈現(xiàn)一個大家都喜歡的公眾角色，最終產出的只有無聊。而人們不喜歡無聊，大家想與感覺像人的東西互動。

因此，基本上你需要去做多個角色，讓人們隨心所欲地發(fā)明角色，而且有點我喜歡Character這個名字，它有幾個不同的含義：文字、性格、角色。

SARAH：

那么，人們想要什么？一個朋友？寫小說？其他全新的事情嗎？

NOAM：

有一些用戶會在我們的產品上和虛擬公眾人物、網(wǎng)紅交談。用戶可以自己創(chuàng)造一個角色，然后和它交談。有一些用戶可能覺得孤獨，需要和人傾訴，很多人都沒有人可以傾訴。有些人會說，這個角色現(xiàn)在是我的新任心理咨詢師。

SARAH：

思考情感的兩種方式，對嗎？比如人們與角色的關系，或者像我們在表達連貫的情感時處于什么水平，這有多重要？

NOAM：

是的，我的意思是可能你不需要那么高端的智力水平來做情感支持。情感是偉大的，也是超級重要的，但一只狗也可以把情感支持做得很好。狗能提供偉大的情感支持，但幾乎沒有語言能力，

ELAD：

你認為當你擴大規(guī)模時，系統(tǒng)會發(fā)生什么變化？

NOAM：

我認為我們應該能夠以各種方式使它更聰明。獲得更多的算力，訓練一個更大的模型，并訓練更長時間，應該變得更聰明，更有知識，更好地適應什么，人們想要什么，人們正在尋找什么。

SARAH：

你有一些用戶每天都要使用Character很多小時。你的目標受眾是哪些人？你期望的使用模式是什么。

NOAM：

我們要把這個問題留給用戶來決定。我們的目標一直是，把東西拿出來，讓用戶決定他們認為它有什么用。

我們看到今天在Character網(wǎng)站上的人，平均活躍時長為兩個小時。這是今天發(fā)送消息的人，這很瘋狂但意義重大，它說明人們正在發(fā)現(xiàn)某種價值。

然后正如我所說的，真的很難準確地說這種價值是什么，因為它真的像一個大的混合的東西。但我們的目標是讓這個東西對人們更有用，讓人們定制它，決定他們想用它做什么。讓我們把它拿到用戶手中，看看會發(fā)生什么。

正在燒錢換規(guī)模 TOC是第一優(yōu)先事項

SARAH：

你是如何考慮商業(yè)化的？

NOAM：

我們會在每個用戶身上賠錢，然后用數(shù)量來彌補。

SARAH：

好。這是很好的策略。

NOAM：

不，我是在開玩笑。

ELAD：

像傳統(tǒng)的，1990年代的商業(yè)模式，所以這很好。

SARAH：

這也是一種2022年的商業(yè)模式。

ELAD：

你應該發(fā)行一個代幣，然后把它變成一個加密貨幣的東西。

NOAM：

我們很快就會在某個時間點實現(xiàn)貨幣化。這是一門受益于大量算力的生意。而不是燃燒投資者的錢，我們希望能給足夠多的用戶提供價值，順便賺錢。后面可能會嘗試一些類似高級訂閱類型的服務。隨著我們開發(fā)一些新功能，后面的收費可能會漲價。

ELAD：

我的意思是，Character作為一項TOC服務，真的以一種非常引人注目的方式起飛了。如果你看一下用戶的數(shù)量和每個用戶的使用時間，這是很瘋狂的。后面會不會走上TOB業(yè)務？比如客戶服務機器人？

NOAM：

現(xiàn)在我們有22名員工，所以我們需要確定優(yōu)先次序，我們正在招聘。第一優(yōu)先事項是TOC。

SARAH：

所以你說LaMDA當時沒有立刻推出的一個關鍵原因是安全。你們是怎么想的？

NOAM：

還有其他原因。比如，谷歌不想讓人們傷害自己或傷害其他人，還需要阻止色情內容。圍繞這一點，已經(jīng)有一些抗議了。

ELAD：

你認為這一切是通往AGI或超級智能的道路嗎？對于一些公司來說，這似乎是目標的一部分，而對于一些公司來說，這似乎不是明確的目標。

NOAM：

是的，AGI是很多AI創(chuàng)企的目標。真正的原因是我想推動技術發(fā)展。世界上有那么多的技術問題可以解決，比如醫(yī)學上的疑難雜癥。我們可以想出技術解決方案。

這就是為什么我一直在研究人工智能，因為與其直接研究醫(yī)學，不如研究人工智能，然后人工智能可以被用來加速其他研究工作。所以基本上這就是為什么我在人工智能方面如此努力工作，我想創(chuàng)辦一個既是AGI第一又是產品第一的公司。

你的產品完全取決于AI的質量。我們產品的質量的最大決定因素是這個東西會有多聰明。因此，現(xiàn)在我們就像有充分的動力，使人工智能更好，使產品更好。

ELAD：

是的，這是一種非常好的購買-反饋循環(huán)，因為就你的觀點而言，當你使產品變得更好時，更多的人與它互動，這有助于使它成為更好的產品。所以這是一個非常聰明的方法。你認為我們離與人一樣聰明或比人更聰明的人工智能還有多遠？顯然，它們在某些方面已經(jīng)比人更聰明了，但我只是在想一些類似的東西。

NOAM：

我們總是對人工智能在哪些方面比人強感到驚訝。有些AI現(xiàn)在可以為你做家庭作業(yè)。我希望我小時候也有這種東西。

ELAD：

你會給那些和你有類似背景的人提供什么建議？比如你作為創(chuàng)始人學到的東西，有哪些是你在谷歌或其他地方工作時不一定學到的？

NOAM：

好問題?；旧希銜目膳碌腻e誤中學習。雖然我不覺得我們有犯過非常非常糟糕的錯誤，或者至少我們已經(jīng)彌補了。

SARAH：

你在尋找什么樣的人才？

NOAM：

到目前為止？22人中有21人是工程師。我們還會雇傭更多的工程師。無論是深度學習還是前端和后端，一定要在業(yè)務和產品方面雇用更多的人。

ELAD：

最后兩到三個快速的問題，你最喜歡的數(shù)學家或計算機科學家是誰。

NOAM：

我在谷歌經(jīng)常和Jeff Dean（谷歌大腦負責人）一起工作。他真的很好，工作起來很有趣。我想他現(xiàn)在正在研究他們的大型語言模型。這是離開谷歌的一點遺憾，希望將來能和他合作。

ELAD：

你認為數(shù)學是發(fā)明的還是發(fā)現(xiàn)的？

NOAM：

我想也許是被發(fā)現(xiàn)的，也許所有的東西都被發(fā)現(xiàn)了，我們只是在發(fā)現(xiàn)。

風險提示及免責條款市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據(jù)此投資，責任自負。

關鍵詞：