人妻夜夜爽天天爽三区麻豆AV网站,亚洲AV成人一区二区三区天堂,欧美人与动牲交欧美精品,亚洲AV无码一区东京热久久

您的位置：首頁 > 股票 >

熱推薦：ChatGPT也會餓肚子？浪潮信息、拓爾思、博彥科技：我們來喂飯

來源：證券之星 ? 2023-02-14 18:22:04

前些天ChatGPT的崩潰，著實讓廣大用戶體驗了一把AI軟件的“算力危機”。而事實上，除了算力危機外，ChatGPT一類的人工智能聊天軟件，竟然也會有“餓肚子危機”，一旦陷入該危機，將出現(xiàn)有算力也給不出合適答案的情況。

【資料圖】

ChatGPT盡管并非生命體，不需要進行生物學(xué)意義上的進食以獲得營養(yǎng)，但是其需要大量的數(shù)據(jù)來訓(xùn)練，特別是語料，即一定數(shù)量的文本資源集合。有了這些語料的訓(xùn)練，類似于ChatGPT的人工智能軟件才能對用戶的信息做出正確的反應(yīng)，并給出正確且語句通順的回復(fù)信息。

事實上，這些軟件吃得越飽，吃得越好，工作的效果一般也會越好。

大致明白了這類軟件要吃的是什么之后，在我們的A股市場，又有哪些公司，可以參與這項“做飯”的工作呢？

人民網(wǎng)、浪潮信息：食材提供者

“高端的食材，往往只需要最簡單的烹飪方式”——《舌尖上的中國》第一季。

對于ChatGPT來說，什么是高端的食材？來看下面這個例子。

假如向ChatGPT提問：2022年，中央網(wǎng)信辦舉報中心指導(dǎo)全國各級網(wǎng)信舉報工作部門、主要網(wǎng)站平臺受理網(wǎng)民舉報色情、賭博、侵權(quán)、謠言等違法和不良信息1.72億件，如何看待這一數(shù)據(jù)？

食材1：不良網(wǎng)絡(luò)給人們的生活帶來的危害是多方面的。虛假信息往往使人上當(dāng)受騙，不僅造成經(jīng)濟上的損失，而且還會給受害人帶來精神上的傷害。造謠傳[遙]會混淆是非，使人真假難辨，易引起思想混亂，影響社會和諧?？傊?，不良網(wǎng)絡(luò)其社會危害性不可小覷。因此凈化網(wǎng)絡(luò)空間除了相關(guān)部門加大督察整治和打擊的力度外，對于各網(wǎng)站及我們每個人來說也是責(zé)無旁[帶]的。

食材2：網(wǎng)絡(luò)違法和不良信息的出現(xiàn)與存在，是“冰凍三尺非一日之寒”，清除有害信息、根治頑瘴痼疾也很難一蹴而就。這就需要找準治理的重點，平臺需要加大優(yōu)質(zhì)信息供給，多平臺、多渠道、多形態(tài)提供群眾需要的網(wǎng)絡(luò)內(nèi)容及信息服務(wù)，做到用正能量驅(qū)散負能量。使網(wǎng)絡(luò)空間清朗起來，不是一時的事，而是一直的事，需要網(wǎng)上網(wǎng)下集眾智、匯合力，為文明辦網(wǎng)、文明用網(wǎng)、文明上網(wǎng)、文明興網(wǎng)保駕護航。

無論網(wǎng)上還是網(wǎng)下，無論大屏還是小屏，都沒有法外之地、輿論飛地。綜合運用法律、監(jiān)管、平臺、技術(shù)等手段，堅決遏制各類違法違規(guī)問題，不斷提升網(wǎng)絡(luò)空間治理效能，做到利刃出鞘、精準打擊、發(fā)力增效、久久為功，讓網(wǎng)絡(luò)不良信息無處遁形，讓清風(fēng)正氣分外充盈。

是的，第一份食材出自一段普通的針對網(wǎng)絡(luò)有害信息的問答，里面還有兩個明顯的錯別字，而第二份食材，則是出自人民網(wǎng)針對網(wǎng)絡(luò)有害信息的時評。而這，正是中央級別大型媒體的優(yōu)勢：盡管這些文字顯然還不能作為聊天機器人最終的答案，但如果語料更為優(yōu)質(zhì)，后續(xù)加工出來的食糧需要的加工程序也會更少，輸出效果也會更佳。

不過，中央級的媒體，也并非只有人民網(wǎng)一家，為何人民網(wǎng)會成為語料提供者的排頭兵呢？

答案就在人民網(wǎng)，對于數(shù)字經(jīng)濟的布局。其中，特別是人民數(shù)據(jù)已經(jīng)布局了新型數(shù)據(jù)中心和新型算力中心，進而人民網(wǎng)可以輕松地基于知識圖譜、自然語言處理和人工智能等技術(shù)，深度挖掘自由的核心數(shù)據(jù)資源(優(yōu)質(zhì)語料等)。

圖片來源：人民網(wǎng)2022年半年報

自己擁有大量優(yōu)質(zhì)語料，又有著數(shù)據(jù)提供的布局，那自然而然，論優(yōu)質(zhì)語料，人民網(wǎng)是當(dāng)仁不讓的食材提供商。

除了人民網(wǎng)之外，浪潮信息的源1.0，同樣是食材的寶庫，只不過相比于人民網(wǎng)來說，浪潮信息是以量取勝。

2021年9月28日，浪潮人工智能研究院在京發(fā)布全球最大規(guī)模人工智能巨量模型“源1.0”。“源”的單體模型參數(shù)量達2457億，超越美國OpenAI組織研發(fā)的GPT-3，成為全球最大規(guī)模的AI巨量模型。

這個模型的數(shù)據(jù)量大，并非是他適合作為原材料的理由，更重要的是，這款“源”是中文巨量模型，其蘊含的中文語料極為豐富，浪潮信息基于源1.0發(fā)布了4個技能大模型，對話模型源曉問、問答模型源曉搜、翻譯模型源曉譯、古文模型源曉文。這些模型，特別是有中文特色的對話、古文等模型，對于發(fā)展國內(nèi)對標(biāo)ChatGPT的智能聊天產(chǎn)品有著至關(guān)重要的作用。

去年，浪潮“源1.0”大模型登頂CUGE(一款清華北大領(lǐng)銜的中文機器語言能力評測基準)總榜榜首，并獲得語言理解(篇章級)、語言生成、對話交互、多語言、數(shù)學(xué)推理等5項評測最佳成績。足見這款模型在中文語料領(lǐng)域強大的優(yōu)勢。

拓爾思、博彥科技：我們來做飯、喂飯

和做飯類似，有了原材料，還需要一定的加工烹飪，才能成為真正的數(shù)據(jù)食糧，讓AI系統(tǒng)能夠?qū)W習(xí)、消化。

事實上，有專門的學(xué)科去做這塊的業(yè)務(wù)。自然語言處理(NLP，Natural Language Processing)是研究人與計算機交互的語言問題的一門學(xué)科。按照技術(shù)實現(xiàn)難度的不同，這類系統(tǒng)可以分成簡單匹配式、模糊匹配式和段落理解式三種類型

在A股市場，有不少公司擁有語料加工相關(guān)的業(yè)務(wù)，而拓爾思正是其中之一。

2022年12月，拓爾思在接受券商調(diào)研時曾表示，公司作為國內(nèi)最早從事自然語言處理(NLP)研發(fā)的企業(yè)之一，在NLP、知識圖譜、OCR、圖像視頻結(jié)構(gòu)化領(lǐng)域都具備自主可控的底層技術(shù)。在AIGC方面，公司圍繞傳媒、政府等垂直領(lǐng)域的語料庫積累已非常全面，在智能問答、自動寫作或智能寫稿、內(nèi)容播報、創(chuàng)作智能輔助等方面亦有成熟應(yīng)用場景。

更為重要的是，拓爾思已經(jīng)有專門的平臺，去做語義處理這個事情了，公司旗下“數(shù)家”平臺，已經(jīng)可以對語料數(shù)據(jù)進行結(jié)構(gòu)化分類整合，而緊隨其后的“智語”平臺，則吸收了拓爾思在自然語言處理和信息檢索領(lǐng)域多年的技術(shù)積累，其已經(jīng)可以進行分詞和詞性標(biāo)注、語言分類和語言聚類等內(nèi)容，可以說，拓爾思這些平臺已經(jīng)成為語言的加工廠，經(jīng)過這些平臺的加工后，機器就可以通過這些機器人適配的語言進行認知、學(xué)習(xí)了。

除了拓爾思，博彥科技在語言加工領(lǐng)域，也同樣有著自己的業(yè)務(wù)。2月10日，博彥科技在投資者互動平臺上稱，公司有智能聊天機器人方面的解決方案，有能力為機器提供語音訓(xùn)練相關(guān)服務(wù)。

這句話也可以翻譯成：我可以，也很會給機器喂飯。

事實上，博彥科技在語料這條產(chǎn)業(yè)鏈中的地位，有點像醫(yī)藥中的CXO，客戶在研發(fā)過程中，可以將需要加工的語音、雜亂的語言文字等部分交給博彥科技，博彥科技憑借其經(jīng)驗和專業(yè)能力，進行標(biāo)注、歸類。如果客戶有需要，公司也可以協(xié)助公司完成相關(guān)的機器語義訓(xùn)練。

作為這一領(lǐng)域的老牌企業(yè)，此前，博彥科技已與微軟合作了長達二十多年，這也意味著在機器訓(xùn)練領(lǐng)域，博彥科技已積累了長時間的經(jīng)驗，隨著聊天機器人時代的到來，博彥科技的相關(guān)訂單或?qū)⒂瓉肀l(fā)。

當(dāng)然，筆者所列舉的食材提供者、加工者相關(guān)公司并不完全，實際上，除了這些公司，漢王科技、海天瑞聲、科大訊飛等公司在語料加工領(lǐng)域也有著多年的技術(shù)積淀，但這些公司或前期漲幅過大，或總市值過大、涉及領(lǐng)域?qū)嵲谶^多，在這里就不做重點介紹了。其實在語料加工領(lǐng)域，這些公司的業(yè)務(wù)也多集中于數(shù)據(jù)標(biāo)注、模式化、訓(xùn)練等內(nèi)容，本質(zhì)上也是一個做飯的活。忽略二級市場因素的話，事實上未來這些公司在語料加工領(lǐng)域，也有望有所作為。

可以看到的是，單單文字領(lǐng)域的機器學(xué)習(xí)，就需要一系列的基礎(chǔ)數(shù)據(jù)積累、加工、訓(xùn)練等工序，這部分的市場，隨著類ChatGPT軟件的不斷開發(fā)，將在未來幾年呈持續(xù)爆發(fā)之勢。想象空間十分廣闊。機器吃飯，產(chǎn)業(yè)鏈喂飯并享受豐厚回報的時代，或許真的要到來了。

關(guān)鍵詞：博彥科技浪潮信息