人妻夜夜爽天天爽三区麻豆AV网站,亚洲AV成人一区二区三区天堂,欧美人与动牲交欧美精品,亚洲AV无码一区东京热久久

<cite id="ikqym"><menu id="ikqym"></menu></cite>

您的位置：首頁 > 產(chǎn)經(jīng) >

他們用ChatGPT方式搞自動駕駛，能告訴你“我在干嘛”

來源：華爾街見聞 ? 2023-03-24 22:52:46

還在玩ChatGPT？已經(jīng)有自動駕駛算法能告訴你“我在干嘛”。

基于視覺和神經(jīng)網(wǎng)絡(luò)的自動駕駛算法，雖然能通過傳感器數(shù)據(jù)，以及學(xué)習(xí)人類的駕駛行為，自主決策并控制車輛。

但是，算法基于什么做出的決策？特別是出現(xiàn)故障，也就是決策錯(cuò)誤的時(shí)候，算法是怎么想的？這些一直被稱為自動駕駛算法里的“黑匣子”，讓算法缺乏透明度和可解釋性。

(資料圖片僅供參考)

不過，現(xiàn)在有這么一個(gè)模型，既能預(yù)測車輛控制行為，還能自己解釋“我停車是因?yàn)榧t燈亮了，并且有行人在過馬路”。

模型論文入選ICRA 2023，相關(guān)模型已開源。

那么，是一個(gè)什么樣的算法？

ADAPT：駕駛行為感知說明大模型

這是一種叫ADAPT（Action-aware Driving Caption Transformer）的端到端算法，也是目前第一個(gè)基于Transformer的駕駛行為描述框架，可以感知和預(yù)測駕駛行為，并且輸出自然語言敘述和推理。

直白一點(diǎn)說，輸入車輛視頻后，這個(gè)算法可以判斷車輛行為并告訴你：車在做什么，為什么要這么做。

在論文作者提供的測試視頻里，這個(gè)算法最終上車的效果是這樣的。（紅色字是車輛行為，藍(lán)色字是解釋）

“車在向前開。因?yàn)槁飞蠜]有車。”

駕駛行為變化后，算法也能及時(shí)感知：

“車靠左邊停下了。因?yàn)橐＼嚒！?/p>

“車開始移動并且靠右行駛。因?yàn)槁纷筮呁Ｖ??！?/p>

算法不僅能識別路口，也能識別騎著車的人。

“車在十字路口停下了。因?yàn)橐荛_街上騎著自行車的人，”

這是怎么實(shí)現(xiàn)的？

多任務(wù)框架下的聯(lián)合訓(xùn)練

ADAPT框架可以分為兩個(gè)部分：車輛行為描述（DCG，Driving Caption Generation）和車輛控制信號預(yù)測（CSP，Control Signal Prediction）。

首先，傳感器端輸入視頻，Video Swin Transformer對車輛視頻進(jìn)行編碼，得到的視頻特征會輸入進(jìn)各任務(wù)模塊里。

在DCG模塊，算法利用Vision-Language Transformer生成兩個(gè)自然語句，也就是上文中提到的車輛行為描述和原因解釋。

相同的視頻特征也會輸入進(jìn)CSP模塊（類似一般基于視覺的自動駕駛系統(tǒng)），輸出車輛實(shí)際的控制信號序列，并利用Motion Transformer輸出模型預(yù)測的控制信號，比如速度、方向和加速度。

在單個(gè)網(wǎng)絡(luò)中，作者利用車輛實(shí)際的控制信號序列和模型預(yù)測的控制信號序列，兩者的均方誤差作為CSP模塊的損失函數(shù)。

而在多任務(wù)框架下，通過聯(lián)合訓(xùn)練DCG和CSP，可以減少車輛決策和文本描述之間的差異，提高控制信號預(yù)測的準(zhǔn)確率。

論文里，作者們在包含控制信號和車輛視頻的大規(guī)模數(shù)據(jù)集BDD-X上，利用機(jī)器評測和人工評測驗(yàn)證了ADAPT的有效性。

機(jī)器評測方面，使用的是BLEU4、METEOR、ROUGE-L和CIDEr（對應(yīng)縮寫分別為B4、M、R、C）等多種語言任務(wù)常用的指標(biāo)。

最終顯示ADAPT達(dá)到了當(dāng)前最優(yōu)（State-of-the-Art）的結(jié)果，ADAPT在動作描述方面比原有先進(jìn)方法CIDEr高出31.7，在原因解釋方面高33.1。

人工評測分為動作描述、原因解釋和全句三個(gè)部分。通過人工判斷，ADAPT在這三部分的準(zhǔn)確性分別達(dá)到了90%，90.3%和82.7%，證明了ADAPT的有效性。

在可視化結(jié)果里，也能看出ADAPT可以準(zhǔn)確識別車輛行為以及決策原因。并且在黑夜、陰雨天等場景下，ADAPT也能保證準(zhǔn)確度；即使有雨刷器干擾，ADAPT也可以識別道路上的停止標(biāo)識。

為什么需要ADAPT？

自動駕駛行為的可解釋性

在基于視覺的自動駕駛算法里，比較常見的解釋圖有視覺注意圖（Attention Map），或者成本量圖（Cost Volume），但不熟悉自動駕駛算法的人容易對這些圖造成誤解。

上：視覺注意圖；下：成本量圖

因此，ADAPT這種能夠生成自然語言、“說人話”的算法，能夠幫助用戶更好地理解自動駕駛算法在做什么、為什么要這么做，同時(shí)還能讓用戶更信任自動駕駛技術(shù)。

而對于算法工程師和研究人員來說，當(dāng)發(fā)生極端情況時(shí)、或者發(fā)生故障（比如判斷錯(cuò)誤）時(shí)，ADAPT可以幫助他們獲得更多信息，進(jìn)而改進(jìn)算法。

作者們將進(jìn)一步研究如何在模擬器和實(shí)際車輛上如何部署ADAPT，以及如何利用文本轉(zhuǎn)語音技術(shù)，讓生成的句子轉(zhuǎn)化為語音，幫助普通乘客，特別是視力障礙乘客使用。

本文來源：量子位，原文標(biāo)題：《他們用ChatGPT方式搞自動駕駛，論文入選了ICRA 2023》

風(fēng)險(xiǎn)提示及免責(zé)條款市場有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議，也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

關(guān)鍵詞：

<samp id="yecqs"><tfoot id="yecqs"></tfoot></samp>

<blockquote id="yecqs"></blockquote>

<strike id="yecqs"><menu id="yecqs"></menu></strike><th id="yecqs"><nav id="yecqs"></nav></th>