國(guó)際洞察:讓自動(dòng)駕駛汽車成為現(xiàn)實(shí),AI 準(zhǔn)備好了嗎?
【ZiDongHua 之駕駛自動(dòng)化收錄關(guān)鍵詞:自動(dòng)駕駛 人工智能 汽車駕駛自動(dòng)化 NVIDIA 深度神經(jīng)網(wǎng)絡(luò) 】
國(guó)際洞察:讓自動(dòng)駕駛汽車成為現(xiàn)實(shí),AI 準(zhǔn)備好了嗎?
來(lái)源:Digital Engineering
作者:Tom Kevan
編譯:李兆榮
自動(dòng)駕駛汽車安全高效地將人員和貨物運(yùn)送到目的地的現(xiàn)實(shí)在很大程度上取決于汽車制造商如何利用AI(人工智能)的力量。AI的影響力已經(jīng)跨越了自動(dòng)駕駛汽車生命周期的整個(gè)領(lǐng)域,突破了設(shè)計(jì)、功能和性能的極限,但該行業(yè)要充分利用人工智能的優(yōu)勢(shì)并實(shí)現(xiàn)全面的駕駛自動(dòng)化,還有很長(zhǎng)的路要走。
自動(dòng)駕駛汽車可用的感知輸入數(shù)量不斷增加,這為更準(zhǔn)確、更詳細(xì)地理解運(yùn)行環(huán)境提供了可能,但這些數(shù)據(jù)仍然無(wú)法提供滿足安全要求所需的可見性。要應(yīng)對(duì)應(yīng)用的復(fù)雜性,并填補(bǔ)在物理力量作用下的信息缺口,將成為自動(dòng)駕駛技術(shù)進(jìn)一步發(fā)展的下一個(gè)里程碑。
要想了解自動(dòng)駕駛汽車的想法距離現(xiàn)實(shí)有多近,重要的是要了解AI的力量在哪里發(fā)揮作用,以及當(dāng)前技術(shù)的實(shí)際效果如何。要做到這一點(diǎn),讓我們從研究AI對(duì)設(shè)計(jì)過(guò)程的基本工具和實(shí)踐的影響開始。

圖 1:利用 AI,自動(dòng)駕駛汽車開發(fā)團(tuán)隊(duì)可以使用物理上精確的模擬和 3D 環(huán)境來(lái)創(chuàng)建、測(cè)試和驗(yàn)證自動(dòng)駕駛系統(tǒng)和服務(wù)的設(shè)計(jì)。圖片由 NVIDIA 提供。
▍擴(kuò)展數(shù)據(jù)基礎(chǔ)
AI系統(tǒng)驅(qū)動(dòng)自動(dòng)駕駛汽車技術(shù)的基本機(jī)制是算法。算法的創(chuàng)建始于收集大量高質(zhì)量、有標(biāo)簽的物理數(shù)據(jù)。這些數(shù)據(jù)用于訓(xùn)練、測(cè)試和驗(yàn)證算法。
Nauto工程總監(jiān)Ben Alpert表示:“為了實(shí)現(xiàn)穩(wěn)健可靠的AI系統(tǒng),訓(xùn)練數(shù)據(jù)準(zhǔn)確地代表現(xiàn)實(shí)世界的豐富性和多樣性是很重要的。例如,數(shù)據(jù)集應(yīng)該代表不同的環(huán)境條件,包括弱光或眩光之類的東西。”
好消息是,該行業(yè)現(xiàn)在有許多 AI 軟件開發(fā)工具,可以收集、標(biāo)記、索引、存檔和管理訓(xùn)練 自動(dòng)駕駛汽車算法所需的數(shù)據(jù)。當(dāng)前的技術(shù)標(biāo)簽不僅包括捕獲的圖像和視頻幀中的對(duì)象,還包括視頻序列中的場(chǎng)景和條件。
此外,還標(biāo)記了數(shù)據(jù)收集條件。這提供了一個(gè)條件矩陣,工程師可以使用這些條件矩陣來(lái)針對(duì)各種場(chǎng)景、天氣條件和一天中的時(shí)間測(cè)試算法的性能。當(dāng)性能不符合關(guān)鍵性能指標(biāo)時(shí),工程師會(huì)收集和處理更多數(shù)據(jù)以進(jìn)行驗(yàn)證。
數(shù)據(jù)處理后,AI 工程師使用標(biāo)記的數(shù)據(jù)來(lái)訓(xùn)練感知算法和其他自動(dòng)駕駛功能。這是一個(gè)迭代過(guò)程,工程師根據(jù)需要調(diào)整算法參數(shù),然后重新訓(xùn)練算法,此時(shí)將下一組標(biāo)記數(shù)據(jù)添加到訓(xùn)練集中。此過(guò)程一直持續(xù)到達(dá)到所需的模型性能和準(zhǔn)確性為止。
AI公司正在不斷地改進(jìn)和擴(kuò)展這些開發(fā)工具的功能。
NVIDIA 汽車副總裁丹尼·夏皮羅 (Danny Shapiro) 表示:“我們擁有的數(shù)據(jù)越多樣化、越公正,構(gòu)成深度神經(jīng)網(wǎng)絡(luò)等AI系統(tǒng)的算法就越強(qiáng)大、越安全。我們還定義了關(guān)鍵性能指標(biāo)來(lái)衡量收集到的數(shù)據(jù)質(zhì)量,并將合成數(shù)據(jù)添加到我們的訓(xùn)練數(shù)據(jù)集中。最終目標(biāo)是不斷添加訓(xùn)練數(shù)據(jù),以構(gòu)建一個(gè)包含位置、條件和場(chǎng)景的綜合矩陣。”
算法訓(xùn)練數(shù)據(jù)的不斷豐富和細(xì)化對(duì)于保持自動(dòng)駕駛技術(shù)發(fā)展和進(jìn)步的勢(shì)頭至關(guān)重要。它還為更復(fù)雜的模擬奠定了基礎(chǔ),這是自動(dòng)駕駛汽車設(shè)計(jì)創(chuàng)新的主要推動(dòng)者之一。
夏皮羅說(shuō):“在開發(fā)過(guò)程中,必須在各種駕駛條件下對(duì)自動(dòng)駕駛技術(shù)進(jìn)行一次又一次的評(píng)估,以確保這些車輛比人類駕駛的車輛安全得多。模擬在虛擬世界中運(yùn)行試駕場(chǎng)景,向駕駛堆棧提供渲染的傳感器數(shù)據(jù)并執(zhí)行駕駛命令。重新模擬將之前記錄的傳感器數(shù)據(jù)回放到駕駛堆棧。人工智能模型最終根據(jù)大量且不斷增長(zhǎng)的測(cè)試數(shù)據(jù)集進(jìn)行驗(yàn)證。”
▍將自動(dòng)駕駛汽車模擬提升到一個(gè)新的水平
迄今為止,從感官和操作來(lái)源提取的算法訓(xùn)練數(shù)據(jù)僅用于自動(dòng)駕駛汽車開發(fā)人員。僅僅提供無(wú)人駕駛汽車運(yùn)行時(shí)遇到的所有變量是不夠的。
問(wèn)題在于,目前的自動(dòng)駕駛測(cè)試車隊(duì)不可能遇到訓(xùn)練自動(dòng)駕駛汽車安全應(yīng)對(duì)現(xiàn)實(shí)世界所需的所有罕見和危險(xiǎn)的場(chǎng)景和條件。
例如,一個(gè)穿著深色衣服的小孩晚上在街上跑出來(lái)不是一種可以反復(fù)測(cè)試的常見場(chǎng)景,但卻是自動(dòng)駕駛汽車必須能夠安全、正確地做出反應(yīng)的場(chǎng)景。當(dāng)前的實(shí)體車輛測(cè)試無(wú)法在足夠大的范圍內(nèi)進(jìn)行驗(yàn)證。它受限于車隊(duì)規(guī)模和測(cè)試區(qū)域的地理位置。
然而,隨著AI和計(jì)算技術(shù)的不斷發(fā)展,現(xiàn)在可以在部署前通過(guò)安全測(cè)試和驗(yàn)證自動(dòng)駕駛設(shè)計(jì)和技術(shù)來(lái)填補(bǔ)空白。
夏皮羅說(shuō):“NVIDIA DRIVE Sim等高保真、時(shí)間準(zhǔn)確的模擬平臺(tái)提供了一個(gè)物理上準(zhǔn)確的駕駛環(huán)境數(shù)字雙胞胎,以支持大規(guī)模開發(fā)和驗(yàn)證自動(dòng)駕駛汽車,而不會(huì)讓其他人在路上受到傷害。與現(xiàn)實(shí)世界的試駕相比,這可以提高效率、成本效益,最重要的是安全性。”
使用每個(gè)域的專用模型模擬駕駛環(huán)境、交通和車輛行為的能力使自動(dòng)駕駛汽車測(cè)試能夠在沒(méi)有腳本的情況下進(jìn)行。汽車設(shè)計(jì)師可以使用仿真來(lái)測(cè)試邊緣情況并挖掘車輛在現(xiàn)實(shí)世界中可能遇到的未知變量。
一旦發(fā)現(xiàn),這些模擬場(chǎng)景可以用于迭代測(cè)試自動(dòng)駕駛汽車,在部署前改進(jìn)汽車的硬件和軟件。有了這種水平的模擬,自動(dòng)駕駛汽車制造商可以加快開發(fā),減少寶貴的時(shí)間和成本。
然而,先進(jìn)的技術(shù)帶來(lái)了一系列全新的挑戰(zhàn)。通過(guò)模擬重建真實(shí)世界的駕駛場(chǎng)景和生成真實(shí)的數(shù)據(jù)可能耗時(shí)且勞動(dòng)密集,需要熟練的工程師。即便如此,這也可能很困難。
▍綜合真實(shí)場(chǎng)景
為了進(jìn)一步推進(jìn)自動(dòng)駕駛,開發(fā)人員已經(jīng)開始使用兩種基于AI的技術(shù),通過(guò)生成逼真的合成訓(xùn)練數(shù)據(jù)和重建真實(shí)世界的駕駛場(chǎng)景來(lái)增強(qiáng)模擬。
這些技術(shù)中的第一種被稱為虛擬重建。此方法將真實(shí)世界場(chǎng)景復(fù)制為完全合成的3D場(chǎng)景。這些數(shù)據(jù)可以幫助訓(xùn)練算法并增強(qiáng)自動(dòng)駕駛汽車模擬能力。
開發(fā)人員首先將有問(wèn)題的道路網(wǎng)絡(luò)的數(shù)字雙胞胎轉(zhuǎn)換為可駕駛的模擬環(huán)境,然后工程師使用該環(huán)境來(lái)重現(xiàn)事件,例如在施工區(qū)導(dǎo)航。如果出現(xiàn)任何缺口,開發(fā)人員將基于人工智能的交通模型應(yīng)用于被跟蹤對(duì)象,以預(yù)測(cè)其將如何反應(yīng)并填補(bǔ)其軌跡中的缺口。
虛擬重建幫助開發(fā)人員找到具有潛在挑戰(zhàn)性的情況來(lái)訓(xùn)練和驗(yàn)證自動(dòng)駕駛系統(tǒng),使用高保真度、傳感器生成的數(shù)據(jù)來(lái)增強(qiáng)AI行為模型,工程師可以使用這些模型來(lái)創(chuàng)建新的場(chǎng)景。來(lái)自場(chǎng)景的數(shù)據(jù)也可以訓(xùn)練行為模型。
第二種方法稱為神經(jīng)重建,使用人工智能將錄制的視頻數(shù)據(jù)轉(zhuǎn)化為模擬。該過(guò)程從記錄的駕駛數(shù)據(jù)開始。AI從這種材料中識(shí)別并提取關(guān)鍵的動(dòng)態(tài)元素,并將其加載到高保真度模擬中,工程師可以根據(jù)需要進(jìn)行更改。這種方法允許閉環(huán)測(cè)試,并在自動(dòng)駕駛軟件和它所處的世界之間進(jìn)行充分地交互。
▍深入了解AI
AI 不僅重新定義了自動(dòng)駕駛汽車的設(shè)計(jì)方式,而且在無(wú)人駕駛汽車控制和安全等領(lǐng)域發(fā)揮著關(guān)鍵作用。
CerebrumX首席技術(shù)官Sarika Gupta表示:“AI和機(jī)器學(xué)習(xí)使車輛控制系統(tǒng)能夠評(píng)估風(fēng)險(xiǎn)并做出預(yù)防事故的決策。配備AI技術(shù)的車輛可以分析來(lái)自攝像頭、激光雷達(dá)和雷達(dá)等各種傳感器的數(shù)據(jù),并識(shí)別道路上的潛在危險(xiǎn)。然后,AI算法可以做出避免這些危險(xiǎn)的決定,例如減速或變道。這項(xiàng)技術(shù)有可能大大減少事故數(shù)量。”
雖然風(fēng)險(xiǎn)評(píng)估具有巨大潛力,但該技術(shù)也是自動(dòng)駕駛最大的漏洞之一。
Nauto的Alpert說(shuō):“即使是當(dāng)今最先進(jìn)的系統(tǒng)也無(wú)法在發(fā)生危險(xiǎn)情況時(shí)提供足夠的警告,因此它們需要人工持續(xù)監(jiān)控情況,并準(zhǔn)備好立即接管。”。
開發(fā)人員希望,隨著AI增強(qiáng)仿真的成熟并提供更高的準(zhǔn)確性和可見性,控制算法可以提供更安全、更可靠的決策和控制。
▍自動(dòng)駕駛汽車找到自己的聲音了嗎?
自然語(yǔ)言處理的進(jìn)步正在進(jìn)入下一代汽車。這些系統(tǒng)通??梢蕴幚韽?fù)雜的查詢,并允許駕駛員或乘客自然地與車內(nèi)系統(tǒng)進(jìn)行通信。
但AI技術(shù)與車內(nèi)語(yǔ)音應(yīng)用的匹配并不是一成不變的。如今,自動(dòng)駕駛開發(fā)者必須決定哪種風(fēng)格的AI語(yǔ)音最適合無(wú)人駕駛汽車。
一種選擇是對(duì)話式AI。在當(dāng)今的數(shù)字助理中可以找到這種技術(shù)的好例子。這是一項(xiàng)更成熟的技術(shù),因此,它已經(jīng)開始開拓自己的利基市場(chǎng)。
Sama產(chǎn)品高級(jí)副總裁Duncan Curtis表示:“從技術(shù)準(zhǔn)備的角度來(lái)看,亞馬遜的Alexa、蘋果的Siri和谷歌的Assistant等車載語(yǔ)音輔助技術(shù)已經(jīng)部署在全球許多車輛上。這些系統(tǒng)是為車內(nèi)體驗(yàn)精心設(shè)計(jì)的。”

圖 2:配備AI風(fēng)險(xiǎn)評(píng)估系統(tǒng)的自動(dòng)駕駛汽車可以分析來(lái)自車載和基礎(chǔ)設(shè)施傳感器的數(shù)據(jù),并識(shí)別道路上的潛在危險(xiǎn)。圖片由 Sama 提供。
另一種選擇,生成式 AI,如ChatGPT,仍處于早期階段。
這種風(fēng)格的AI專注于開發(fā)無(wú)監(jiān)督和半監(jiān)督算法,它能夠從現(xiàn)有數(shù)據(jù)中產(chǎn)生新的內(nèi)容,如文本、音頻、視頻、圖像和代碼。
Alpert說(shuō):“生成式AI有潛力實(shí)現(xiàn)一系列新的應(yīng)用。這包括顯著改進(jìn)車內(nèi)語(yǔ)音助理的功能。例如,可以使用語(yǔ)音識(shí)別讓導(dǎo)航應(yīng)用程序找到最近的咖啡店。一個(gè)基于生成型AI和大型語(yǔ)言模型的更高級(jí)助手將能夠回答更復(fù)雜、更個(gè)性化的問(wèn)題,比如‘給我找一個(gè)洗手間干凈、汽油便宜且繞行時(shí)間不會(huì)超過(guò) 5 分鐘的加油站。’這樣的助手將更善于理解駕駛員的意圖,并提供更豐富的反應(yīng)。”
然而,這些問(wèn)題繼續(xù)影響生成式AI的可靠性,這些缺陷阻礙了其應(yīng)用的推廣。
Curtis說(shuō):“至于ChatGPT和其他生成式AI系統(tǒng),現(xiàn)階段還沒(méi)有大規(guī)模部署。我們?nèi)蕴幱诹私馊绾我园踩姆绞皆谲囕v內(nèi)啟用ChatGPT等功能的早期階段。例如,讓它訪問(wèn)音樂(lè)功能很容易,但核心的車輛駕駛和安全功能還有很長(zhǎng)的路要走。”
最近推出的第三個(gè)選項(xiàng)稱為SoundHound Chat AI for Automotive,它將生成式AI功能與對(duì)話式AI的語(yǔ)音助手相結(jié)合,提供了一種車載語(yǔ)音助手。該平臺(tái)承諾讓司機(jī)及其乘客能夠訪問(wèn)大量信息域(圖3)。
AI技術(shù)開發(fā)人員認(rèn)為,他們的系統(tǒng)可以響應(yīng)用戶的復(fù)合查詢,例如“搖下窗戶,關(guān)掉空調(diào)”,以及從多個(gè)領(lǐng)域獲取知識(shí)的復(fù)雜查詢,如“打開空調(diào),然后導(dǎo)航到最近的沙龍,在那里我可以修指甲,而且營(yíng)業(yè)時(shí)間超過(guò)下午 6 點(diǎn)。”

圖 3:對(duì)話式AI可以讓自動(dòng)駕駛汽車和乘客實(shí)時(shí)訪問(wèn)多域信息,并提供支持語(yǔ)音的車內(nèi)控制。圖片由 SoundHound 提供。
SoundHound汽車業(yè)務(wù)發(fā)展總監(jiān)Matt Anderson表示:“通過(guò)超越命令和控制技術(shù),并預(yù)測(cè)駕駛員的需求,先進(jìn)的語(yǔ)音人工智能使汽車制造商能夠擺脫循序漸進(jìn)的語(yǔ)音菜單,提供對(duì)話式、方便快捷的語(yǔ)音體驗(yàn)。在簡(jiǎn)化車輛“用戶體驗(yàn)”的整體設(shè)計(jì)的同時(shí),現(xiàn)代AI驅(qū)動(dòng)的語(yǔ)音技術(shù)還減少了硬按鈕和軟按鈕的數(shù)量,提高了系統(tǒng)的整體安全性,同時(shí)為制造商騰出了寶貴的空間。”
考慮到可用選項(xiàng)和功能組合,自動(dòng)駕駛開發(fā)人員在確定標(biāo)準(zhǔn) AI 方法之前需要一段時(shí)間是一個(gè)不錯(cuò)的選擇。
我要收藏
點(diǎn)個(gè)贊吧
轉(zhuǎn)發(fā)分享
咨詢?cè)斍椋?/strong>如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情,請(qǐng)加微信:ZiDongHuaX 。
微信聯(lián)盟:人工智能微信群、汽車駕駛自動(dòng)化微信群、NVIDIA微信群、深度神經(jīng)網(wǎng)絡(luò)微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測(cè)儀器、智慧農(nóng)業(yè)在線監(jiān)測(cè)儀器 查看各品牌在細(xì)分領(lǐng)域的定位宣傳語(yǔ)
微信聯(lián)盟:人工智能微信群、汽車駕駛自動(dòng)化微信群、NVIDIA微信群、深度神經(jīng)網(wǎng)絡(luò)微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測(cè)儀器、智慧農(nóng)業(yè)在線監(jiān)測(cè)儀器 查看各品牌在細(xì)分領(lǐng)域的定位宣傳語(yǔ)


評(píng)論排行