每日短訊:學術界圣地,給國內(nèi)自動駕駛一席之地了!
CVPR 2023 正式公布最佳論文等重磅獎項。來自上海人工智能實驗室、武漢大學、商湯科技團隊聯(lián)合發(fā)表論文Planning-oriented Autonomous Driving(以路徑規(guī)劃為導向的自動駕駛)實現(xiàn)自動駕駛技術的重要突破,獲CVPR最佳論文。
國內(nèi)自動駕駛,真的出息了!
(資料圖片僅供參考)
一覺醒來,還沒來得及吃口熱乎粽子,就看見一條堪稱爽文的熱乎新聞:
在2023年,CVPR大會的論文投稿總量達9155篇。其中,商湯科技及聯(lián)合實驗室共有 54篇論文被CVPR 2023接收,包含一篇最佳論文、一篇最佳論文候選,以及七篇Highlight論文。
論文題目:Planning-oriented Autonomous Driving
論文地址:https://arxiv.org/abs/2212.10156
在近萬篇論文中,上海人工智能實驗室、武漢大學、商湯科技聯(lián)合團隊研究成果Planning-oriented Autonomous Driving(以路徑規(guī)劃為導向的自動駕駛)最終脫穎而出,獲CVPR 2023最佳論文獎(Best Paper Award)。
(劃重點)要知道這個國際獎項已經(jīng)頒了40年,但以自動駕駛為主題的論文獲獎可是第一次!
另外參與CVPR評選需要和全球各地的頂尖學者來一套“過五關斬六將”,拿了這個獎堪稱為國爭光(進度條:已擊敗全球99.99%學者/學術機構(gòu))!
平復激動的心情,接下來咱們就聊聊這個獲獎的事兒。
首先這個頒獎機構(gòu)用一個詞來形容,就是頂級(到能讓一個研究生原地畢業(yè))。
CVPR一年舉辦一次,是計算機視覺領域的全球級會議。要想知道一個會議有多少含金量,看業(yè)內(nèi)人的關注度就懂了,CVPR的隆重程度:從1983年開始,每年吸引著全球各地的學術大牛們來參與,近幾年投稿量都近萬篇,即使這些天之驕子總是第一輪就會被刷掉3/4。
當然這可不是什么鍍金的手段,這個會議憑借著高質(zhì)量和低成本,它為眾多研學者提供著教科書般的行業(yè)價值。目前在中國計算機學會推薦國際學術會議的排名里,CVPR為人工智能領域的A級會議。
除了水平認證,CVPR回報給這些學者們最重要的是尊重和公平。在初次篩選中,評審們給出的選擇不是通不通過,而是細致到“非常接受”、“接受”、“差不多”、“拒絕”、“非常拒絕”。
同時評審們不屬于CVPR機構(gòu)組織,對手里的稿件都是盲審。最關鍵的是,稿件不允許出現(xiàn)任何能顯示作者信息身份的元素(懷疑定這個規(guī)矩的人參加過我們語文高考)!所以評審們和作者都不知道彼此是誰!因此,最后脫穎而出的作品都是用實力經(jīng)過細審,沒什么運氣的成分。
話說咱們國內(nèi)智能車現(xiàn)在發(fā)展的如火如荼,也不知道當時有沒有評審猜中過這篇論文的歸屬地。話不多說,接下來咱們就來看看這篇論文是靠什么獲得國際認證的。
我們?nèi)祟愰_車時的思路通常是“堵車了,我得剎?!?,而自動駕駛車的思路則是“感知前方障礙物的時速和距離、系統(tǒng)算法判斷場景需求決定剎車、牽動制動系統(tǒng)”。顯然,如果自動駕駛系統(tǒng)將流程整合起來會帶來更絲滑、BUG更少的體驗。
這篇以自動駕駛為主題的論文就是從此角度切入問題,核心在于首次提出感知決策一體化的自動駕駛通用大模型UniAD。UniAD將檢測、跟蹤、建圖、軌跡預測,占據(jù)柵格預測以及規(guī)劃,整合到一個基于Transformer的端到端網(wǎng)絡框架下。
不用覺得復雜,我們挑取2個重點詞“檢測”、“規(guī)劃”,也就是說這個框架在環(huán)境中可以直接給出相應的指令。
UniAD將各任務通過token(最小單位)的形式在特征層面,按照感知-預測-決策的流程進行深度融合,使得各項任務彼此支持,實現(xiàn)性能提升。在nuScenes數(shù)據(jù)集的所有任務上,UniAD都達到 SOTA 性能。
融合五大核心模塊,解決自動駕駛“規(guī)劃”難題
為什么之前的自動駕駛系統(tǒng)做不到呢?
現(xiàn)有的自動駕駛系統(tǒng)可大致歸為三類:
(a)模塊化組成的系統(tǒng);
(b)多任務模塊架構(gòu)的系統(tǒng);
(c)端到端自動駕駛系統(tǒng)。
其中傳統(tǒng)的端到端算法可分為:
(c.1)基礎的端到端算法,直接從傳感器輸入預測控制輸出,但是優(yōu)化困難,在充滿復雜視覺信息的真實場景中應用面臨較大挑戰(zhàn);
(c.2)按照任務劃分網(wǎng)絡的顯式設計,但是網(wǎng)絡模塊之間缺乏有效的特征溝通,需要分階段的輸出結(jié)果,任務間缺乏有效交互。
(c.3)這篇論文里提出的決策導向的感知決策一體設計方法,用token特征按照感知-預測-決策的流程進行深度融合,使得以決策為目標的各項任務指標一致提升。
最為常見的是模塊化組成的系統(tǒng)架構(gòu),或者部分模塊組成多任務架構(gòu),他們都以優(yōu)化部分性能為核心,比如檢測性能(檢測準確度)、預測性能(預測準確度)。
以上一些算法的BUG總結(jié)起來其實就是流程瑣碎,一損俱損。這和當下智駕方案都急著擺脫高精地圖的原因有點類似。畢竟依賴高精地圖的話,哪怕硬件、算法再好,只要地圖有偏差,整套方案直接崩盤。所以大家都在做“簡化和收納”。
而端到端自動駕駛系統(tǒng),以UniAD自動駕駛通用大模型為代表,將檢測、跟蹤、建圖、軌跡預測、占據(jù)柵格預測以及規(guī)劃五大模塊融合,以最終的駕駛性能為目標,從解決實際問題出發(fā),例如提升規(guī)劃出來的車輛行駛軌跡的安全性。
現(xiàn)在行業(yè)中大多數(shù)端到端(End-to-end,E2E)的自動駕駛系統(tǒng),由于沒有很好的網(wǎng)絡框架來融合全部五大模塊,都只能融合部分模塊。
UniAD通過將環(huán)視的圖片以Transformer映射得到BEV的特征,同時進行目標的跟蹤,在線的建圖,包括目標軌跡的預測,還有障礙物的預測,最終實現(xiàn)駕駛行為。環(huán)視一圈,現(xiàn)觀察現(xiàn)預測,然后決定怎么行動,聽起來是不是有人類開車的味兒了?
據(jù)商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛表示,UniAD可以做到“多目標跟蹤準確率超越SOTA 20%,車道線預測準確率提升30%,預測運動位移誤差降低38%,規(guī)劃誤差降低28%?!?/p>
下面展示了UniAD在數(shù)據(jù)集nuScenes上多個復雜場景下的優(yōu)勢。
UniAD 感知到左前方等待的黑色車輛,預測其未來軌跡(即將左轉(zhuǎn)駛?cè)胱攒嚨能嚨溃┖臀磥淼膐ccupancy,推算繼續(xù)前行有碰撞風險,并立即減速以進行避讓,待黑車駛離后再恢復正常速度直行。
得益于 UniAD 的地圖分割模塊與規(guī)劃模塊的深度交互,規(guī)劃模塊基于道路信息作出判斷,向前行駛時依據(jù)道路結(jié)構(gòu)適時地轉(zhuǎn)彎。
在視野干擾較大且場景復雜的十字路口,UniAD 能通過分割模塊生成十字路口的整體道路結(jié)構(gòu)(如右側(cè) BEV 圖中的綠色分割結(jié)果所示)和周圍車輛的軌跡,由基于注意力機制的planner完成大幅度的左轉(zhuǎn)。
在夜晚視野變暗的情況下,由于需要繼續(xù)直行至下個路口左轉(zhuǎn),UniAD 能感知到前車停止且左右均有障礙物,所以先靜止,待前車行駛并再前行并左轉(zhuǎn)。
雖然現(xiàn)在自動駕駛的目標還是趕緊追上人類,但是不得不說有些場景中大模型觀察環(huán)境比我們都更加全面細致,以下案例,展示了UniAD在國內(nèi)真實場景的實際演示效果。
在擁堵路段上,UniAD能感知到前方大車的停車和啟動狀態(tài),做出相應的減速和加速決策,保持足夠的安全距離。
得益于地圖重建任務,UniAD在路口和曲折道路上,也可以做出符合道路曲率的路徑規(guī)劃。
自動駕駛多模態(tài)大模型發(fā)展和落地
在學術圈大家都認這么一個理兒:不能落地的論文得再好的獎也沒有價值。這篇《以路徑規(guī)劃為導向的自動駕駛》用幾千字提出了UniAD 這項自動駕駛技術,為產(chǎn)業(yè)發(fā)展拓展了一個新的方向。實際上,它的創(chuàng)造者已經(jīng)在努力將這些價值落地了。
作為創(chuàng)作者之一的商湯科技,一直致力于自動駕駛技術領域的研究和發(fā)展布局。例如在今年上海車展上,商湯展示了廣汽埃安AION LX Plus、哪吒S等車型搭載商湯絕影智能駕駛方案的落地成果。
王曉剛將這些成果歸功于商湯持續(xù)建設打造“大模型+大裝置”技術路徑,以及在自動駕駛行業(yè)長期深耕的積累與實踐,并表示未來將沿著多模態(tài)大模型的道路,去進一步推動自動駕駛的進步。
所以這篇論文不只是學術上一次舌戰(zhàn)群儒的勝利,更關鍵的是它將成為自動駕駛大漠臺多模型落地的標志,繼續(xù)發(fā)揮它的應用價值,去推動實現(xiàn)更高階的自動駕駛?cè)斯ぶ悄?。期待國?nèi)自動駕駛行業(yè)再次實現(xiàn)擊敗全球99.99%對手的進度條!
關鍵詞:
相關閱讀
-
每日短訊:學術界圣地,給國內(nèi)自動駕駛...
我們?nèi)祟愰_車時的思路通常是“堵車了,我得剎停”,而自動駕駛車的... -
交通銀行晉城礦區(qū)支行開展金融知識萬里...
為提升金融消費者風險防范意識和能力,近日,交通銀行晉城礦區(qū)支行重點圍 -
快資訊:廣元市青川縣市場監(jiān)管局開展首...
功由才成,業(yè)由才廣。青年是黨和國家事業(yè)永續(xù)發(fā)展、后繼有人的關鍵,廣 -
【一統(tǒng)十聯(lián)“一把手”談營商?】以高站...
大河網(wǎng)訊今年以來,鄭州航空港區(qū)把優(yōu)化營商環(huán)境作為助推“二次創(chuàng)業(yè)... -
環(huán)球?qū)崟r:上海農(nóng)商銀行成立滬上首個總...
6月21日,上海農(nóng)商銀行科技金融事業(yè)部正式揭牌,成為上海地區(qū)銀行業(yè)首 -
【天天熱聞】一文盤點北交所開市以來交...
那些交投活躍的個股,有共性可言嗎?在當前經(jīng)濟探底重整的宏觀形勢下, -
4060德國售價曝光:339歐元
帕利特在上個月已經(jīng)宣布了其RTX4060Dual系列,這是在英偉達將發(fā)布日期 -
阿爾巴尼亞針法教程 世界熱消息
一、阿爾巴尼亞針法教程編織方法:1、后領(即門襟):別線起針法用12 -
每日動態(tài)!43國外籍人士“龍騰海河”過端午
中新社天津6月22日電(張少宣)天津市第九屆市民運動會龍舟比賽暨2023年 -
《泉州晚報》關注惠安:“以地為紙” ...
6月22日,《泉州晚報》第3版刊發(fā)文章《惠安:“以地為紙”描繪發(fā)展... -
粽子香囊送旅客 端午濃情寄安康_當前滾動
“萋萋苦艾納香囊,傳承千年未泯香”。端午節(jié)是中華民族的傳統(tǒng)節(jié)日... -
《元和甲午歲》古詩鑒賞
樂樂學教研網(wǎng)精心為你收集整理了《元和甲午歲》古詩鑒賞(推薦10篇), -
麥卡錫反對快速彈劾拜登 天天報資訊
國會眾議院議長麥卡錫(KevinMcCarthy)周三敦促共和黨人反對其黨內(nèi)成 -
600130股票,600130股票002722
本文內(nèi)容是由小編為大家搜集關于600130股票,以及600130股票002722的資 -
環(huán)球微資訊!寧波大運河新規(guī)今起施行
【來源:寧波市人民政府_民生關注】浙東大運河江北姚江段。(邱文雄沈 -
【文明校園】執(zhí)筆書經(jīng)典 ·墨香滿校園...
為提高學生書寫素養(yǎng)和水平,豐富校園文化底蘊,創(chuàng)建文明校園,6月17日 -
2022年平均工資121641元 廈門人年平均...
平均工資124463元,同比增長4 2%。我市平均工資比全省水平高了17838元 -
杭州亞運會和亞殘運會物流中心啟用
本報杭州6月21日電(記者劉軍國、竇皓)杭州亞運會和亞殘運會物流中心21 -
端午佳節(jié),東湖聽濤開展憶屈原傳統(tǒng)民俗活動
端午佳節(jié),東湖聽濤開展憶屈原傳統(tǒng)民俗活動---湖北日報訊(記者嚴芳婷 -
應城開展全國“安全生產(chǎn)月”交通安全主...
應城開展全國“安全生產(chǎn)月”交通安全主題教育宣傳培訓---湖北日報客...