商湯科技推出首個“感知決策一體化”自動駕駛通用大模型
6月18日-22日,全球計算機視覺盛會CVPR 2023(Computer Vision and Pattern Recognition)在加拿大溫哥華舉行。本屆CVPR論文投稿總量達9155篇,最終共有2369篇論文被接收。最佳論文候選為12篇,接收率僅為0.13%。
商湯兩篇論文登上最佳論文候選名單(Award Candidate),其中自動駕駛研究論文《Planning-oriented Autonomous Driving》(以路徑規(guī)劃為導向的自動駕駛)斬獲本屆CVPR最佳論文獎(Best Paper Award)。
(資料圖片僅供參考)
這是CVPR歷史上第一篇以自動駕駛為主題的最佳論文,該論文首次提出感知決策一體化的自動駕駛通用大模型UniAD,開創(chuàng)了以全局任務為目標的自動駕駛大模型架構先河, 標志著自動駕駛技術的重要突破, 為自動駕駛技術與產(chǎn)業(yè)的發(fā)展提出了新的方向。
CVPR 2023最佳論文,自動駕駛研究獲重要突破
自動駕駛技術高度復雜,需要融合多學科領域的知識和技能,包括傳感器技術、機器學習、路徑規(guī)劃等方面。自動駕駛還需要適應不同的道路規(guī)則和交通文化,與車輛和行人進行良好交互,以實現(xiàn)高度可靠和安全的自動駕駛系統(tǒng)。大部分自動駕駛相關的工作都聚焦在具體的某個模塊,缺少能夠?qū)崿F(xiàn)端到端聯(lián)合優(yōu)化的通用網(wǎng)絡模型。
論文提出的自動駕駛通用算法框架——Unified Autonomous Driving(UniAD)首次將檢測、跟蹤、建圖、軌跡預測,占據(jù)柵格預測以及規(guī)劃整合到一個基于Transformer 的端到端網(wǎng)絡框架下,更高效契合了“多任務”和“高性能”的特點,取得自動駕駛技術研究重要突破。
商湯科技聯(lián)合創(chuàng)始人、首席科學家、絕影智能汽車事業(yè)群總裁王曉剛表示,UniAD是業(yè)內(nèi)首個感知決策一體化的端到端自動駕駛解決方案,并且整體系統(tǒng)和性能取得大幅提升,代表了未來自動駕駛技術的發(fā)展趨勢。
這種端到端的優(yōu)化在多項關鍵技術指標上超越了SOTA。比如,多目標跟蹤準確率超越SOTA 20%,車道線預測準確率提升30%,預測運動位移誤差降低38%,規(guī)劃誤差降低28%。
UniAD 是一項極具創(chuàng)新性的自動駕駛技術,且因其具有很大的潛力和應用價值,目前在學術界和工業(yè)界都引起了廣泛興趣和關注。
隨著通用人工智能(AGI)引領的二次革命的到來,以此為基礎,期待在未來能推動實現(xiàn)更高階的自動駕駛人工智能。
CVPR 2023最佳論文候選,加速推動AIGC時代真實感3D內(nèi)容生成
面向真實 3D 物體的感知、理解、重建與生成是計算機視覺領域一直倍受關注的問題。由于缺乏大規(guī)模的真實掃描三維數(shù)據(jù)庫,最近在三維物體建模方面的進展大多依賴于合成數(shù)據(jù)集。
為促進現(xiàn)實世界中3D感知、重建和生成的發(fā)展,論文《OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D,一個具有大規(guī)模高質(zhì)量真實掃描3D物體的大型詞匯3D物體數(shù)據(jù)集,覆蓋近200個類別、約6000個三維物體數(shù)據(jù),包括高精表面網(wǎng)格、點云、多視角渲染圖像和實景采集的視頻,借助專業(yè)掃描設備保證了物體數(shù)據(jù)的精細形狀和真實紋理。
OmniObject3D是目前學界最大的真實世界三維掃描模型數(shù)據(jù)集,為未來三維視覺研究提供了廣闊空間。
利用該數(shù)據(jù)集,研究人員精心探討了點云識別、神經(jīng)渲染、表面重建、三維生成等多種學術任務的魯棒性和泛化性,驗證其從感知、重建、到生成領域的開放應用前景,有望在AIGC 時代推動真實感3D生成方面發(fā)揮至關重要的作用。持續(xù)引領前沿創(chuàng)新,是商湯在以大裝置SenseCore和大模型為核心的AI基礎設施領域長期投入,并堅持產(chǎn)學研協(xié)同創(chuàng)新的成果。
王曉剛教授認為,在大算力、大數(shù)據(jù)的支撐下,大模型將以更強大的通用能力引發(fā)人工智能領域的巨大變革,同時也會拓展我們的研究視野,激發(fā)新一輪研究范式革新。
自今年4月初“商湯日日新SenseNova”大模型體系公布以來,商湯的大模型已在氣象預報、遙感解譯、開放環(huán)境中的決策問題等領域取得了諸多突破性成就。未來,商湯將繼續(xù)與產(chǎn)學研各界共同擁抱和探索大模型帶來的范式革新,為AI的前沿探索開拓新方向和新路徑。
關鍵詞:
相關閱讀
-
商湯科技推出首個“感知決策一體化”自...
6月18日-22日,全球計算機視覺盛會CVPR2023(ComputerVisionandPattern -
湖北高院發(fā)布打擊毒品犯罪五大典型案例
湖北高院發(fā)布打擊毒品犯罪五大典型案例---6月26日,湖北省高級人民法院 -
【天天新要聞】天山股份(000877.SZ):擬...
格隆匯6月27日丨天山股份(000877 SZ)公布,公司于2023年6月27日與關聯(lián) -
供需面趨弱且成本難有大漲表現(xiàn) 預計短...
【行情復盤】:上周三,震蕩。F308收于7126,漲34元 噸,漲幅0 48%。更 -
紅河開遠:“兩污”治理提高城鄉(xiāng)“顏值”
近年來,云南省紅河哈尼族彝族自治州開遠市深入打好污染防治攻堅戰(zhàn),集 -
據(jù)俄新社27日報道,俄羅斯總統(tǒng)普京稱,...
據(jù)俄新社27日報道,俄羅斯總統(tǒng)普京稱,俄政府在2022年5月至2023年5月向 -
山系女孩最愛?長安馬自達CX-50行也帶你...
山系女孩最愛?長安馬自達CX-50行也帶你玩轉山系生活 -
天天速遞!鄭眼看盤丨本幣升值,A股應聲...
周二A股各大指數(shù)普漲。截至收盤,上證綜指漲1 23%至3189 44點。深綜指 -
韓國“薩德”部署地民眾持續(xù)抗議 強烈...
△當?shù)貢r間6月22日,來自韓國“薩德”反導系統(tǒng)部署地——星州郡以... -
全球新消息丨中國女排公布世聯(lián)賽韓國站...
2023年世界女排聯(lián)賽第三周韓國水原站的比賽將于6月27日至7月2日舉行。 -
2023年9月北京市全國計算機等級考試報考...
全國計算機等級考試(NationalComputerRankExamination,簡稱NCRE), -
環(huán)球熱點評!世聯(lián)賽第三站今日打響 中...
6月27日,2023年世界女排聯(lián)賽(以下簡稱“世聯(lián)賽”)韓國水原站的比... -
環(huán)球聚焦:山東多元文旅消費場景帶火端午游
走,避暑去!當端午節(jié)遇上高溫天氣,人們出游率先鎖定消夏避暑地。記者 -
免費招募!逐浪世博,騎行濱江……小體...
雨水與夏日一起到來,又到放肆玩水的季節(jié),上次小體邀你一起參加了四月 -
becase意思(beca se) 世界微資訊
大家好,小福來為大家解答以上的問題。becase意思,becase這個很多人還 -
新聞1+1丨高考填報志愿,今年怎么選?
截至26日,今年全國31個省區(qū)市的高考錄取控制分數(shù)線都已公布。如何報考 -
【全球時快訊】天津9宗地收金122.6億 ...
6月27日,天津9宗宅地完成出讓,包括市區(qū)2宗,環(huán)城7宗。其中,僅1宗觸 -
聲調(diào)符號應標在韻母上才是正確的(聲調(diào)...
來為大家解答以上的問題。聲調(diào)符號應標在韻母上才是正確的,聲調(diào)符號這 -
一圖看懂vivo X90s 配置全面升級3999起
今天下午,vivo正式發(fā)布了全新機型vivoX90s,新款產(chǎn)品為我們帶來了貼合 -
讓科技賦能再生資源 克林泰爾工程技...
讓科技賦能再生資源克林泰爾工程技術中心成立---近日,安徽克林泰爾環(huán)