隨著智能化技術(shù)的發(fā)展,駕駛輔助系統(tǒng)(ADAS)正從單純的目標(biāo)識別,逐步向?qū)?fù)雜交通場景的理解與風(fēng)險預(yù)判能力演進(jìn)。近年來,生成式人工智能(Generative AI)與視覺語言模型(VLM)的發(fā)展,為車輛環(huán)境感知提供了新的技術(shù)路徑。圍繞這一方向,電裝正推進(jìn)相關(guān)技術(shù)開發(fā),通過生成式AI提升駕駛輔助系統(tǒng)對道路風(fēng)險的識別與分析能力。

從目標(biāo)識別到場景理解

在真實(shí)道路環(huán)境中,交通風(fēng)險并不總是直接可見。車輛、行人、自行車等交通參與者可以通過圖像識別技術(shù)進(jìn)行檢測,但其行為意圖以及可能產(chǎn)生的潛在風(fēng)險,則往往需要結(jié)合交通環(huán)境與場景關(guān)系進(jìn)行綜合判斷。

例如,在交叉路口附近,接近的車輛是否可能并線、??寇囕v后方是否可能出現(xiàn)行人等情況,都是駕駛過程中需要提前關(guān)注的風(fēng)險因素。這類判斷不僅依賴于對物體的識別,還需要對整體交通場景進(jìn)行理解。

傳統(tǒng)視覺識別模型在物體檢測和分類方面已經(jīng)具備較高能力,但在復(fù)雜場景語義理解方面仍存在提升空間?;诖?,電裝在技術(shù)開發(fā)過程中引入生成式AI模型,通過結(jié)合圖像信息與語言理解能力,對交通場景進(jìn)行更深入的語義分析。

通過生成式AI進(jìn)行風(fēng)險推測

在技術(shù)開發(fā)過程中,團(tuán)隊將風(fēng)險識別任務(wù)拆分為兩個層面:

一是對圖像中已經(jīng)出現(xiàn)的交通參與者進(jìn)行識別與狀態(tài)判斷,即“顯性風(fēng)險識別”;

二是結(jié)合道路環(huán)境和場景信息,對可能出現(xiàn)的潛在危險進(jìn)行推測,例如遮擋區(qū)域或可能發(fā)生的合流、突發(fā)行為等,即“潛在風(fēng)險預(yù)測”。

在此基礎(chǔ)上,模型不僅需要識別交通參與者,還需要以自然語言形式描述風(fēng)險類型及其原因,并生成相應(yīng)的駕駛策略提示。

在此基礎(chǔ)上,系統(tǒng)能夠在傳統(tǒng)視覺識別基礎(chǔ)上進(jìn)一步理解交通場景的語義關(guān)系,從而對潛在風(fēng)險進(jìn)行更加全面的判斷。

構(gòu)建更接近人類駕駛邏輯的模型評估

在模型開發(fā)過程中,電裝對多種生成式AI模型進(jìn)行了性能評估,并通過圖像識別基準(zhǔn)數(shù)據(jù)集開展對比測試。

研究團(tuán)隊發(fā)現(xiàn),傳統(tǒng)基于詞序匹配和詞頻統(tǒng)計的自然語言評價方法,在評估交通場景描述時難以充分反映語義層面的理解能力。因此,在評價體系中引入了基于語義相似度的評估方法,以更準(zhǔn)確地衡量模型生成內(nèi)容與場景描述之間的語義一致性。

同時,為提升訓(xùn)練數(shù)據(jù)質(zhì)量,研究團(tuán)隊邀請多名標(biāo)注人員對同一交通場景進(jìn)行獨(dú)立描述,并在此基礎(chǔ)上建立參考標(biāo)準(zhǔn)。通過綜合不同表達(dá)方式中的共性信息,模型在語義理解層面能夠更加接近人類駕駛員的判斷邏輯。

面向車載環(huán)境的系統(tǒng)優(yōu)化

在完成模型訓(xùn)練與驗(yàn)證后,研究團(tuán)隊還對算法進(jìn)行了面向車載應(yīng)用的優(yōu)化。由于車載系統(tǒng)在計算資源與功耗方面存在特定條件,相關(guān)算法需要針對車載計算平臺進(jìn)行適配。

為此,電裝通過模型量化等技術(shù)手段對生成式AI模型進(jìn)行優(yōu)化,以適應(yīng)車載SoC的運(yùn)行環(huán)境,并對處理效率和系統(tǒng)運(yùn)行穩(wěn)定性進(jìn)行了綜合驗(yàn)證。

通過相關(guān)技術(shù)開發(fā),生成式AI與視覺識別技術(shù)的結(jié)合,正為駕駛輔助系統(tǒng)能力提升提供新的技術(shù)路徑。

推動駕駛輔助技術(shù)向風(fēng)險預(yù)判發(fā)展

在復(fù)雜交通環(huán)境中,許多潛在風(fēng)險往往隱藏在場景關(guān)系和行為變化之中。如何從“識別目標(biāo)”進(jìn)一步發(fā)展到“理解場景、預(yù)測風(fēng)險”,正成為駕駛輔助技術(shù)的重要發(fā)展方向。

通過將生成式AI與視覺識別技術(shù)相結(jié)合,電裝正在推進(jìn)更加貼近人類駕駛經(jīng)驗(yàn)的風(fēng)險識別方法研發(fā),使系統(tǒng)不僅能夠識別道路環(huán)境中的交通參與者,還能夠?qū)撛陲L(fēng)險進(jìn)行提前判斷,為更加安心的移動出行環(huán)境創(chuàng)造新的價值。

電裝公司簡介

電裝是世界先進(jìn)的汽車零部件生產(chǎn)廠家之一。在美國《財富》雜志發(fā)布的2025年世界500強(qiáng)企業(yè)中排名第325名。一直以來電裝都專注于電動化、組合輔助駕駛、智能網(wǎng)聯(lián)等技術(shù)創(chuàng)新、致力于解決汽車行業(yè)面臨的挑戰(zhàn)和社會課題。目前在全球廣泛應(yīng)用的二維碼就是電裝在1994年發(fā)明并無償公開的。

在中國,電裝于1994年在煙臺成立了第一家合資生產(chǎn)企業(yè)。作為在中國的統(tǒng)括公司——電裝(中國)投資有限公司,成立于2003年,目前在國內(nèi)設(shè)有生產(chǎn)公司、銷售公司以及軟件開發(fā)公司等共計30多家關(guān)聯(lián)企業(yè)。