http://m.kblhh.cn 2025-11-27 14:59 來(lái)源:米爾電子
一、 項(xiàng)目背景與測(cè)試平臺(tái)
本次360環(huán)視系統(tǒng)原型基于米爾科技MYD-LR3576開(kāi)發(fā)板進(jìn)行構(gòu)建與評(píng)估。該開(kāi)發(fā)板所搭載的瑞芯微RK3576芯片,集成了4核Cortex-A72、4核Cortex-A53、Mali-G52 GPU及高達(dá)6TOPS算力的NPU。本文旨在通過(guò)實(shí)際測(cè)試數(shù)據(jù),從功能實(shí)現(xiàn)、實(shí)時(shí)性能與AI拓展?jié)摿θ蠛诵木S度,為客戶(hù)提供一份關(guān)于該平臺(tái)在360環(huán)視應(yīng)用中能力的真實(shí)參考。
二、 系統(tǒng)流程與功能實(shí)現(xiàn)

圖:程序流程圖
一套標(biāo)準(zhǔn)的360環(huán)視處理流水線(xiàn)已在開(kāi)發(fā)板上成功實(shí)現(xiàn),驗(yàn)證了其功能可行性:
1.傳感器配置: 4路720P分辨率魚(yú)眼攝像頭,精確固定于模擬車(chē)輛的四周。
2.核心處理流水線(xiàn):
畸變矯正: 利用張正友標(biāo)定法預(yù)先獲取攝像頭內(nèi)參和畸變系數(shù),實(shí)時(shí)消除魚(yú)眼鏡頭產(chǎn)生的圖像扭曲。
投影變換: 通過(guò)預(yù)設(shè)的單應(yīng)性矩陣(Homography Matrix),將矯正后的透視圖像轉(zhuǎn)換為統(tǒng)一的俯瞰視角鳥(niǎo)瞰圖。
圖像拼接: 依據(jù)預(yù)先標(biāo)定的位置關(guān)系,將四張鳥(niǎo)瞰圖無(wú)縫合成為一張完整的360°全景俯視圖。
顯示: 為快速驗(yàn)證核心流程,目前采用OpenCV imshow函數(shù)進(jìn)行結(jié)果顯示,已知其效率非最優(yōu),后續(xù)將優(yōu)化為DRM/KMS等低延遲工業(yè)級(jí)方案。
畸變矯正前:

畸變矯正后:

投影視圖:

圖像拼接效果:

360環(huán)視視頻效果演示:
三、 性能實(shí)測(cè):CPU與GPU的算力博弈
性能是決定方案能否商用的關(guān)鍵。我們以行業(yè)通用的25fps(即每幀處理間隔40ms)作為實(shí)時(shí)性標(biāo)準(zhǔn),在米爾MYD-LR3576開(kāi)發(fā)板上對(duì)數(shù)據(jù)處理管線(xiàn)進(jìn)行了精細(xì)的性能剖析,關(guān)鍵數(shù)據(jù)對(duì)比如下:
圖:CPU負(fù)載情況

圖:GPU負(fù)載情況


深度性能分析:
CPU方案:功能完整,但實(shí)時(shí)性無(wú)望
如上表數(shù)據(jù)所示,當(dāng)所有處理任務(wù)均由CPU承擔(dān)時(shí),總耗時(shí)高達(dá)170ms,遠(yuǎn)超40ms的預(yù)算。其中,計(jì)算密集型的圖像拼接成為絕對(duì)的性能瓶頸,幾乎占滿(mǎn)了所有A72大核的資源。這不僅導(dǎo)致系統(tǒng)無(wú)法實(shí)時(shí)處理視頻流,造成嚴(yán)重卡頓和延遲,也使得CPU再無(wú)余力處理其他系統(tǒng)任務(wù),此方案不具備產(chǎn)品化價(jià)值。
GPU方案:潛力巨大,穩(wěn)定性是當(dāng)前關(guān)鍵瓶頸
卓越的算力體現(xiàn): 在畸變矯正和投影變換環(huán)節(jié),Mali-G52 GPU展現(xiàn)了其強(qiáng)大的并行計(jì)算能力,耗時(shí)相比CPU降低了數(shù)倍至一個(gè)數(shù)量級(jí),且占用率較低,證明其處理此類(lèi)像素級(jí)操作的高效性。
拼接環(huán)節(jié)的性能波動(dòng): 圖像拼接的耗時(shí)在16ms到100ms之間劇烈波動(dòng),這是阻礙當(dāng)前方案投入實(shí)用的核心問(wèn)題。GPU占用率的相應(yīng)大幅變動(dòng),暗示了問(wèn)題根源。
根因推測(cè)與進(jìn)展: 這種波動(dòng)極有可能源于GPU內(nèi)部的內(nèi)存管理機(jī)制,如圖像數(shù)據(jù)在顯存中的頻繁拷貝、同步等待或驅(qū)動(dòng)調(diào)度開(kāi)銷(xiāo)。我們已將此性能波動(dòng)問(wèn)題作為高優(yōu)先級(jí)案例提交給瑞芯微原廠技術(shù)支持。若能通過(guò)驅(qū)動(dòng)或底層優(yōu)化將拼接時(shí)間穩(wěn)定在16ms的理想?yún)^(qū)間,則整個(gè)GPU處理管線(xiàn)可在25ms內(nèi)完成,完全滿(mǎn)足一幀內(nèi)的處理需求。
四、 未來(lái)拓展:釋放NPU算力,實(shí)現(xiàn)從“看到”到“理解”的飛躍
當(dāng)GPU處理管線(xiàn)優(yōu)化完成后,我們將獲得一個(gè)極具吸引力的系統(tǒng)狀態(tài):充裕的時(shí)間預(yù)算和富余的CPU資源。這為集成更高價(jià)值的AI功能奠定了堅(jiān)實(shí)基礎(chǔ)。
剩余時(shí)間預(yù)算分析:
在25fps幀率下,系統(tǒng)必須在40ms內(nèi)完成一幀的所有處理。假設(shè)GPU流水線(xiàn)穩(wěn)定在25ms完成環(huán)視基礎(chǔ)處理,那么系統(tǒng)還剩下約15ms的時(shí)間裕度。
NPU的用武之地:
這15ms的寶貴時(shí)間,正是留給RK3576內(nèi)置的6TOPS NPU大顯身手的舞臺(tái)。我們可以利用這部分算力,在環(huán)視全景圖或原始魚(yú)眼圖上并行運(yùn)行輕量化的AI模型,實(shí)現(xiàn)功能的全面升級(jí),例如:
障礙物檢測(cè)與識(shí)別: 精準(zhǔn)識(shí)別車(chē)輛周?chē)男腥恕④?chē)輛、錐桶等障礙物。
空間距離估算: 基于俯視圖的幾何關(guān)系,實(shí)時(shí)計(jì)算識(shí)別出的物體與車(chē)身的精確距離。
主動(dòng)預(yù)警系統(tǒng): 當(dāng)距離低于安全閾值時(shí),立即觸發(fā)聲音或視覺(jué)警報(bào),實(shí)現(xiàn)真正的主動(dòng)安全功能。
總結(jié)與展望

圖:米爾基于RM3576開(kāi)發(fā)板
功能實(shí)現(xiàn): 基于米爾MYD-LR3576開(kāi)發(fā)板的RK3576平臺(tái)完全具備實(shí)現(xiàn)高質(zhì)量360環(huán)視全鏈路功能的能力。
實(shí)時(shí)性能: 純CPU方案無(wú)法滿(mǎn)足25fps實(shí)時(shí)需求。GPU方案擁有足夠的算力潛力,但其執(zhí)行的穩(wěn)定性是當(dāng)前能否商用的關(guān)鍵挑戰(zhàn)。
方案潛力與價(jià)值: 一旦GPU性能穩(wěn)定,RK3576憑借其異構(gòu)計(jì)算架構(gòu)(CPU+GPU+NPU),能夠在一幀時(shí)間內(nèi)不僅完成環(huán)視合成,更能集成復(fù)雜的AI感知與預(yù)警功能。這使其從一個(gè)單純的環(huán)視處理器,升級(jí)為一個(gè)高集成度、高附加值的智能視覺(jué)平臺(tái)。