東芝電子元件及存儲裝置株式會(huì )社(“東芝”)今日宣布成功開(kāi)發(fā)出一款汽車(chē)應用圖像識別系統級芯片(SoC),與東芝上一代產(chǎn)品相比,該產(chǎn)品使深度學(xué)習加速器的速度提升10倍,功率效率提高4倍[1]。該技術(shù)成果的詳情于2月19日在舊金山舉行的2019 IEEE國際固態(tài)電路會(huì )議(ISSCC)上公諸于眾。
自動(dòng)緊急剎車(chē)等先進(jìn)駕駛員輔助系統可提供越來(lái)越先進(jìn)的功能,但實(shí)現這些功能需要圖像識別系統級芯片在低功耗條件下高速識別道路交通信號和路況。
深度神經(jīng)網(wǎng)絡(luò )(DNN)是模仿大腦神經(jīng)網(wǎng)絡(luò )的算法,與傳統模式識別和機器學(xué)習相比,DNN的識別處理精度要高得多,預計將會(huì )在汽車(chē)應用領(lǐng)域得到廣泛應用。而采用傳統處理器的DNN圖像識別耗時(shí)較長(cháng),因為它依賴(lài)大量的乘積累加(MAC)計算。同時(shí),采用傳統高速處理器的DNN還存在功耗過(guò)高問(wèn)題。
東芝利用可在硬件上實(shí)現深度學(xué)習的DNN加速器解決了這一難題。它具有三大特點(diǎn)。
- 并行MAC單元。DNN處理需要大量MAC計算。東芝的新設備配有四個(gè)處理器,每個(gè)處理器包含256個(gè)MAC單元。因此提高了DNN的處理速度。
- 減少了動(dòng)態(tài)隨機存取存儲器(DRAM)存取。傳統的系統級芯片沒(méi)有本地內存,無(wú)法在靠近DNN執行單元的位置保存臨時(shí)數據,并且在訪(fǎng)問(wèn)本地內存時(shí)產(chǎn)生較大功耗。同時(shí),加載用于MAC計算的加權數據也會(huì )產(chǎn)生較大功耗。東芝新設備可在DNN執行單元附近執行靜態(tài)隨機存取存儲器(SRAM),并將DNN處理分為多個(gè)子處理塊,因此可將臨時(shí)數據保存在SRAM內,從而減少了DRAM存取。此外,東芝還在加速器上增加了一個(gè)解壓縮單元?赏ㄟ^(guò)解壓縮單元加載預先壓縮并存儲在DRAM中的加權數據。因此,降低了加載來(lái)自DRAM的加權數據時(shí)產(chǎn)生的功耗。
- 減少了SRAM存取。傳統深度學(xué)習需要在處理DNN的每一層之后訪(fǎng)問(wèn)DRAM,因此功耗過(guò)高。該加速器在DNN的DNN執行單元中設計有流水線(xiàn)層結構,以便在一次SRAM存取期間執行一系列DNN計算。
新系統級芯片符合全球汽車(chē)應用功能安全標準ISO26262的要求。
東芝將繼續提高所開(kāi)發(fā)的系統級芯片的功率效率和處理速度,且東芝下一代圖像識別處理器ViscontiTM5的樣品發(fā)貨將于今年九月啟動(dòng)。
注
|
[1]
|
|
東芝在2015 IEEE國際固態(tài)電路會(huì )議上發(fā)表的一篇論文《面向圖像識別應用采用基于顏色的對象分類(lèi)加速器的1.9TOPS與564GOPS/W異構多核系統級芯片》中提及的圖像識別系統級芯片
|