智能終端的圖像功能日益豐富,各種好玩的、有趣的圖像效果層出不窮。不可避免的,複雜的圖像處理算法以及AI深度學習功能的集成,對手機性能和續航能力的要求也越來越高。
紫光展鋭2019年8月發佈的4G移動平台虎賁T618,8核架構,集成了視覺信息處理器(以下簡稱VDSP),將更好的滿足高要求的邊緣視覺和AI處理需求。
多個VDSP,有啥不一樣?VDSP不僅能針對圖像和AI處理任務加速運算,為性能加速,同時會顯著降低終端的功耗。
先來張簡潔明瞭的規格表重温下虎賁T618:
可以看到,AI的參數一欄,虎賁T618配置了具有強大運算能力的專用VDSP,可以更好的解決複雜的Camera視覺和AI處理任務。
VDSP最重要的特性是支持寬向量的SIMD(單指令多數據),VDSP能通過一條指令來並行處理大量的數據流,圖像處理、視頻處理、計算視覺、虛擬現實、增強現實等功能的實現都需要用到這一點。在獲得高性能計算的情況下,VDSP還具有低功耗優勢,與ISP(圖像信號處理)結合,可獲得更多差異化的性能體驗,比如HDR(高動態範圍圖像)和FDR(全動態範圍圖像)。
通過專門的VDSP相比通過CPU來處理圖像和視頻等大數據流,兩者能有多大差異?速度和功耗兩方面都有顯示優勢。以經典輕量級圖像語義分割模型deeplabV3模型為例,(這是一種非常先進的基於深度學習的圖像語義分割方法,可對物體進行像素級分割)。
輸入分辨率為512×512,實測VDSP和CPU的不同功耗及性能數據如下:
從測試數據可以看出,對密集乘加運算:4個 CPU核心全速運行帶來的功耗,大約是1個VDSP核全速運行的4倍。VDSP處理模型速度快2.5倍。能效比上,VDSP是CPU 4核的10倍!
與同樣定位中端處理器的高通驍龍665相比,虎賁T618因為有了VDSP的加持,在性能和功耗處於絕對優勢,説吊打競品毫不誇張。
如下圖所示:
如上圖所示,虎賁T618的VDSP處理模型速度是驍龍665的1.2倍,最快高達2.2倍。僅特定模型上,VDSP處理的速度比驍龍665略慢。説明不同的VDSP對算子的支持計算會有差別。
從功耗層面對比,虎賁T618的優勢也非常明顯, VDSP處理模型的功耗都低於驍龍665,值得注意的是,部分模型的功耗僅有驍龍665的十分之六。
從能效比層面看,四個模型綜合對比下來,驍龍665的VDSP平均功耗是虎賁T618的 1.25倍。虎賁T618的處理模型平均速度比驍龍665快1.28倍,能效比是驍龍665的1.6倍!
虎賁T618不僅針對AI應用,在HDR、實時美顏、語義分割等應用上,性能上有更好的提升。虎賁T618提供的實時人像背景替換,滿足了趣味換景、視頻會議濾除換景等個性化需求。
虎賁T618由VDSP加持可提供實時美顏,滿足短視頻實時美顏需求,再加上HDR/FDR算法加速,可以拍出高動態、高清晰度的超高畫質圖像。