本文轉自【消費日報網】;
近日,在全球權威的ICDAR Robust Reading大賽榜單中,紫光華智憑藉領先的AI技術優勢,在文本行檢測與識別兩項任務中均斬獲第一,並一舉刷新榜單記錄,超越了榜單內其他知名AI公司和國內外學術研究機構,展現了紫光華智在自然場景文本檢測與識別領域的創新突破能力。
ICDAR-ReCTS:全球OCR領域權威大賽
自然圖像中的文本帶有許多重要的語義信息,對文本的自動檢測和識別也受到越來越多的關注。在街景招牌中,為了美觀或突出某些元素,招牌中的漢字排列方式和字體與其他場景存在明顯差異,排列方向不同、佈局分佈不規則、字體類型多樣等難題極大制約了文本檢測與識別的準確率。
ICDAR-ReCTS(International Conference on Document Analysis and Recognition)是首次提出大規模自然場景中英文招牌數據集的比賽,也是全球OCR領域最具挑戰性、權威性的比賽之一,涵蓋了各種複雜場景,吸引着眾多國內外知名AI企業、學術研究機構參與。
紫光華智:以創新突破AI技術邊界
為提升自然場景文本檢測與識別能力,紫光華智基於深度學習算法,充分運用多層特徵融合、跨層連接等技術,將不同級別特徵結合,並運用文本注意力塊來捕捉像素的長範圍相關性以獲得更可靠分割結果;同時,結合多尺度融合、注意力機制、多模型融合等先進技術及基礎數據分析,對難例樣本進行數據增強,實現了對圖片像素低、質量差、藝術字體等識別效果的大幅提升。顯著提高了自然場景文本檢測與識別準確度,併成功躍居檢測與識別兩項榜單榜首。
技術與應用融合,使AI服務於實戰
作為領先的AI視覺產品和解決方案提供商,紫光華智不僅注重核心技術的研發與投入,更注重技術與實際場景的融合應用,構築二者間的相互進化機制,使技術真正服務於實戰,通過實戰反哺技術進化。
面對不同業務場景的實際需求,紫光華智將領先的文本檢測與識別技術充分應用。
在道路交通場景,非機動車管理費神費力,不同地區非機動車牌格式和文本字符差異巨大,紫光華智車牌識別算法可自動讀取車牌信息,實現非機動車的智能化管理,同時有效遏制了非機動車偷盜事件的發生。針對機動車管理,紫光華智車牌識別算法為監管部門在交通違法識別、高速違停等違法事件管理提供了有效幫助。
在教育、金融等場景,不同證件票據格式不一,字符類型多樣,字段長短不一,識別難度巨大。紫光華智文本識別算法可精確讀取證件票據的文本信息,避免了人工手動錄入產生的錯誤,同時大幅提升了輸入工作效率,提高了工作智能化水平。
在城市街道中,沿街商鋪為了吸引客户存在設置多個招牌、招牌顏色各異、招牌大小不一、隨意變更招牌等問題,不僅影響市容市貌也存在安全隱患。紫光華智街面OCR識別算法可準確識別不同招牌的文本和語義信息,提升城市智能化管理能力和效率,助力城市精細化管理。
除此之外,紫光華智也在積極佈局企業、醫療、能源等更多行業場景,充分發揮AI核心技術優勢,不斷拓寬和挖掘AI技術應用的廣度與深度,推進技術成果向實戰價值的有效轉化,覆蓋更多行業需求,助力百行百業實現數字化轉型。