工信部印發(fā)《2022年第三批行業(yè)標準制修訂和外文版項目計劃》(以下簡稱《項目計劃》),騰訊云智能2項計算機視覺領域行業(yè)標準被列入計劃,分別為《人工智能-深度合成圖像系統(tǒng)技術規(guī)范》、《人工智能-智能字符識別技術要求》。此外,騰訊云智能還主導推動了《人工智能-深度合成圖像系統(tǒng)技術規(guī)范》的團體標準制定,這是目前國內第一個正式發(fā)布的AIGC團體標準。
標準體系的完善,對行業(yè)高質量發(fā)展具有重要的意義。致力于推動高質量發(fā)展,提升標準技術水平、創(chuàng)新能力和國際化程度,《項目計劃》作為工信部貫徹落實《國家標準化發(fā)展綱要》的重要計劃,持續(xù)建立健全滿足產業(yè)高質量發(fā)展的新型標準體系,是指導工業(yè)與信息化工作的基礎性、通用性標準,為市場創(chuàng)新提供參考指引,推動制造強國和網絡強國建設。
此次兩項行業(yè)標準獲立項,標志著騰訊云智能技術實力得到權威認可,走在行業(yè)前列。相關標準的制定,將有助于推進計算機視覺領域行業(yè)發(fā)展的可靠性、安全性、規(guī)范性,同時向外開拓行業(yè)應用和支撐產業(yè)發(fā)展的國際影響力,通過標準化來推動全球技術和產業(yè)的同步發(fā)展。
人工智能-深度合成圖像系統(tǒng)技術規(guī)范
AI內容生成中的深度合成技術可以實現(xiàn)換臉、人臉合成、語音合成、視頻生成甚至數(shù)字虛擬人等諸多應用,獲得了各界的廣泛關注。此項標準為國內深度合成圖像系統(tǒng)領域首個獲批立項的行業(yè)標準。騰訊云智能通過標準制定,可以有效規(guī)范深度合成圖像系統(tǒng)的功能和性能,并通過測試認證建立行業(yè)基線,引領技術發(fā)展,更好地滿足行業(yè)訴求。
人工智能-智能字符識別技術要求
目前,市場上出現(xiàn)了各種各樣基于AI的ICR應用以及基于ICR的AI應用,廣泛應用于復雜自然場景中印刷、手寫等各類文本字符的識別,以及對文件中的結構化對象進行識別和編碼等場景。但由于缺少針對ICR的功能、性能及其試驗方法等技術要求的統(tǒng)一標準,相關產品和服務的技術能力和質量水平參差不齊,導致成本虛耗、市場環(huán)境動蕩等問題?!綢CR(Intelligent Character Recognition,智能字符識別)就是在OCR的基礎上,植入深度學習的人工智能技術。】
基于此,騰訊云智能通過此項標準制定,不僅能為ICR邏輯結構提供一致性認知,也將面向各個行業(yè)、領域的ICR服務和基于ICR的AI系統(tǒng)應用,對其相關產品(軟硬件產品)和服務(SDK、SaaS)的功能和性能要求、評價方法提供統(tǒng)一規(guī)范,促進基于AI的ICR產品和服務市場、以及基于ICR的AI系統(tǒng)應用質量正向發(fā)展。
技術基礎支撐標準制定,騰訊云智能加速AI技術落地
依托于騰訊優(yōu)圖實驗等頂級實驗室多年的技術研究和落地探索,騰訊云智能已對外輸出超過300個標準化AI原子能力和80個AI解決方案,為數(shù)十萬家內外部客戶提供AI技術服務和豐富的計算機視覺產品組合。
例如,騰訊優(yōu)圖實驗室將多模態(tài)融合技術應用于計算機視覺研究,通過騰訊云智能為交通銀行提供多個場景下的視覺AI解決方案,可以快速處理圖像質量低、復雜版式的票據(jù)信息提取、資料印章干擾、手寫識別等問題,將人力從重復性的工作中釋放出來,提升銀行交易流程效率,提升用戶辦理業(yè)務體驗。
在算法研究方面,優(yōu)圖的研究成果多次在人工智能國際權威比賽中創(chuàng)造世界紀錄,擁有1600余項AI相關專利,發(fā)表頂會論文超過300余篇。在學術研究方面,優(yōu)圖公開發(fā)表的論文涵蓋ICCV,CVPR,AAAI等各類頂級會議,2023年已被國際CV頂級會議CVPR接受了20余篇論文。
過去一年,騰訊云智能已經在金融、傳媒、能源、交通、消費電子等諸多領域,圍繞決策智能、服務智能、研發(fā)智能和生活智能,構建產品工具和解決方案,助力“以人為本”的價值創(chuàng)新。未來,騰訊云智能將繼續(xù)沿著做厚平臺、做精應用、做深行業(yè)、做廣生態(tài)的戰(zhàn)略方向,助力各行各業(yè)擁有大算力、易開發(fā)、能落地的云端智能平臺,讓AI成為產業(yè)升級的“貼心”助手。