隨著深度學習在多個人工智能的細分領域日趨成熟化和規?;?,多模態融合正成為人工智能研究新的熱點方向和趨勢。近期,汽車之家人工智能算法團隊在今年TextCaps任務中CIDEr獲得了98.59分的成績,名次僅次于微軟,斬獲全球亞軍。
TextCaps是Facebook發布的一個大型的圖像閱讀理解任務,該項比賽囊括了圖像識別、圖像描述、圖像字幕等多個圖像領域最前沿的任務,一經宣布就吸引了眾多國內外的學術專家以及科研團隊參加。汽車之家代表隊在眾多來自全球的算法團隊角逐中脫穎而出,在所有參加團隊中排名第二、國內參加團隊中排名第一,充分展現了汽車之家在高科技研究中攻堅克難的匠心精神。
Text-Caption是一個涉及圖像中視覺信息和文字信息的多模態任務,其目的是對一張圖片生成一句涵蓋其所有信息的文字描述。它不僅需要利用模型去理解圖片的內容,還需要用自然語言去表達它們之間的關系,需要參賽者在CV(Ocr、Object Detection)、NLP(Text Generation)、Model Fusion等領域都具備很高的專業知識,具有很高的挑戰性。
基于公司的海量數據,汽車之家人工智能算法團隊在語音、視覺、NLP等技術方向均積累了大量的應用經驗,并基于人工智能多模態技術的領先優勢賦能公司數據產品研發,在知識庫構建、培訓系統開發和智能生成等場景中廣泛應用。以智能培訓平臺為例,該平臺旨在滿足主機廠新車發布后培訓經銷商銷售能力的需求,結合汽車之家和平安集團的數據及技術優勢,將人工智能多模態技術應用于智能陪練、防作弊、問答機器人3大場景模塊。
隨著公司創新業務的大力發展,越來越多的場景需要人工智能技術的加持,例如視頻資源的結構化分析、視頻/圖片中文本知識結構化提取存儲、通話中的語義理解等。汽車之家將科技軟實力作為公司數字化的基石,其技術團隊在多模態方向的技術積累與突破,不僅為公司的“生態化”戰略推進打造技術護城河,同時為公司創新業務發展與賦能行業數字化轉型提供了堅實后盾。