“過去60年來人工智能研究的一大弱點就是視覺知識研究的不足。這是一片充滿希望、值得探索的‘無人區’。”2020全球人工智能技術大會此間在浙江杭州舉行。中國工程院院士潘云鶴在會上稱,視覺知識和多重知識表達研究是發展新的視覺智能的關鍵,也是促進人工智能2.0取得重要突破的關鍵理論與技術。
2015年,中國工程院專門設立“中國人工智能2.0發展戰略研究”重大咨詢項目,其發展規劃主要包括大數據智能、群體智能、跨媒體智能、人機混合增強智能和自主智能系統等五方面內容。
其中,跨媒體智能已經興起。潘云鶴表示,在語言、視覺、圖形和聽覺之間達成語義貫通,是實現聯想、推理、概括的重要關鍵。
“以視覺知識為例,認知心理學研究指出,人類記憶的視覺知識要遠多于言語知識。視覺知識因為難以用語言符號表達,曾被統歸為常識。比如看到一只杯子就去拿過來喝水,人類在5歲之前學到的多為視覺知識。”潘云鶴說。
在他看來,視覺知識的獨特優勢是具有形象的綜合生成能力,時空比較能力和形象顯示能力,這些正是字符知識和DNN(深度神經網絡)所缺乏的,其能在創造、預測和人機融合等方面對人工智能新發展提供新的基礎動力。因此人工智能、計算機圖形學和計算機視覺這三個領域的研究者特別需要聯手研究視覺知識。
“我們相信,人工智能2.0沿著研究視覺知識的方向發展,一定能促進中國科技、經濟與社會走向更高質量與水平的快速發展期。”潘云鶴說。