人工智能領域2023年是屬于“大模型”的一年
“百模大戰”搶灘智慧未來
如果你還沒有聽說過“大模型”,那么你的生活距離科技可能有點遠了。
(資料圖片僅供參考)
如果說去年人工智能領域的關鍵詞是“元宇宙”的話,那么2023年無疑是屬于“大模型”的一年。迄今,國內的科技公司、高校、研究機構已經發布了數十款人工智能大模型產品,“百模大戰”一觸即發。
在即將于上海舉行的2023世界人工智能大會上,也將匯聚國內外大模型明星團隊。其中,百度文心、阿里通義、華為盤古、訊飛星火、商湯日日新等30余個大模型悉數登場。大模型語料聯盟、測評平臺、測試標準及AIGC白皮書等一批重磅成果將在大會期間集中啟動或發布。
逐鹿“大模型”,會如何左右人工智能的發展,又最終會給生活帶來什么樣的影響?本屆大會,或許會給出一些答案。
1 “大力出奇跡”超普通用戶預期
很多人或許沒有在意,在去年的世界人工智能大會上,大模型已經悄然來到了我們身邊——中國科學院自動化研究所和華為聯合開發的全球首個三模態大模型“紫東太初”斬獲大會最高獎項SAIL獎,在工業質檢、影視創作和手語教學等領域展現不錯的能力。
但你要問普通人對“大模型”的認識,更多人會給出ChatGPT的答案。的確,自從發布之后,它在短短兩個月內就拿下了活躍用戶1億的成績,遠遠甩開了其他應用。ChatGPT寫詩、寫小說、敲代碼,幾乎無所不能,掀起一場人工智能風暴。ChatGPT之所以火出圈,特別之處在于,它能被普通用戶觀察到,并超過了人們對于人工智能的期待。
據業內人士分析,以ChatGPT為代表的大模型目前在多個方面有價值:幫用戶生成一段內容作為初稿,用戶再去修改;把信息有條有理地呈現出來,給用戶提供啟發和靈感;當然,還有娛樂的功能。
首屆世界人工智能大會或許是一道分水嶺。在它啟幕前,小模型是人工智能理解人類語言的主流技術,最為人熟知的可能就是下圍棋了——標注好數據,進入模型訓練。不過也好理解,小模型無法用于其他任務,數據標注成本也極高。當時的人工智能行業,在機器學習等諸多技術領域已然進入瓶頸。
后來,谷歌發表論文,引入自注意力機制學習文本,神經網絡需要學會自動判斷哪些詞語對理解句意最有幫助,而不是“全文死記硬背”,不再像過去一樣需要大量精標樣本,有人戲稱,大模型某種意義上是“大力出奇跡”的“暴力美學”——充分利用網上海量的未標注數據,模型的規模和能力得到顯著提高,加之大模型具有非常強的通用能力,只需經過少量參數微調,就可以用于不同任務。
科大訊飛董事長劉慶峰告訴記者,認知智能大模型的智慧涌現,有望改變現有的信息分發獲取方式、革新內容生產模式、全面升級人機交互方式以及加速“AI for Science”的發展,將有可能給整個社會帶來顛覆式影響。
2 考量因素不再“簡單粗暴”
可以說,人工智能大模型是在一夜之間熱得發燙的。
僅僅是去年,人工智能還因商業化困局而被外界詬病,而ChatGPT好似攪動大模型江湖的鯰魚,一時間,各類選手紛紛“下場”——《中國人工智能大模型地圖研究報告》顯示,截至6月,我國10億級參數規模以上大模型已發布79個,現已在大模型方面建立起涵蓋理論方法和軟硬件技術的體系化研發能力,形成緊跟世界前沿的大模型技術群。
移動互聯網時代的第一場硝煙彌漫的“千團大戰”,或許已經漸漸被人淡忘,而人工智能時代的“百模大戰”則將掀起又一次的持久戰:百度在今年3月16日發布了“文心一言”;阿里的“通義千問”從4月7日起開始企業內測;商湯科技在4月10日的技術交流會上推出“日日新”大模型體系;科大訊飛在5月6日舉行星火認知大模型成果發布會……
“百模大戰”之際,各家的大模型能力究竟幾何,是最令外界好奇的。以往,“大廠選手”會“簡單粗暴”地比拼參數量,可這個標準早已不能當作衡量大模型能力的唯一參考了。在中國工程院院士鄔賀銓看來,評價大模型水平應該是多維度的,全面性、合理性、使用便捷性、響應速度、成本、能效等。
盡管如何評價大模型的實力還缺乏統一標準,但大模型的能力已然可以通過學術層面的評估以見一斑——面向人類設計的高難度、綜合性考試被越來越多地引入對大模型的智能水平進行評測。
在今年高考首日,上海人工智能實驗室發布千億級參數大語言模型“書生·浦語”,聯合團隊選取了20余項評測對其進行檢驗,結果顯示:“書生·浦語”在多項中文考試中取得超越ChatGPT的成績,其中就包括中國高考各科目的數據集(GaoKao)。
上月下旬,商湯科技公布了自研中文語言大模型“商量2.0”在MMLU、AGIEval、CEval三個權威大語言模型評測基準的成績。根據評測結果,“商量2.0”在三個測試集中表現均領先ChatGPT,部分已十分接近GPT-4的水平。
“今天的大模型和昨天的大模型,是完全不同的兩個?!边@是記者在走訪研發大模型的科技企業時,聽到最多的一句話。
3 開放平臺帶來更繁榮生態
當下,生成式人工智能行業鮮花著錦,諸多大模型爭相問世,但其應用仍面臨能否深入行業場景的問題。
星環科技市場部總經理譚彬介紹,今年是星環科技第六次參加世界人工智能大會,將在大會期間全球首發金融領域大模型星環無涯產品,“在金融量化領域,‘無涯’可回答研報分析,能對個股、債券、基金等各類市場事件進行復盤和推演,有力輔助分析師、研究員和投資經理的日常工作?!彼嘎?,企業也會展示大數據分析大模型“求索”,“用戶通過自然語言即可生成可執行SQL語句,快速獲取數據庫查詢結果,大幅度降低數據科學家門檻?!?/p>
在科大訊飛星火認知大模型問世1個多月后,其V1.5版本發布,除了開放式知識問答取得突破,多輪對話、邏輯和數學能力再升級之外,其應用落地更引人關注。
記者關注到,訊飛星火認知大模型V1.5更進一步拓寬了對多行業領域的賦能。例如在醫療領域,訊飛診后康復管理平臺已落地醫院??拼笥嶏w總裁吳曉如介紹,在患者出院康復的過程中,需要個性化的康復服務指導,但目前診后延續性服務普遍缺失。而基于迭代優化的大模型技術,診后康復管理平臺可將專業的診后管理和康復指導延伸到院外——根據患者健康畫像自動分析,平臺可為患者智能生成個性化康復計劃,包括重點關注、用藥指導、康復運動、出院隨訪、健康知識、患者咨詢等,并督促患者按計劃執行。
“訊飛人工智能開放平臺目前的開發者團隊超過400萬家,這一次通用人工智能所帶來的生態將更加繁榮?!眲c峰表示。
百度創始人、董事長兼首席執行官李彥宏在前不久舉行的中關村論壇上預測,今后所有的應用都將基于大模型來開發,每一個行業都會有屬于自己的大模型,大模型會深度融合到實體經濟中去。
當然,很多人提出焦慮:隨著大模型的發展,未來會不會替代人類的工作?
這個問題,或許首先要問問科學家們,從蛋白質結構預測到氣候系統建模,從引力波探測到理解宇宙,在很多領域,人工智能大模型正以較以往數倍甚至數萬倍的效率,改變多學科的研究。在晶泰科技創始人、董事長溫書豪看來,偉大的數學家會問為什么1+1=2,然而AI不會。AI會成為超級工具,會幫助人類記住無法記住的知識、無法計算的復雜方程,但是,深度的思考和提問的能力,人依然是獨特而不可替代的。
記者也在一款語言大模型里輸入了這個問題,得到了這樣的回答:大模型在某些領域可以提高工作效率,但它們不會完全取代人的工作。人工智能和機器學習技術的發展使得計算機能夠處理大量數據、執行復雜任務并提供智能決策支持;然而,人類在很多方面仍然具有獨特的優勢,如創造力、情感智慧、溝通能力和適應性等。
4 中國必須做自己的大模型
顯然,大模型并非一朝一夕就能夠煉造的,現如今“百模大戰”戰況不斷,本質還是過去幾年技術積累的產物。不少專家指出,大模型相關新研究、新產品競相涌現,通用人工智能正成為各國重點布局的關鍵賽道。
“搶抓通用人工智能的發展機遇有幾個基本要素?!笨拼笥嶏w董事長劉慶峰認為,第一,必須要在自主可控的平臺上;第二,必須要同時做中文和英文,不只學習中國的“智慧”,還要向世界學習;第三,在“硬碰硬”的科技對比上,不僅要學習,還要想辦法趕超。
“中國必須做自己的大模型”,這已經成為共識。為推動人工智能創新發展,北京、上海、廣東深圳等多地紛紛出臺支持舉措,集聚人工智能創新資源,搶抓大模型機遇,開展大模型創新算法及關鍵技術研究,打造人工智能創新高地。
日前公布的《上海市加大力度支持民間投資發展若干政策措施》提出,充分發揮人工智能創新發展專項等引導作用,支持民營企業廣泛參與數據、算力等人工智能基礎設施建設。
徐匯區副區長俞林偉在2023世界人工智能大會新聞發布會上透露,徐匯在游戲、醫療、金融、零售等領域,已經匯聚了一大批垂類大模型企業,將全力支持他們自研技術創新,加快打造有機循環產業發展生態。
“大模型已經引發辦公軟件、內容創作、交互終端等領域的‘新工業革命’,業界也有共識,‘所有行業都值得用大模型重做一遍’?!庇崃謧ケ硎?,“徐匯將直面企業需求和產業關切,通過率先開放應用場景等政策,引導行業內領軍企業主動深化變革、提升能級,加快擁抱這一輪人工智能的發展?!?/p>
同樣需要正視的是,未來,要對大模型設置安全“圍欄”。業內人士建議,合理利用法規應對人工智能帶來的風險與沖擊,形成安全“護欄”,并在其引導下營造更有活力的發展環境。(新民晚報)
關鍵詞: