男男调教跪撅扒开晾臀当众,YIN荡的富豪性奴俱乐部,午夜在线观看免费观看大全,手机在线的A站免费观看

中國科技少年對話“Kaldi之父”Daniel Povey

2024-01-17 21:09:06
來源:財訊網

月初,Daniel 團隊的新一代 Kaldi 語音項目獲得了小米2023百萬美金技術大獎評選的二等獎。近日,兩位《超腦少年團》成員“小孩哥”高培淇和宮一森來到小米祝賀偶像Daniel 獲獎。

01

繼往開來:

站在 Kaldi 的肩膀上

Kaldi 是一款開源的語音識別工具包,主要用于語音識別、說話人識別、自然語言處理等領域。

在智能語音方面,大到微軟、蘋果、騰訊這樣的巨頭,小到各種初創企業,幾乎都曾或在使用 Kaldi 的技術進行研發及開發產品。而小米首席語音科學家Daniel Povey正是 Kaldi 的創始人。

Kaldi之父、小米集團首席語音科學家 Daniel Povey

說到為什么還要研發新一代 Kaldi,也是隨著深度學習技術的發展以及硬件算力的提升,智能語音領域也進入到一個新的發展階段,Kaldi 也需要不斷更新以適應新的應用場景和技術趨勢。

Daniel 博士在2019年注意到了 Transformer 架構的潛力,并判斷構建通用基礎模型的時機已經到來,加入小米后,他就開始實施這一藍圖,研發新一代 Kaldi 語音基礎引擎。

02

深耕底層:

新一代 Kaldi 的技術突破

新一代 Kaldi是一個開源的智能語音技術工具集,包含核心算法庫k2、通用語音數據處理工具包Lhotse、解決方案集合 Icefall 以及服務端引擎 Sherpa 四個子項目,開發者可以基于這些工具集輕松定制自己的智能語音應用。

如果把一個AI應用比喻為一座冰山,那用戶所能感知到的應用界面就是暴露在“海平面”之上的冰峰,強有力地托起這些應用的核心和龐大的技術基底,則是被深埋在“海平面”之下。

深藏在“海平面”之下的新一代 Kaldi 通用技術基底有哪些?它們又能夠帶來怎樣的作用?下面就為大家介紹。

▍全新聲學編碼器:zipformer

Zipformer是一個應用 Attention 機制的通用聲學編碼器,不僅可以用在語音領域,初步實驗驗證其在文本和圖像任務上同樣適用。

Zipformer 具有效果更好、計算更快、更省內存等優點,這使得 Zipformer 模型非常適合于低資源設備端部署。

▍首創神經網絡優化器: ScaledAdam

全新升級的神經網絡優化器——ScaledAdam是新一代 Kaldi 團隊在業界最知名的優化器 Adam 的基礎上,引入了可學習的縮放因子,實現了網絡訓練時間大幅縮短。而且ScaledAdam與Adam一樣,是一個通用的網絡訓練優化器。

▍業界最快Transducer 損失函數:Pruned RNN-T

新一代 Kaldi 團隊還研發了業界最快的 Transducer 損失函數—— Pruned RNN-T。

實驗數據顯示,相比 PyTorch 中實現的 RNN-T 損失函數,Pruned RNN-T 損失函數在僅使用 1/5 顯存的基礎上,取得了約 10 倍的速度提升。

▍有限狀態轉換器:可微分 FST

可微分FST(Finite State Transducer)是一個有限狀態轉換器,可以構建復雜的語言處理模型。

新一代 Kaldi 團隊創造性的實現了運行于 GPU 的可微分有限狀態機,使開發者只需要在外部構建好圖的拓撲結構,將其他的一切計算和訓練的部分交給 k2 引擎, 從而降低建模的工作量,提高靈活性。此外,新一代 Kaldi 團隊還實現了基于 GPU 的狀態機解碼方法,實現了語音識別解碼的全鏈路 GPU 加速。

新一代 Kaldi 還有眾多杰出的成果,如:近乎零成本的知識蒸餾技術,讓小模型也能學習到大模型的本領;基于時延懲罰的低時延端到端模型的訓練方法;PromptASR 語音識別系統;高效數據集構建方案 textsearch ; 全平臺語音任務服務引擎 sherpa 等等。集眾多優質技術于一身的新一代 Kaldi ,也將會在未來給大家帶來更多實用的驚喜,敬請期待吧!

03

開源共享:

我為人人,人人為我

新一代 Kaldi 作為一個基礎引擎,不僅推動了公司的技術發展,更對業界產生了深刻的影響。

首先,它可以在語音交互層面有力賦能小米「人車家全生態」新戰略。以座艙為例,使用新一代 Kaldi 引擎后,座艙的語音識別的性能進一步提升, jira 解決率提升45%,服務器成本也降低一半。

其次,新一代 Kaldi 作為一個基礎引擎,不僅可以服務于語音任務,還可以廣泛地適用于各種 AI 任務。目前,團隊首創的 ScaledAdam 優化器已經用在了小米自研大模型中。

最后,在智能家居領域中,通過使用新一代 Kaldi 技術,人們可以通過語音指令控制家電設備、查詢天氣、播放音樂等;在教育行業中,可以對學生進行口語測試和糾正,提高學生的口語表達和聽力理解能力;在醫療行業中,可以實現自動化的病歷記錄和診斷,提高醫療行業的效率??梢哉f,新一代 Kaldi 的出現正在對各行各業產生積極的影響。

堅持開源是新一代 Kaldi 與前一代一脈相承的底色。“我為人人,人人為我”,這是 Daniel 堅持 Kaldi 開源的期望,也是小米積極擁抱開源的初心。

“人因夢想而偉大,又因堅持夢想而成長。”Daniel借用雷軍的話,寄語和高培淇、宮一森一樣懷揣著編程夢想的科技少年。今日的科技少年也一定會成長為未來科研事業中的棟梁。

最后,讓我們把目光再次聚焦到獲獎的新一代 Kaldi 團隊,這是一個創新和經驗的結合體,正是因為他們,新?代 Kaldi 取得了眾多世界領先的成果。期待新一代 Kaldi 在未來,給大家帶來更多極致、好用的技術,讓開源普惠大眾。

 

關鍵詞:

[責任編輯:]

為您推薦

時評

內容舉報聯系郵箱:58 55 97 3 @qq.com

滬ICP備2022005074號-27 營業執照公示信息

Copyright © 2010-2020  看點時報 版權所有,未經許可不得轉載使用,違者必究。

<蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>