• <rt id="2wkqu"><small id="2wkqu"></small></rt>
  • 全球要聞:深耕智能語音前沿技術(shù)
    2023-05-09 06:16:16 來源:經(jīng)濟日報 編輯:

    走進深圳市北科瑞聲科技股份有限公司(以下簡稱“北科瑞聲”)的人工智能展廳,一件件智能語音產(chǎn)品引人注目。

    “智能語音音頻技術(shù)應(yīng)用十分廣泛,可以賦能許多場景?!北笨迫鹇暥麻L劉軼說,公司通過與高速交通、智慧醫(yī)療、數(shù)字政務(wù)等行業(yè)深度融合,創(chuàng)新研發(fā)了一系列智能產(chǎn)品,并與多個國產(chǎn)主流平臺完成兼容性互認證,實現(xiàn)智能語音系統(tǒng)全鏈自主可控運行,持續(xù)推動智能語音技術(shù)應(yīng)用研發(fā)及產(chǎn)業(yè)化。2022年,北科瑞聲營業(yè)收入突破億元,同比增速超過56%。

    專注技術(shù)研發(fā)


    (資料圖片)

    2003年,劉軼從香港科技大學博士畢業(yè)留校任教,從事嵌入式智能語音識別技術(shù)研究?!白约貉邪l(fā)的東西能夠?qū)崿F(xiàn)應(yīng)用,產(chǎn)生經(jīng)濟效益、服務(wù)社會,這是每一個工科人的夢想?!睅е@樣的夢想,2008年,他與兩位合伙人來到深圳,創(chuàng)立北科瑞聲。

    實現(xiàn)夢想的路上,需要不斷探索和創(chuàng)新。嵌入式智能語音識別技術(shù)通過將聲音轉(zhuǎn)換成文本和命令,能夠?qū)崿F(xiàn)語音輸入、語音控制,可應(yīng)用于多種應(yīng)用系統(tǒng)、移動設(shè)備,大大改善人機交互方式。但是,要把這個技術(shù)落地實現(xiàn)產(chǎn)品化,并不是件容易的事。

    “那時,人們對語音識別還沒什么概念,相關(guān)技術(shù)也不夠成熟,鮮有成功的商業(yè)化案例。風口沒到的時候,我們需要沉下心來,做好基礎(chǔ)性工作,錘煉好自己的本領(lǐng)?!眲⑤W說。

    瞄準語音音頻交互核心技術(shù),北科瑞聲組織研發(fā)團隊開展持續(xù)攻關(guān),不斷突破技術(shù)瓶頸?!霸谌斯ぶ悄芎蜋C器學習技術(shù)領(lǐng)域,有一大一小兩個難題。大難題是指超大規(guī)模預(yù)訓練模型,小難題是指芯片級神經(jīng)網(wǎng)絡(luò)模型?!北笨迫鹇暱偨?jīng)理王昕介紹,針對兩個難題,公司研發(fā)了音頻信息感知、語音識別、人機交互系統(tǒng)等全鏈多模態(tài)人工智能技術(shù),并將這些技術(shù)封裝在自研芯片上,打造存算一體芯片級小型神經(jīng)網(wǎng)絡(luò)模型語音芯片,推出“云+端+芯”全鏈條、自主可控智能語音產(chǎn)品,實現(xiàn)從人工智能語音技術(shù)創(chuàng)新到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)。

    “云+端+芯”即云、設(shè)備終端和芯片,三者鏈條打通之后,能夠?qū)崿F(xiàn)對數(shù)據(jù)的存儲、處理、整理、分析和傳輸?!肮タ诉@個技術(shù)并非易事,我們面臨許多挑戰(zhàn)。”王昕說,語音交互具有時變性。在溝通過程中,設(shè)備每一分鐘都要通過提取語音特征、參數(shù),與后臺的模型進行大量比對計算,快速反饋語音內(nèi)容。這不僅需要一個速度非??斓挠嬎銌卧?,還需要中央處理器的算力足夠快、存儲器容量足夠大。與此同時,還要實現(xiàn)低功耗,降低應(yīng)用成本。

    為了破解這一系列難題,北科瑞聲不斷提升數(shù)據(jù)、算法和算力能力,積累了超10萬小時語音音頻數(shù)據(jù)、TB級語言數(shù)據(jù)及語音音頻行業(yè)標桿級數(shù)據(jù)資源;研發(fā)出行業(yè)領(lǐng)先的中文復(fù)雜場景語音音頻交互技術(shù),普通話語音識別準確度達99%,限定領(lǐng)域的意圖識別準確度達到95%。

    語音交互技術(shù)好不好,不僅要看測試的識別準確率,還要看其在實際場景下的語義理解能力?!凹幢闳缃衿胀ㄔ捚占俺潭仍絹碓礁?,但由于每個人的經(jīng)歷或生活環(huán)境不同,產(chǎn)生了很多‘不標準’的普通話發(fā)音。這個‘不標準’千變?nèi)f化,識別起來十分困難。而基于中文復(fù)雜場景的語音音頻交互技術(shù),可以做到在無需事先指定口音類型的情況下,處理國內(nèi)50多個地方的帶口音普通話。”劉軼說。

    面對互聯(lián)網(wǎng)時代層出不窮且逐漸融入人們生活的網(wǎng)絡(luò)新詞,中文復(fù)雜場景語音音頻交互技術(shù)還能通過自進化能力,在30秒內(nèi)對這些新詞進行全面學習、掌握,以快速跟上互聯(lián)網(wǎng)信息迭代速度。而原先的傳統(tǒng)技術(shù)若想識別新詞,一般需要數(shù)天甚至數(shù)周的技術(shù)訓練。

    經(jīng)過持續(xù)研發(fā)創(chuàng)新,北科瑞聲攻克了多項人工智能核心技術(shù),實現(xiàn)了端云架構(gòu)以及端到端一體化產(chǎn)品應(yīng)用。目前,北科瑞聲擁有知識產(chǎn)權(quán)200多件,其中發(fā)明專利100多件,參與了智能語音識別和交互國家標準制定,獲得我國智能科學技術(shù)最高獎“吳文俊人工智能科學技術(shù)獎”、中國專利優(yōu)秀獎以及多項廣東省科學技術(shù)獎等獎項,發(fā)展成為人工智能音頻領(lǐng)軍企業(yè)。

    拓展應(yīng)用場景

    創(chuàng)新不能閉門造車,還需要根據(jù)市場需求將科研成果落地轉(zhuǎn)化。“通用產(chǎn)品僅僅將語音轉(zhuǎn)化為文字,無法滿足醫(yī)療、交通、政務(wù)等細分領(lǐng)域的需求。比如一些專業(yè)術(shù)語,如果我們的智能語音系統(tǒng)沒有與行業(yè)進行深度融合或者定制化處理,就達不到好的效果?!眲⑤W告訴記者,人工智能要想真正為市場所用,一定要與具體的行業(yè)應(yīng)用結(jié)合起來,做深、做精,為行業(yè)發(fā)展賦能。

    在探尋技術(shù)落地及差異化競爭路徑的過程中,北科瑞聲將目光首先聚焦于車載應(yīng)用領(lǐng)域。

    “支持語音交互是車載導航智能發(fā)展的必然趨勢,出于對安全駕駛的考慮,人們不能一邊開車一邊操作導航。我們嘗試將智能語音識別技術(shù)嵌入汽車車機,通過車機總線進行總控,可執(zhí)行高達幾萬條的語音命令?!北笨迫鹇暱偛棉k公室副總監(jiān)王詩雨說,“車主只需說出路線需求,車機就能規(guī)劃合適的路線,實現(xiàn)無手化操作?!?/p>

    車載應(yīng)用成功落地讓北科瑞聲在智能語音應(yīng)用領(lǐng)域摸索出一些經(jīng)驗,隨后開始在數(shù)字政務(wù)、智慧醫(yī)療和高速交通等領(lǐng)域發(fā)力。

    在數(shù)字政務(wù)智能語音解決方案中,北科瑞聲基于其智能語音核心能力開發(fā)出一套主要用于政企會議場景的智能語音會議系統(tǒng)?!皶h記錄是政企日常工作中的重要部分,但傳統(tǒng)記錄方式效率較低?!眲⑤W說,智能語音會議系統(tǒng)提供基于私有云的語音轉(zhuǎn)文字、實時轉(zhuǎn)寫上屏顯示、離線語音轉(zhuǎn)寫、紀要成稿、會議記錄留存查詢等功能,避免了傳統(tǒng)人工整理記錄會議內(nèi)容存在的時間長、易遺漏、準確率低等問題,從而提升會議交互體驗與辦公效率。目前,北科瑞聲智能語音會議系統(tǒng)已在深圳許多政企單位實現(xiàn)應(yīng)用。

    “數(shù)據(jù)不只是一種資源,更是一種能力,是企業(yè)的核心競爭力。”劉軼說,在高速交通領(lǐng)域,北科瑞聲通過運用云計算、大數(shù)據(jù)分析能力,提升人工智能認知能力,實現(xiàn)大交通領(lǐng)域用戶數(shù)據(jù)安全可靠。

    ETC卡剛剛推行時,由于需求量不高,高速客服中心的線上客服配置并不多。隨著ETC熱潮的到來,2019年,粵通卡車主大幅上漲,給客服工作帶來了巨大壓力?;跀?shù)據(jù)、算法、算力三大要素技術(shù)積累,北科瑞聲結(jié)合高速交通業(yè)務(wù)場景及高速視頻云系統(tǒng),打造出覆蓋互聯(lián)網(wǎng)渠道、電話通道及高速場景線下服務(wù)窗口的人工智能高速交通綜合信息服務(wù)平臺——全終端高速交通平臺。

    這一平臺以智能外呼機器人替代人工客服,通過與粵高速客服中心電話線路集成,實現(xiàn)從流程設(shè)置、外呼呼叫到數(shù)據(jù)處理與匯總的全流程自動化處理。智能外呼機器人集成語音識別、自然語言理解、信息檢索、語音合成等智能技術(shù),聽得懂、能理解、會說話,人機交互流暢自然,機器人單條電話線單日可完成外呼電話上千次,外呼數(shù)據(jù)同步轉(zhuǎn)寫生成保存。

    “與傳統(tǒng)人工外呼相比,智能外呼機器人具備自動撥打、多輪對話、自動生產(chǎn)外呼數(shù)據(jù)等優(yōu)勢,還可不間斷工作,有效提升了工作智能化、數(shù)字化水平。”王昕說,深圳具有良好的創(chuàng)新土壤,為企業(yè)積累場景應(yīng)用經(jīng)驗、促進技術(shù)迭代提供了舞臺。立足這個資源優(yōu)勢,北科瑞聲在不斷拓展應(yīng)用場景的同時,將繼續(xù)破解技術(shù)瓶頸,持續(xù)迭代產(chǎn)品,用人工智能技術(shù)賦能更多行業(yè)發(fā)展。(經(jīng)濟日報記者 楊陽騰)

    關(guān)鍵詞:

    相關(guān)閱讀
    分享到:
    版權(quán)和免責申明

    凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

    久久激情五月网站,一本色道综合亚洲精品精品,午夜电影久久久久久,中文无码AV片在线 成a在线观看视频播放 婷婷色中文在线观看
  • <rt id="2wkqu"><small id="2wkqu"></small></rt>