走進深圳市北科瑞聲科技股份有限公司(以下簡稱“北科瑞聲”)的人工智能展廳,一件件智能語音產(chǎn)品引人注目。
“智能語音音頻技術(shù)應(yīng)用十分廣泛,可以賦能許多場景?!北笨迫鹇暥麻L劉軼說,公司通過與高速交通、智慧醫(yī)療、數(shù)字政務(wù)等行業(yè)深度融合,創(chuàng)新研發(fā)了一系列智能產(chǎn)品,并與多個國產(chǎn)主流平臺完成兼容性互認證,實現(xiàn)智能語音系統(tǒng)全鏈自主可控運行,持續(xù)推動智能語音技術(shù)應(yīng)用研發(fā)及產(chǎn)業(yè)化。2022年,北科瑞聲營業(yè)收入突破億元,同比增速超過56%。
專注技術(shù)研發(fā)
(資料圖片)
2003年,劉軼從香港科技大學博士畢業(yè)留校任教,從事嵌入式智能語音識別技術(shù)研究?!白约貉邪l(fā)的東西能夠?qū)崿F(xiàn)應(yīng)用,產(chǎn)生經(jīng)濟效益、服務(wù)社會,這是每一個工科人的夢想?!睅е@樣的夢想,2008年,他與兩位合伙人來到深圳,創(chuàng)立北科瑞聲。
實現(xiàn)夢想的路上,需要不斷探索和創(chuàng)新。嵌入式智能語音識別技術(shù)通過將聲音轉(zhuǎn)換成文本和命令,能夠?qū)崿F(xiàn)語音輸入、語音控制,可應(yīng)用于多種應(yīng)用系統(tǒng)、移動設(shè)備,大大改善人機交互方式。但是,要把這個技術(shù)落地實現(xiàn)產(chǎn)品化,并不是件容易的事。
“那時,人們對語音識別還沒什么概念,相關(guān)技術(shù)也不夠成熟,鮮有成功的商業(yè)化案例。風口沒到的時候,我們需要沉下心來,做好基礎(chǔ)性工作,錘煉好自己的本領(lǐng)?!眲⑤W說。
瞄準語音音頻交互核心技術(shù),北科瑞聲組織研發(fā)團隊開展持續(xù)攻關(guān),不斷突破技術(shù)瓶頸?!霸谌斯ぶ悄芎蜋C器學習技術(shù)領(lǐng)域,有一大一小兩個難題。大難題是指超大規(guī)模預(yù)訓練模型,小難題是指芯片級神經(jīng)網(wǎng)絡(luò)模型?!北笨迫鹇暱偨?jīng)理王昕介紹,針對兩個難題,公司研發(fā)了音頻信息感知、語音識別、人機交互系統(tǒng)等全鏈多模態(tài)人工智能技術(shù),并將這些技術(shù)封裝在自研芯片上,打造存算一體芯片級小型神經(jīng)網(wǎng)絡(luò)模型語音芯片,推出“云+端+芯”全鏈條、自主可控智能語音產(chǎn)品,實現(xiàn)從人工智能語音技術(shù)創(chuàng)新到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)。
“云+端+芯”即云、設(shè)備終端和芯片,三者鏈條打通之后,能夠?qū)崿F(xiàn)對數(shù)據(jù)的存儲、處理、整理、分析和傳輸?!肮タ诉@個技術(shù)并非易事,我們面臨許多挑戰(zhàn)。”王昕說,語音交互具有時變性。在溝通過程中,設(shè)備每一分鐘都要通過提取語音特征、參數(shù),與后臺的模型進行大量比對計算,快速反饋語音內(nèi)容。這不僅需要一個速度非??斓挠嬎銌卧?,還需要中央處理器的算力足夠快、存儲器容量足夠大。與此同時,還要實現(xiàn)低功耗,降低應(yīng)用成本。
為了破解這一系列難題,北科瑞聲不斷提升數(shù)據(jù)、算法和算力能力,積累了超10萬小時語音音頻數(shù)據(jù)、TB級語言數(shù)據(jù)及語音音頻行業(yè)標桿級數(shù)據(jù)資源;研發(fā)出行業(yè)領(lǐng)先的中文復(fù)雜場景語音音頻交互技術(shù),普通話語音識別準確度達99%,限定領(lǐng)域的意圖識別準確度達到95%。
語音交互技術(shù)好不好,不僅要看測試的識別準確率,還要看其在實際場景下的語義理解能力?!凹幢闳缃衿胀ㄔ捚占俺潭仍絹碓礁?,但由于每個人的經(jīng)歷或生活環(huán)境不同,產(chǎn)生了很多‘不標準’的普通話發(fā)音。這個‘不標準’千變?nèi)f化,識別起來十分困難。而基于中文復(fù)雜場景的語音音頻交互技術(shù),可以做到在無需事先指定口音類型的情況下,處理國內(nèi)50多個地方的帶口音普通話。”劉軼說。
面對互聯(lián)網(wǎng)時代層出不窮且逐漸融入人們生活的網(wǎng)絡(luò)新詞,中文復(fù)雜場景語音音頻交互技術(shù)還能通過自進化能力,在30秒內(nèi)對這些新詞進行全面學習、掌握,以快速跟上互聯(lián)網(wǎng)信息迭代速度。而原先的傳統(tǒng)技術(shù)若想識別新詞,一般需要數(shù)天甚至數(shù)周的技術(shù)訓練。
經(jīng)過持續(xù)研發(fā)創(chuàng)新,北科瑞聲攻克了多項人工智能核心技術(shù),實現(xiàn)了端云架構(gòu)以及端到端一體化產(chǎn)品應(yīng)用。目前,北科瑞聲擁有知識產(chǎn)權(quán)200多件,其中發(fā)明專利100多件,參與了智能語音識別和交互國家標準制定,獲得我國智能科學技術(shù)最高獎“吳文俊人工智能科學技術(shù)獎”、中國專利優(yōu)秀獎以及多項廣東省科學技術(shù)獎等獎項,發(fā)展成為人工智能音頻領(lǐng)軍企業(yè)。
拓展應(yīng)用場景
創(chuàng)新不能閉門造車,還需要根據(jù)市場需求將科研成果落地轉(zhuǎn)化。“通用產(chǎn)品僅僅將語音轉(zhuǎn)化為文字,無法滿足醫(yī)療、交通、政務(wù)等細分領(lǐng)域的需求。比如一些專業(yè)術(shù)語,如果我們的智能語音系統(tǒng)沒有與行業(yè)進行深度融合或者定制化處理,就達不到好的效果?!眲⑤W告訴記者,人工智能要想真正為市場所用,一定要與具體的行業(yè)應(yīng)用結(jié)合起來,做深、做精,為行業(yè)發(fā)展賦能。
在探尋技術(shù)落地及差異化競爭路徑的過程中,北科瑞聲將目光首先聚焦于車載應(yīng)用領(lǐng)域。
“支持語音交互是車載導航智能發(fā)展的必然趨勢,出于對安全駕駛的考慮,人們不能一邊開車一邊操作導航。我們嘗試將智能語音識別技術(shù)嵌入汽車車機,通過車機總線進行總控,可執(zhí)行高達幾萬條的語音命令?!北笨迫鹇暱偛棉k公室副總監(jiān)王詩雨說,“車主只需說出路線需求,車機就能規(guī)劃合適的路線,實現(xiàn)無手化操作?!?/p>
車載應(yīng)用成功落地讓北科瑞聲在智能語音應(yīng)用領(lǐng)域摸索出一些經(jīng)驗,隨后開始在數(shù)字政務(wù)、智慧醫(yī)療和高速交通等領(lǐng)域發(fā)力。
在數(shù)字政務(wù)智能語音解決方案中,北科瑞聲基于其智能語音核心能力開發(fā)出一套主要用于政企會議場景的智能語音會議系統(tǒng)?!皶h記錄是政企日常工作中的重要部分,但傳統(tǒng)記錄方式效率較低?!眲⑤W說,智能語音會議系統(tǒng)提供基于私有云的語音轉(zhuǎn)文字、實時轉(zhuǎn)寫上屏顯示、離線語音轉(zhuǎn)寫、紀要成稿、會議記錄留存查詢等功能,避免了傳統(tǒng)人工整理記錄會議內(nèi)容存在的時間長、易遺漏、準確率低等問題,從而提升會議交互體驗與辦公效率。目前,北科瑞聲智能語音會議系統(tǒng)已在深圳許多政企單位實現(xiàn)應(yīng)用。
“數(shù)據(jù)不只是一種資源,更是一種能力,是企業(yè)的核心競爭力。”劉軼說,在高速交通領(lǐng)域,北科瑞聲通過運用云計算、大數(shù)據(jù)分析能力,提升人工智能認知能力,實現(xiàn)大交通領(lǐng)域用戶數(shù)據(jù)安全可靠。
ETC卡剛剛推行時,由于需求量不高,高速客服中心的線上客服配置并不多。隨著ETC熱潮的到來,2019年,粵通卡車主大幅上漲,給客服工作帶來了巨大壓力?;跀?shù)據(jù)、算法、算力三大要素技術(shù)積累,北科瑞聲結(jié)合高速交通業(yè)務(wù)場景及高速視頻云系統(tǒng),打造出覆蓋互聯(lián)網(wǎng)渠道、電話通道及高速場景線下服務(wù)窗口的人工智能高速交通綜合信息服務(wù)平臺——全終端高速交通平臺。
這一平臺以智能外呼機器人替代人工客服,通過與粵高速客服中心電話線路集成,實現(xiàn)從流程設(shè)置、外呼呼叫到數(shù)據(jù)處理與匯總的全流程自動化處理。智能外呼機器人集成語音識別、自然語言理解、信息檢索、語音合成等智能技術(shù),聽得懂、能理解、會說話,人機交互流暢自然,機器人單條電話線單日可完成外呼電話上千次,外呼數(shù)據(jù)同步轉(zhuǎn)寫生成保存。
“與傳統(tǒng)人工外呼相比,智能外呼機器人具備自動撥打、多輪對話、自動生產(chǎn)外呼數(shù)據(jù)等優(yōu)勢,還可不間斷工作,有效提升了工作智能化、數(shù)字化水平。”王昕說,深圳具有良好的創(chuàng)新土壤,為企業(yè)積累場景應(yīng)用經(jīng)驗、促進技術(shù)迭代提供了舞臺。立足這個資源優(yōu)勢,北科瑞聲在不斷拓展應(yīng)用場景的同時,將繼續(xù)破解技術(shù)瓶頸,持續(xù)迭代產(chǎn)品,用人工智能技術(shù)賦能更多行業(yè)發(fā)展。(經(jīng)濟日報記者 楊陽騰)
關(guān)鍵詞:
凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。
- 全球要聞:深耕智能語音前沿技術(shù)2023-05-09
- 河南商丘金振源電子科技有限公司:升級改造2023-05-09
- 全球今熱點:企業(yè)挖掘人才不妨提前對接高校2023-05-09
- 讓校園體育擁有更多可能-天天通訊2023-05-09
- 國際油價8日顯著上漲2023-05-09
- 盾安環(huán)境(002011):5月8日北向資金增持882023-05-09
- 環(huán)球頭條:民法典規(guī)定遺囑中可以指定夫妻雙2023-05-09
- 今日快訊:邵陽縣交通違章處理所需的資料是2023-05-09
- 【網(wǎng)言】個人的朋友圈豈能被公司“強征”|2023-05-09
- 【新視野】感受“大好河山”的無限生機2023-05-09
- 中菲農(nóng)業(yè)合作如火如荼2023-05-09
- 定增股票后股價如何走,可能上漲也可能下跌2023-05-09
- 快資訊丨碧桂園成功發(fā)行兩筆共17億元中期票2023-05-09
- 當前時訊:揚子新材收年報問詢函,未付清濱2023-05-09
- 天天即時:從若羽臣財報,看代運營產(chǎn)業(yè)的“2023-05-09
- 【海信視像一季報,有喜也有憂】 天天動態(tài)2023-05-09
- 全球微頭條丨直擊長安汽車2022年度業(yè)績說明2023-05-09
- 蓄意是什么意思_蓄意什么意思|天天微頭條2023-05-09
- 周濤穿蕾絲裙抗老 全球觀焦點2023-05-09
- 九號公司攜手小紅書開啟線下快閃活動:讓出2023-05-09
- 環(huán)球動態(tài):美芯晟: 美芯晟首次公開發(fā)行股票2023-05-09
- 《劍與盾》5月9日0點新服19服威震九州開啟2023-05-09
- 沃森生物(300142):5月8日北向資金增持112023-05-09
- 南山控股(002314):5月8日北向資金增持122023-05-09
- 世界即時:word目錄自動生成超鏈接_word目2023-05-09
- 感謝詞怎么說_感謝詞2023-05-09
- 環(huán)球微資訊!世界上的另一個我紀錄片第二季2023-05-09
- 貴州稅務(wù)網(wǎng)上申報大廳_貴州省國家稅務(wù)局網(wǎng)2023-05-09
- 門頭溝頒布全市首個人工智能算法領(lǐng)域?qū)iT人2023-05-09
- 觀賞鯊魚產(chǎn)下3條崽 究竟發(fā)生了什么事情?2023-05-09
- 學生營養(yǎng)改善計劃是什么 學生營養(yǎng)改善計劃內(nèi)容是什么?
- 海水稻畝產(chǎn)破千斤 海水稻是什么介紹
- 中國三大股票指數(shù) ?中國的三大股指簡介
- 云南特產(chǎn)有什么 云南特產(chǎn)有哪些呢?
- 殘疾人創(chuàng)業(yè)申請條件 殘疾人創(chuàng)業(yè)貸款處理流程
- 戴威再收限制消費令 ofo押金退的怎么樣了?
- 網(wǎng)上買基金安全嗎?在網(wǎng)上買過基金后如何查看?
- 河南省高速公路網(wǎng)規(guī)劃怎么樣 信陽將新增哪些線路 ?
- 上海老洋房出售價格多少?老洋房價格貴為什么?
- 全聚德三個季度虧掉三年利潤 全聚德簡介