詳細(xì)信息 |
智能語(yǔ)音的應(yīng)用發(fā)展趨勢(shì) |
編輯: 來(lái)源:創(chuàng)澤集團(tuán) 時(shí)間:2022/3/26 |
智能語(yǔ)音,主要是人和機(jī)器通過(guò)語(yǔ)音作為媒介進(jìn)行自然交互的形式,涉及到的核心技術(shù)主要包括四個(gè)方面,先通過(guò)語(yǔ)音識(shí)別(ASR)轉(zhuǎn)成文字,如果語(yǔ)音信號(hào)質(zhì)量不好的話,前端會(huì)有一個(gè)語(yǔ)音增強(qiáng)模塊;然后是口語(yǔ)語(yǔ)言理解,接下來(lái)是對(duì)話管理和口語(yǔ)語(yǔ)言生成,而終通過(guò)文語(yǔ)轉(zhuǎn)換(TTS)生成語(yǔ)音回饋給用戶。 回顧語(yǔ)音識(shí)別的發(fā)展,在2000年之前,語(yǔ)音識(shí)別的錯(cuò)誤率有明顯的改善,而在2000年到2010年期間,我們做的很多努力很難再去進(jìn)一步降低識(shí)別的錯(cuò)誤率。在大概2010年后,在深度學(xué)習(xí)的推動(dòng)下,利用大數(shù)據(jù)、機(jī)器學(xué)習(xí)和大算力這“三駕馬車”,語(yǔ)音識(shí)別的識(shí)別準(zhǔn)確度再一次明顯提升,錯(cuò)誤率再一次下降,并且在一部分?jǐn)?shù)據(jù)集上實(shí)現(xiàn)了媲美人類語(yǔ)音識(shí)別的精度。 語(yǔ)音識(shí)別是智能語(yǔ)音范疇內(nèi)的一個(gè)典型任務(wù),除此之外,智能語(yǔ)音的任務(wù)還包括語(yǔ)音編碼、語(yǔ)音增強(qiáng)、關(guān)鍵詞檢出、聲紋識(shí)別等一系列任務(wù),而智能語(yǔ)音技術(shù)能夠服務(wù)的方向主要包括三方面,一是自然人機(jī)交互,二是自然人人交互,還有就是內(nèi)容分析與挖掘,垂直落地的應(yīng)用非常多,場(chǎng)景廣泛,價(jià)值巨大。 在技術(shù)側(cè),智能語(yǔ)音行業(yè)發(fā)展仍然面臨著聲紋識(shí)別的不穩(wěn)定性、語(yǔ)音識(shí)別的魯棒性以及訓(xùn)練場(chǎng)景的長(zhǎng)尾性的落地挑戰(zhàn); 而在應(yīng)用側(cè),智能語(yǔ)音技術(shù)已逐步從純技術(shù)形式應(yīng)用,轉(zhuǎn)向“語(yǔ)音+AI技術(shù)+行業(yè)“的創(chuàng)新式發(fā)展。 受供給側(cè)的業(yè)務(wù)增長(zhǎng)突破和需求側(cè)的客戶訴求推動(dòng),智能語(yǔ)音技術(shù)調(diào)用不僅是單純?yōu)檗D(zhuǎn)寫“人說(shuō)了什么”或者輸出“機(jī)器要說(shuō)什么”,而是正逐步與語(yǔ)義理解、知識(shí)圖譜等AI技術(shù)融合,讓使用智能語(yǔ)音技術(shù)的機(jī)器本體更加具備認(rèn)知性和行業(yè)關(guān)聯(lián)性,結(jié)合行業(yè) Know-how和甲方需求輸出整體性、結(jié)果導(dǎo)向性的實(shí)用解決方案。
智能語(yǔ)音的技術(shù)挑戰(zhàn)1 聲紋識(shí)別的不穩(wěn)定性:人的聲音在不同時(shí)間、 狀態(tài)會(huì)呈現(xiàn)不同的特征,因此技術(shù)層面如何準(zhǔn)確識(shí)別變化明顯的聲紋特征仍然面臨挑戰(zhàn)。 2 語(yǔ)音識(shí)別的魯棒性:說(shuō)話目標(biāo)由遠(yuǎn)到近的移動(dòng)、場(chǎng)景變化、背景噪音、混響嘈雜、干擾聲源等真實(shí)場(chǎng)景,會(huì)給語(yǔ)音識(shí)別準(zhǔn)確率帶來(lái)較大 折扣。 3 訓(xùn)練場(chǎng)景的長(zhǎng)尾性:面對(duì)低資源小語(yǔ)種和語(yǔ)言訓(xùn)練場(chǎng)景,如何通過(guò)較少資源獲得規(guī)模有效的訓(xùn)練成果,是智能語(yǔ)音持續(xù)面臨的技術(shù)挑戰(zhàn)。
|
【聲明:轉(zhuǎn)載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述,文章內(nèi)容僅供參考,如有侵權(quán),請(qǐng)聯(lián)系刪除。】 |
推薦信息 |
高空擦窗機(jī)器人初創(chuàng)企業(yè)Skyline完成650萬(wàn)美元A輪前融資
高層窗戶清潔機(jī)器人可清潔摩天大樓外側(cè)難以觸及的外墻的清潔機(jī)器人,650萬(wàn)美元的pre-A輪融資用于各種業(yè)務(wù)運(yùn)營(yíng)及持續(xù)的產(chǎn)品開發(fā)
機(jī)器人與假手結(jié)合,抓取物品,仿生手假肢和腦機(jī)接口
將單個(gè)手指控制和自動(dòng)化結(jié)合起來(lái),以提高抓取和操作能力,涉及從截肢者殘肢上的肌肉活動(dòng)中解讀意圖的手指運(yùn)動(dòng),以實(shí)現(xiàn)對(duì)假肢手的單個(gè)手指控制
中國(guó)工業(yè)視覺搭上智能制造“快車”,國(guó)產(chǎn)化替代率已達(dá)50%
政策+需求+場(chǎng)景+信創(chuàng)驅(qū)動(dòng)工業(yè)視覺行業(yè)發(fā)展進(jìn)入新階段,助力中國(guó)制造的眼睛自主可控,其技術(shù)逐步由基礎(chǔ)模式匹配向深度學(xué)習(xí)方向縱向超越式 發(fā)展
甲骨文斷供俄羅斯!數(shù)據(jù)庫(kù)深度復(fù)盤與展望
從數(shù)據(jù)模型邏輯、技術(shù)架構(gòu)、需求功能、部署方式、存儲(chǔ)介質(zhì)、商業(yè)模式、數(shù)據(jù)庫(kù)治理模式等七大維度對(duì)數(shù)據(jù)庫(kù)發(fā)展脈絡(luò)進(jìn)行詳細(xì)闡述
如何選擇迎賓服務(wù)機(jī)器人生產(chǎn)廠家
個(gè)性化配置;主動(dòng)喚醒;主動(dòng)引導(dǎo);主動(dòng)服務(wù);主動(dòng)迎賓;智能引領(lǐng);售后服務(wù)體系是否完善;廠家的數(shù)量及規(guī)模有很多的客戶案例
動(dòng)力外骨骼機(jī)器人研發(fā)及制造商英漢思動(dòng)力完成5000萬(wàn)元pre-A輪融資
由普曼資本及濰坊中谷健康產(chǎn)業(yè)基金領(lǐng)投,小米集團(tuán)聯(lián)合創(chuàng)始人黃江吉,科大訊飛聯(lián)合創(chuàng)始人胡郁及晨暉創(chuàng)投,浩方創(chuàng)投等知名投資人及機(jī)構(gòu)方參與跟投,老股東高秉強(qiáng)教授本輪繼續(xù)跟投
加大腦科學(xué)研究應(yīng)用,改善老年腦健康管理
識(shí)別腦健康風(fēng)險(xiǎn)的數(shù)據(jù)積累較少,數(shù)據(jù)庫(kù)建設(shè)仍較為薄弱;腦科學(xué)的研發(fā)資源共享有待提高,本土研究?jī)?yōu)勢(shì)仍待發(fā)揮
武漢人工智能超算中心
武漢人工智能超算中心位于東湖高新區(qū),合作單位有華為 中科院自動(dòng)化所 武漢大學(xué) 武漢理工大學(xué),算力規(guī)模是100p flops |
智能運(yùn)輸機(jī)器人 |
AGV無(wú)人運(yùn)輸機(jī)器人-料箱版 |
AGV無(wú)人運(yùn)輸機(jī)器人-標(biāo)準(zhǔn)版 |
AGV無(wú)人運(yùn)輸機(jī)器人-料箱版(鈑金材質(zhì)) |
AGV無(wú)人運(yùn)輸機(jī)器人-貨架版(鈑金材質(zhì)) |
AGV無(wú)人運(yùn)輸機(jī)器人-貨架版(亮面不銹鋼材質(zhì)) |
AGV無(wú)人運(yùn)輸機(jī)器人-開放版 |
行業(yè)動(dòng)態(tài) |
咨詢熱線:4006-935-088 / 4006-937-088
客服熱線:
4008-128-728
版權(quán)所有 @ 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 魯ICP備18039973號(hào)-2 運(yùn)營(yíng)中心 / 北京·清華科技園九號(hào)樓 生產(chǎn)中心 / 山東省日照市開發(fā)區(qū)太原路71號(hào) |