利用MEMS麥克風(fēng)陣列定位并識別音頻或語音信源

發(fā)布時(shí)間：2014-11-13 11:21 發(fā)布者：eechina

作者：M. Malcangi*, M. D’aria*, R. Sannino***, L. Spelgatti***
*    意大利米蘭大學(xué)計(jì)算機(jī)學(xué)系
** 意大利米蘭比可卡大學(xué)
***  意法半導(dǎo)體（意大利Agrate）公司

摘要：在過去10年里，以人類語言和音頻信號為媒介的人機(jī)交互應(yīng)用在日常生活的作用越來越重要。設(shè)備本身必須充分利用不同的功能，才能取得最佳的性能，例如，音頻定位、自動語音識別、自動說話人識別等。本文著重探討取得這些結(jié)果所需的算法和完整的嵌入式方案即MEMS麥克風(fēng)陣列所需的硬件架構(gòu)。
關(guān)鍵詞：音頻定位，語音識別，說話人識別，MEMS麥克風(fēng)

1.    前言
自動語音識別、語音模式識別和說話人識別及確認(rèn)等應(yīng)用對噪聲十分敏感，信源定位識別是音頻和語音信號捕捉處理應(yīng)用的一個(gè)關(guān)鍵的預(yù)處理功能。特別是基于微機(jī)電系統(tǒng)(MEMS) [1][2]的麥克風(fēng)陣列出現(xiàn)后，麥克風(fēng)陣列音頻定位方案引起科研企業(yè)和開發(fā)人員的廣泛關(guān)注。

目前業(yè)界正在使用MEMS麥克風(fēng)陣列子系統(tǒng)開發(fā)嵌入式音頻定位、自動語音識別和自動說話人識別解決方案，聲音識別定位是我們識別確認(rèn)他人身份的基本功能，當(dāng)我們聽到有人講話時(shí)，會將頭轉(zhuǎn)向說話人，查看說話人。

音源定位是自動語音識別和自動說話人識別系統(tǒng)的一個(gè)重要環(huán)節(jié)，對于提高語音識別系統(tǒng)的性能至關(guān)重要。麥克風(fēng)陣列可捕捉從不同方向傳來的聲音，通過算法運(yùn)算使麥克風(fēng)指向某一個(gè)特定方向，放大從該方向捕捉到的音頻信號，同時(shí)衰減從其它方向捕捉的音頻信號，整個(gè)動作就像一個(gè)智能麥克風(fēng)。

下載全文：

利用MEMS麥克風(fēng)陣列定位并識別音頻或語音信源.pdf (560.68 KB)

本文地址：http://m.qingdxww.cn/thread-134016-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時(shí)間更正或刪除。

網(wǎng)友評論

貿(mào)澤電子有獎(jiǎng)問答視頻，答對領(lǐng)10元微信紅包

国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

利用MEMS麥克風(fēng)陣列定位并識別音頻或語音信源

相關(guān)文章

網(wǎng)友評論

廠商推薦

相關(guān)視頻