人類嬰兒由于出生時過于虛弱,不具備主動接近成人的行為能力,因此在9個月之前,其主要通過哭聲吸引成人的注意,并向成人表達他的需求。嬰幼兒語料庫是按照一定采樣標準采集的電子數據集合,隨著大數據時代的到來,語音智能產品已經滲透到移動通信、智能家居、工業生產等很多領域。語音識別技術逐漸趨于成熟,然而,語音識別產品所依賴的語音數據價值變得更加顯著,語料庫成為重要的基礎資源。獨有核心技術,讓AI更進一步。 本語料庫采集了近十六萬條語音。錄音采集人來自中國大陸各地,錄制人數300多人,錄制家庭300多家,采取0-14個月跟蹤家庭錄制,男女比例均衡,音頻總時長1275小時,采集方式為單麥設備。每條音頻單獨存儲為一個文件,并由專業標注人員手工進行兩級標注。所有標注數據都是全檢后再交付,以保證交付數據的質量。 |
技術背景介紹 |
隨著以深度神經網絡為代表的人工智能技術的發展,新一輪的人機交互技術熱潮正在興起。在機器視覺領域,由于海量圖像和視覺場景數據庫的誕生,催生了人臉識別、姿態識別、自動駕駛、無人機等領域的技術革新。目前世界上已有的典型的大規模海量圖像和視覺場景數據庫包括,ImageNet、MSCOCO等業界知名的數據庫。 在聲音場景和聲音事件的識別領域,技術的發展已經成熟,然而商業應用滯后于機器視覺領域的應用。在聲音領域,目前世界上最著名的音頻數據庫包括:歐洲的DCASE(聲音場景和事件數據庫)和谷歌的Audio Set(包括各類層次結構化的音頻分類數據)等。 在家庭環境領域,能夠用來服務于AI應用的聲音數據極為缺乏,本產品旨在填補這一空白,為全球的智能家庭環境的AI應用落地做出貢獻。 聲音場景(Acoustic Scene)指的是室內、室外、火車站、餐廳、看電影、聽音樂等實際生活中人們的有聲的生活場景,通過聲音信號的識別來辨識這類場景,就是聲音場景識別;聲音事件(Acoustic Event)指的是根據短時聲學特征,利用統計學習的建模方法,對不同的聲源所關聯的事件,進行類別的分類。例如,對哭聲、咳嗽聲、腳步聲,能夠通過聲音頻率特征的分布規律,進行實時的檢測,發現家居環境中的突發性事件、嬰幼兒的行為事件、家庭成員的異常活動等。 |
數據應用場景 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
【家庭環境嬰幼兒聲音場景和聲音事件數據庫】作為豐富的數據資源,可用于哭聲及家庭環境聲音頻率和特征的分析學習,研究聲環境及其同人類活動的相互作用,更好的滿足了多種場景的人工智能研發數據支撐。也為嬰幼兒智能產品的創新和研發,尤其為互聯網行業、母嬰行業、智能家居行業提供了更詳細的數據和更全面的信息支持。 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
產品優勢 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
l 領先的語音采集處理技術及專業標注團隊; l 同時支持科研和教學; l 支持可視化操作; l 支持基于機器學習的智能分析; l 支持科研需求定制開發; l 人工校對、多層級語音數據標注; | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
數據規格 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
歡迎光臨 電子工程網 (http://m.qingdxww.cn/) | Powered by Discuz! X3.4 |