【導(dǎo)讀】音頻/語(yǔ)音用戶接口(VUI)是未來(lái)人機(jī)交互的一個(gè)重要的新興趨勢(shì),將越來(lái)越多地用于智能家居控制、樓宇自動(dòng)化、智能零售、聯(lián)接的汽車(chē)、醫(yī)療等物聯(lián)網(wǎng)垂直領(lǐng)域,這涉及語(yǔ)音觸發(fā)、識(shí)別、處理技術(shù),同時(shí)設(shè)計(jì)人員還面臨如何提高能效的挑戰(zhàn)。針對(duì)本地和云端,安森美半導(dǎo)體都有相應(yīng)的VUI方案,提供先進(jìn)的語(yǔ)音觸發(fā)、識(shí)別、處理、控制等功能,具備出色的計(jì)算能力和能效,確保卓越的用戶體驗(yàn)。
VUI架構(gòu)及分類
圖1是基于
麥克風(fēng)陣列的高級(jí)語(yǔ)音接口架構(gòu),本地處理需要進(jìn)行說(shuō)話人跟蹤、語(yǔ)音增強(qiáng),其中涉及波束成形、喚醒詞檢測(cè)、聲源定位、降噪、語(yǔ)音檢測(cè)等技術(shù),云端方案則涉及自然語(yǔ)言處理。其后,指令還需通過(guò)音頻播放功能播放出來(lái),同時(shí)需進(jìn)行回聲消除。
圖1:基于麥克風(fēng)陣列的高級(jí)語(yǔ)音接口架構(gòu)
本地VUI以預(yù)存的詞或句為識(shí)別單位,說(shuō)話人可以是特定用戶也可以是非特定用戶,而云端VUI基于人工智能進(jìn)行語(yǔ)義理解和語(yǔ)音合成,說(shuō)話人是非特定用戶。本地VUI通過(guò)藍(lán)牙聯(lián)接網(wǎng)絡(luò),而云端VUI通常通過(guò)WiFi聯(lián)接。本地VUI的功耗和信息泄露的風(fēng)險(xiǎn)相對(duì)更低,云端VUI具有更高的識(shí)別率和擴(kuò)展性。相對(duì)而言,本地VUI比云端VUI的功耗低。設(shè)計(jì)人員可根據(jù)特定應(yīng)用需求決定是用本地VUI方案還是云端VUI方案。
本地VUI方案
根據(jù)本地VUI方案的特點(diǎn),它必須能進(jìn)行雙向語(yǔ)音通信,能識(shí)別非特定用戶語(yǔ)音,支持充足的指令和多種語(yǔ)言,可靈活擴(kuò)展,最好把波束成形和降噪等技術(shù)集成到單個(gè)芯片上以降低成本和減小占位。如安森美半導(dǎo)體的單芯片方案LC823450,含雙Cortex-M3核,集成數(shù)字信號(hào)處理(DSP)用作語(yǔ)音前端處理,SRAM提供1656k字節(jié)內(nèi)存,無(wú)需配備輔助內(nèi)存芯片,含兩個(gè)數(shù)字麥克風(fēng)I/F接口、兩個(gè)數(shù)模轉(zhuǎn)換器,包括回音消除、降噪等先進(jìn)功能,具備極高擴(kuò)展性、小占位,功耗超低,若結(jié)合生態(tài)系統(tǒng)合作伙伴的語(yǔ)音控制技術(shù)如Sensory的TrulyHandsfree,支持喚醒詞和語(yǔ)音命令的定制,適用于家居自動(dòng)化和音樂(lè)播放的語(yǔ)音交互。
圖2所示為本地VUI方案的一個(gè)示例應(yīng)用框圖及評(píng)估板。采用安森美半導(dǎo)體的超低功耗音頻處理單芯片LC82345X、麥克風(fēng)預(yù)放大器FAN3852、低壓降穩(wěn)壓器(LDO)NCP170、同步PWM開(kāi)關(guān)降壓穩(wěn)壓器NCP3170、單聲道音頻功率放大器NCP2823。安森美半導(dǎo)體憑借在電源管理的經(jīng)驗(yàn)和專知,使這方案實(shí)現(xiàn)超低功耗,這是此方案與其他競(jìng)爭(zhēng)對(duì)手方案相比的一個(gè)優(yōu)勢(shì)?,F(xiàn)有的方案雖然未集成WiFi、藍(lán)牙雙模的模塊,但安森美半導(dǎo)體已收購(gòu)了WiFi領(lǐng)袖Quantenna,已具備相關(guān)技術(shù),未來(lái)會(huì)考慮將WiFi模塊也集成進(jìn)去。
圖2:語(yǔ)音控制應(yīng)用框圖及評(píng)估板
云端VUI方案
從應(yīng)用場(chǎng)景來(lái)看,云端VUI除了進(jìn)行語(yǔ)義理解和語(yǔ)音合成,還可推送各種服務(wù),如智能語(yǔ)音助手除了可播放音樂(lè)、講故事,還支持智能零售,如打車(chē)、叫外賣(mài)等。當(dāng)前云端VUI的一個(gè)痛點(diǎn)是工作頻率較高,需外接存儲(chǔ)器和閃存,耗電量大,物料單(BoM)成本高。安森美半導(dǎo)體的音頻DSP系統(tǒng)單芯片(SoC)LC823455方案很好地解決了這些痛點(diǎn)問(wèn)題,集成4M RAM,無(wú)需外部存儲(chǔ),除了CPU核外還含波束成形、降噪、回音消除功能,集成預(yù)實(shí)現(xiàn)的音頻硬件(模數(shù)轉(zhuǎn)換器、數(shù)模轉(zhuǎn)換器及功放),降低BoM成本,因降低時(shí)鐘頻率從而提供功耗優(yōu)化的MCU,功耗超低,提供穩(wěn)定的聯(lián)接和極高擴(kuò)展性,寬廣的封裝陣容支持各種音頻產(chǎn)品,如音樂(lè)播放器、錄音器、智能家電、WiFi/藍(lán)牙音箱等。
圖3所示為智能音箱參考設(shè)計(jì)框圖,此參考設(shè)計(jì)基于LC823455,有4個(gè)ONA101V和1個(gè)ONA40功放,含USB-C PD源/汲接口,支持Strata平臺(tái),設(shè)計(jì)人員只需將此評(píng)估板插入裝有Strata的電腦,即可自動(dòng)識(shí)別并開(kāi)始下載相關(guān)的所有文檔及配套資料,包括原理圖、布板、測(cè)試報(bào)告、用戶指南等,同時(shí)出現(xiàn)圖形用戶界面(GUI),顯示所有相關(guān)參數(shù)和選項(xiàng)供工程師開(kāi)始評(píng)估,幫助加快和簡(jiǎn)化開(kāi)發(fā)。此參考設(shè)計(jì)目前支持亞馬遜Alexa語(yǔ)音服務(wù),安森美半導(dǎo)體也在同中國(guó)國(guó)內(nèi)一些語(yǔ)音服務(wù)商接洽,未來(lái)也會(huì)支持國(guó)內(nèi)語(yǔ)音助手。這方案最顯著的一個(gè)優(yōu)勢(shì)也是超低功耗,經(jīng)過(guò)將其與競(jìng)爭(zhēng)對(duì)手方案的功耗進(jìn)行測(cè)試,安森美半導(dǎo)體的方案功耗約為競(jìng)爭(zhēng)對(duì)手方案功耗的一半。
圖3:智能音箱參考設(shè)計(jì)框圖
安森美半導(dǎo)體的移動(dòng)及智能音箱音頻技術(shù)/知識(shí)產(chǎn)權(quán)
安森美半導(dǎo)體具備豐富的知識(shí)產(chǎn)權(quán)支持移動(dòng)及智能音箱的設(shè)計(jì)開(kāi)發(fā),包括音頻處理系統(tǒng)、D類功放、麥克風(fēng)預(yù)放大、高性能音頻開(kāi)關(guān),提供具競(jìng)爭(zhēng)力的優(yōu)勢(shì)助力設(shè)計(jì)人員設(shè)計(jì)出具競(jìng)爭(zhēng)優(yōu)勢(shì)的產(chǎn)品。
在音頻處理系統(tǒng)方面的競(jìng)爭(zhēng)優(yōu)勢(shì)包括小的PCB占位、高度集成的SoC(CPU+DSP+音頻)、集成ARM Cortex-M3雙核、專有的32位DSP。
在D類功放方面,支持小于10 W、10W至30 W,針對(duì)大于30 W的應(yīng)用僅提供樣品。其中小于10 W的功放尺寸小,采用模擬輸入,10W至30W的功放支持?jǐn)?shù)字接口,提供最佳的動(dòng)態(tài)范圍、增益誤差漂移。
對(duì)于麥克風(fēng)預(yù)放大,安森美半導(dǎo)體的方案采用最小的標(biāo)準(zhǔn)間距WLCSP封裝將模擬音頻轉(zhuǎn)換為數(shù)字音頻,支持不同的傳感器接口。
音頻開(kāi)關(guān)方面,安森美半導(dǎo)體提供最小阻抗/面積的耗盡型開(kāi)關(guān)。
周邊技術(shù):USB Type-C和D類功放
USB Type-C使每個(gè)端口都能成為電源、數(shù)據(jù)、視頻或音頻端口,大大地方便了用戶,將越來(lái)越多地用于各種電子應(yīng)用,如語(yǔ)音交互。安森美半導(dǎo)體提供完整的USB Type-C方案陣容支持音頻應(yīng)用的開(kāi)發(fā),包括供電、復(fù)用音頻信號(hào)、信號(hào)開(kāi)關(guān)、接口保護(hù)等,具有最小的占位、超低靜態(tài)功耗,集成豐富的保護(hù)功能。
智能音箱等新興音頻應(yīng)用對(duì)功放的要求越來(lái)越高,安森美半導(dǎo)體針對(duì)性地開(kāi)發(fā)出了一系列10 W以上功率等級(jí)的D類功放產(chǎn)品線,結(jié)合陶瓷封裝技術(shù)、CMOS電路技術(shù)及可針對(duì)不同應(yīng)用定制的功率MOSFET技術(shù),提供低熱阻、高頻互聯(lián)、高功率密度、低噪聲(<70 uV)、低總諧波失真(THD<0.03%)等優(yōu)勢(shì)。以O(shè)NA101V為例,這是一款單通道數(shù)字輸入D類功放,動(dòng)態(tài)范圍105 dB,帶喇叭采樣數(shù)字輸出功能,該功能實(shí)時(shí)采樣所驅(qū)動(dòng)喇叭的電壓和電流,可使用微控制器上運(yùn)行的算法來(lái)計(jì)算喇叭特性。這些參數(shù)可用于計(jì)算喇叭電阻、回響、溫度等。根據(jù)這些值,可以創(chuàng)建算法來(lái)執(zhí)行一系列任務(wù),從而實(shí)現(xiàn)喇叭保護(hù)、范圍擴(kuò)展等功能。
總結(jié)
語(yǔ)音交互正日漸流行,語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)是VUI的基礎(chǔ),安森美半導(dǎo)體提供本地VUI方案和云端VUI方案,集成波束成形、回音消除、降噪等先進(jìn)的語(yǔ)音處理技術(shù)、超低功耗電源管理及USB Type-C、D類功放等周邊器件,并攜手生態(tài)鏈合作伙伴,大大降低BoM成本,同時(shí)具備出色的計(jì)算能力和超低功耗,提供極佳的用戶體驗(yàn)。
推薦閱讀: