24小(xiǎo)时联系電(diàn)话:18217114652、13661815404

中文(wén)

您当前的位置:
首页>
電(diàn)子资讯>
技术专题>
语音控制系统中的功耗...

技术专题

语音控制系统中的功耗降低


语音控制系统中的功耗降低

仅使用(yòng)语音来控制机器的能(néng)力已成為(wèi)许多(duō)商(shāng)业和消费者系统中的流行功能(néng)。但是语音控制的问题在于设备必须始终处于监听状态,这意味着必须始终為(wèi)其供電(diàn)。不过,新(xīn)的选择正在不断涌现,它们可(kě)以帮助设计人员减少语音激活设计的功耗。

使机器对口头命令做出适当响应是一个巨大的处理(lǐ)挑战。它要求系统首先有(yǒu)一个麦克风来拾取声音,一个数字转换器将声音转换成处理(lǐ)器可(kě)以使用(yòng)的东西,然后进行大量的数字信号处理(lǐ)以从声音中提取语音信息。涉及的处理(lǐ)量将取决于需要识别的命令字的数量。词汇量有(yǒu)限的系统可(kě)以使用(yòng)图1中所示的结构进行本地处理(lǐ),以进行单词发现,而需要自然语音理(lǐ)解的系统可(kě)以使用(yòng)云计算资源进行进一步处理(lǐ)。

1典型的语音控制系统必须不断处理(lǐ)声音以寻找命令字

不幸的是,大多(duō)数时候没有(yǒu)语音发生,并且浪费了处理(lǐ)和消耗的功率。通过要求用(yòng)户首先按下按钮等来启动语音处理(lǐ),可(kě)以避免浪费。但是,如果仅通过语音激活系统,则必须始终捕获并处理(lǐ)声音,以免丢失命令。这对于電(diàn)池供電(diàn)的应用(yòng)特别引起关注,因為(wèi)语音处理(lǐ)的始终在線(xiàn)性质可(kě)能(néng)会消耗大量電(diàn)池。

為(wèi)了减少浪费的精力并节省功率,语音处理(lǐ)系统通常会使用(yòng)唤醒字进行激活。这种方法所需的功率较小(xiǎo),因為(wèi)在大多(duō)数情况下,语音处理(lǐ)只需要能(néng)够识别单个特定单词,而不是其全部功能(néng)词汇。因此,该系统可(kě)以在侦听唤醒字的同时运行更简单,耗電(diàn)更少的处理(lǐ)算法,从而暂停整个语音处理(lǐ)工作,直到检测到唤醒字為(wèi)止。

為(wèi)了追求这种方法,业界已经投入大量精力来开发需要最小(xiǎo)功率的唤醒单词引擎。通常,这些引擎只能(néng)识别几个单词,从而為(wèi)用(yòng)户提供可(kě)能(néng)的唤醒选项的选择。但是,某些引擎可(kě)以识别足够多(duō)的单词,以提供有(yǒu)限形式的语音控制,从而提供多(duō)个命令。但是,对于更复杂的语音控制,唤醒词引擎的目的只是為(wèi)了及时激活功能(néng)更强大,更耗電(diàn)的处理(lǐ),以接收和解释将跟随唤醒词的语音命令。

这些唤醒词引擎在不断发展。最近的一项介绍是将RetuneVoiceSpot单词斑点算法与CEVA的低功耗DSP系列配对。该组合可(kě)以执行波束成形和声學(xué)回声消除,以提高在存在噪声的情况下单词识别以及唤醒单词识别的可(kě)靠性。该算法的总内存占用(yòng)量不到80 KB,主要针对较小(xiǎo)的,由電(diàn)池供電(diàn)的应用(yòng),例如耳塞,智能(néng)手表和运动相机。

另一个最新(xīn)的介绍将CyberonCSpotter算法与瑞萨的RA6系列微控制器结合使用(yòng)。该算法使用(yòng)基于音素的建模,支持30多(duō)种语言。它可(kě)以用(yòng)作唤醒引擎或使用(yòng)多(duō)个不同的命令集提供本地语音控制。该处理(lǐ)器為(wèi)数字麦克风提供I 2 SIC间声音)接口,从而无需ADC

两种方法尽管已将语音识别任務(wù)减至最少,但仍依靠数字信号处理(lǐ)来进行唤醒词识别。这為(wèi)始终接通的電(diàn)源需求设置了下限,这在電(diàn)池供電(diàn)的应用(yòng)中可(kě)能(néng)仍然很(hěn)麻烦。但是,还有(yǒu)另一种技术可(kě)以為(wèi)始终在線(xiàn)的唤醒字识别节省更多(duō)功率。

模拟机器學(xué)习技术是关键。RAMP(可(kě)重配置模拟模块化处理(lǐ)器)芯片,首先将声音识别為(wèi)语音,然后再尝试确定语音是否在说唤醒词。RAMP芯片允许系统执行的操作是,在执行任何语音处理(lǐ)之前,先确定所检测到的声音实际上是语音。如图2所示,这种预先确定甚至可(kě)以使唤醒单词引擎在没有(yǒu)人讲话时也保持休眠状态。

2通过首先确定声音是否是语音,RAMP芯片允许语音处理(lǐ)安全地忽略其他(tā)类型的声音。

该芯片使用(yòng)模拟神经网络来实现这一目标,该模拟神经网络经过训练可(kě)以将人的声音与其他(tā)声音區(qū)分(fēn)开,然后向声音处理(lǐ)系统发送激活信号,以确定声音是否在说唤醒词。為(wèi)了确保语音处理(lǐ)具有(yǒu)完整的语音模式,芯片将在预卷式缓存中缓存500毫秒(miǎo)的捕获声音。当芯片将声音识别為(wèi)语音时,它会将传入的声音(从前滚动数据开始)定向到语音处理(lǐ)系统以进行解释。

这种方法允许语音控制系统仅使RAMP芯片持续供電(diàn)。每当没有(yǒu)人讲话时,语音处理(lǐ)硬件(包括唤醒词引擎)就可(kě)以保持休眠状态。在大多(duō)数情况下,没有(yǒu)语音的时间段表示系统运行的大部分(fēn)时间。与唤醒字检测所需的典型数十毫安電(diàn)流相比,RAMP芯片和主机微控制器仅需要约25μA的電(diàn)流。因此,与始终在線(xiàn)的唤醒字检测相比,忽略静音和非语音声音的能(néng)力可(kě)以节省大量功率。

语音控制中的这种降低功率的创新(xīn)很(hěn)可(kě)能(néng)会继续发生,从而将语音激活操作的潜力扩展到从線(xiàn)路供電(diàn)到電(diàn)池供電(diàn)设计的应用(yòng)中。无论通过语音控制给定设备是一个好主意,无论其電(diàn)源如何,它都已成為(wèi)一种实用(yòng)的选择。

请输入搜索关键字

确定