语音控制系统中的功耗降低--上海韬放電(diàn)子科(kē)技有(yǒu)限公司

24小(xiǎo)时联系電(diàn)话:18217114652、13661815404

中文(wén)

您当前的位置：: 首页>; 電(diàn)子资讯>; 技术专题>; 语音控制系统中的功耗...

技术专题

语音控制系统中的功耗降低

2021-05-18

语音控制系统中的功耗降低

仅使用(yòng)语音来控制机器的能(néng)力已成為(wèi)许多(duō)商(shāng)业和消费者系统中的流行功能(néng)。但是语音控制的问题在于设备必须始终处于监听状态，这意味着必须始终為(wèi)其供電(diàn)。不过，新(xīn)的选择正在不断涌现，它们可(kě)以帮助设计人员减少语音激活设计的功耗。

使机器对口头命令做出适当响应是一个巨大的处理(lǐ)挑战。它要求系统首先有(yǒu)一个麦克风来拾取声音，一个数字转换器将声音转换成处理(lǐ)器可(kě)以使用(yòng)的东西，然后进行大量的数字信号处理(lǐ)以从声音中提取语音信息。涉及的处理(lǐ)量将取决于需要识别的命令字的数量。词汇量有(yǒu)限的系统可(kě)以使用(yòng)图1中所示的结构进行本地处理(lǐ)，以进行单词发现，而需要自然语音理(lǐ)解的系统可(kě)以使用(yòng)云计算资源进行进一步处理(lǐ)。

图1典型的语音控制系统必须不断处理(lǐ)声音以寻找命令字

不幸的是，大多(duō)数时候没有(yǒu)语音发生，并且浪费了处理(lǐ)和消耗的功率。通过要求用(yòng)户首先按下按钮等来启动语音处理(lǐ)，可(kě)以避免浪费。但是，如果仅通过语音激活系统，则必须始终捕获并处理(lǐ)声音，以免丢失命令。这对于電(diàn)池供電(diàn)的应用(yòng)特别引起关注，因為(wèi)语音处理(lǐ)的“始终在線(xiàn)”性质可(kě)能(néng)会消耗大量電(diàn)池。

為(wèi)了减少浪费的精力并节省功率，语音处理(lǐ)系统通常会使用(yòng)“唤醒”字进行激活。这种方法所需的功率较小(xiǎo)，因為(wèi)在大多(duō)数情况下，语音处理(lǐ)只需要能(néng)够识别单个特定单词，而不是其全部功能(néng)词汇。因此，该系统可(kě)以在侦听唤醒字的同时运行更简单，耗電(diàn)更少的处理(lǐ)算法，从而暂停整个语音处理(lǐ)工作，直到检测到唤醒字為(wèi)止。

為(wèi)了追求这种方法，业界已经投入大量精力来开发需要最小(xiǎo)功率的唤醒单词引擎。通常，这些引擎只能(néng)识别几个单词，从而為(wèi)用(yòng)户提供可(kě)能(néng)的唤醒选项的选择。但是，某些引擎可(kě)以识别足够多(duō)的单词，以提供有(yǒu)限形式的语音控制，从而提供多(duō)个命令。但是，对于更复杂的语音控制，唤醒词引擎的目的只是為(wèi)了及时激活功能(néng)更强大，更耗電(diàn)的处理(lǐ)，以接收和解释将跟随唤醒词的语音命令。

这些唤醒词引擎在不断发展。最近的一项介绍是将Retune的VoiceSpot单词斑点算法与CEVA的低功耗DSP系列配对。该组合可(kě)以执行波束成形和声學(xué)回声消除，以提高在存在噪声的情况下单词识别以及唤醒单词识别的可(kě)靠性。该算法的总内存占用(yòng)量不到80 KB，主要针对较小(xiǎo)的，由電(diàn)池供電(diàn)的应用(yòng)，例如耳塞，智能(néng)手表和运动相机。

另一个最新(xīn)的介绍将Cyberon的CSpotter算法与瑞萨的RA6系列微控制器结合使用(yòng)。该算法使用(yòng)基于音素的建模，支持30多(duō)种语言。它可(kě)以用(yòng)作唤醒引擎或使用(yòng)多(duō)个不同的命令集提供本地语音控制。该处理(lǐ)器為(wèi)数字麦克风提供I 2 S（IC间声音）接口，从而无需ADC。

两种方法尽管已将语音识别任務(wù)减至最少，但仍依靠数字信号处理(lǐ)来进行唤醒词识别。这為(wèi)始终接通的電(diàn)源需求设置了下限，这在電(diàn)池供電(diàn)的应用(yòng)中可(kě)能(néng)仍然很(hěn)麻烦。但是，还有(yǒu)另一种技术可(kě)以為(wèi)始终在線(xiàn)的唤醒字识别节省更多(duō)功率。

模拟机器學(xué)习技术是关键。RAMP（可(kě)重配置模拟模块化处理(lǐ)器）芯片，首先将声音识别為(wèi)语音，然后再尝试确定语音是否在说唤醒词。RAMP芯片允许系统执行的操作是，在执行任何语音处理(lǐ)之前，先确定所检测到的声音实际上是语音。如图2所示，这种预先确定甚至可(kě)以使唤醒单词引擎在没有(yǒu)人讲话时也保持休眠状态。

图2通过首先确定声音是否是语音，RAMP芯片允许语音处理(lǐ)安全地忽略其他(tā)类型的声音。

该芯片使用(yòng)模拟神经网络来实现这一目标，该模拟神经网络经过训练可(kě)以将人的声音与其他(tā)声音區(qū)分(fēn)开，然后向声音处理(lǐ)系统发送激活信号，以确定声音是否在说唤醒词。為(wèi)了确保语音处理(lǐ)具有(yǒu)完整的语音模式，芯片将在预卷式缓存中缓存500毫秒(miǎo)的捕获声音。当芯片将声音识别為(wèi)语音时，它会将传入的声音（从前滚动数据开始）定向到语音处理(lǐ)系统以进行解释。

这种方法允许语音控制系统仅使RAMP芯片持续供電(diàn)。每当没有(yǒu)人讲话时，语音处理(lǐ)硬件（包括唤醒词引擎）就可(kě)以保持休眠状态。在大多(duō)数情况下，没有(yǒu)语音的时间段表示系统运行的大部分(fēn)时间。与唤醒字检测所需的典型数十毫安電(diàn)流相比，RAMP芯片和主机微控制器仅需要约25μA的電(diàn)流。因此，与始终在線(xiàn)的唤醒字检测相比，忽略静音和非语音声音的能(néng)力可(kě)以节省大量功率。

语音控制中的这种降低功率的创新(xīn)很(hěn)可(kě)能(néng)会继续发生，从而将语音激活操作的潜力扩展到从線(xiàn)路供電(diàn)到電(diàn)池供電(diàn)设计的应用(yòng)中。无论通过语音控制给定设备是一个好主意，无论其電(diàn)源如何，它都已成為(wèi)一种实用(yòng)的选择。

上一篇：新(xīn)的Arm架构為(wèi)IoT带来了增强的安全性和AI: 下一篇：用(yòng)于功率转换的新(xīn)型增强型栅极驱动器

技术专题

语音控制系统中的功耗降低

相关新(xīn)闻

電(diàn)子资讯

最新(xīn)新(xīn)闻