智能门铃设计:视频、音频及电源技术

【智能门铃设计:视频、音频及电源技术】出于日常生活中的安全考虑,本文研究了与视频门铃相关的一些设计难题,并围绕着视频、音频及电源技术,给相关嵌入式开发者一点参考 。
无缝的用户体验
传统的视频门铃系统涉及按键,麦克风和摄像机 。这些系统通常被硬连接到电源上,视频被路由到特定的监视器 。IoT的视频门铃架构类似,但实现方式却大不相同 。运动传感器可检测到走到门口的访客,并通过云将视频流传输到智能手机或云端存储 。与访问者的通信通过应用程序中运行的双向IP音频流和双向视频流进行 。这些门铃的基本功能可以与完整的安全系统集成在一起,该系统可以远程启用/禁用无钥匙锁,触发警报或根据特定输入提供自动反馈 。
视频门铃的早期版本经常受到视频和音频问题的困扰,例如错误的铃声和不连贯的音频,但是诸如云备份,运动检测,视频流和双向通信之类的关键功能需要无缝连接才会有商业价值 。这些要求,再加上以前的硬连线功率限制,给现代视频门铃子系统带来了一系列自身的硬件挑战 。
错误动作事件
可视门铃中常用的热电(又称无源红外)传感器容易出错,例如对白天行驶的车辆产生的眩光做出错误的反应,阵阵暖风,虫子,动物以及各种各样的其他物体 。基于热量的活动,并在此过程中触发用户手机上令人讨厌的错误警报音和通知 。由于用户最终将完全忽略警报,甚至使门铃脱机,这极大地降低了视频门铃的安全性 。此外,PIR传感器频繁发生的虚假运动检测事件会大大缩短电池寿命 。
一种相对简单的解决方案是使用两个PIR传感器,它们的覆盖范围略有重叠,以创建更大的运动检测区域(图1) 。由于双传感器仅生成较大物体的通知,因此较小的物体(例如臭虫和宠物)将不会被发现 。将PIR传感器与其他光传感器和温度/湿度传感器一起使用可避免因温度或光的快速变化而引起的误触发 。这种多模式传感方法减少了错误警报的可能性,同时还减少了总功耗,从而延长电池寿命 。
图1冗余的PIR传感器提高了人体运动检测的准确性,因为必须触发多个光束才能将其视为运动事件 。
另外也可以使用嵌入式MCU和某些固件来实现基于算法的运动检测,以提高准确性 。有多种方法可以实现基于视觉运动的检测,但是最常见的方法之一是将当前帧与参考图像进行比较,并逐像素跟踪差异 。这种类型的图像处理必须足够智能,以将来自风车和树木的运动作为背景的一部分来处理,以避免产生误报,而这种能力需要相当大的处理能力 。
这些过滤任务中的一些可以转移到基于云的算法上,该算法可以微调特定客户的图像数据 。但这需要相对较大的基础架构来提供支持和良好的Wi-Fi连接,并且仍然会是高功耗 。因此,电池供电的智能门铃不是一个明智选择——至少目前是这样 。尽管可以依靠外部供电减少了门铃的位置选择,但也不需要充电或更换电池 。
图像传感器和处理器接口问题
视频门铃中的图像处理需要图像传感器、数字多媒体处理器,并且在大多数情况下,需要一些外围设备 。选择图像传感器时,需要考虑几件事,其中最重要的是分辨率、帧速率、像素大小、像素结构和快门时间 。除了各个组件的诸多考虑因素之外,图像传感器和数字媒体处理器之间经常存在接口问题 。
除非特别注意,否则您可能会发现自己的设备因其输入/输出(I/O)接口格式不匹配而无法相互通信 。由于I/O接口(I2C,并行,通用I/O)存在大量差异,因此这样的错误比人们想象得多很多 。为了避免这种不愉快的情况发生,设计人员必须确保图像传感器支持的I/O接口与数字媒体处理器的I/O兼容 。
当两个设备具有不同的工作电压和逻辑信号电平时,可能会出现类似的问题 。幸运的是,电压转换器可以通过范围介于0.6至5.5 V的双向电压转换轻松解决这种不匹配问题,尽管它们为产品的BOM增加了很小的成本,但电压转换设备通过为设计人员提供范围更广的传感器来补偿这一投入,过去传感器和MCU必须要使用相同的配套电压才可以 。
容易产生噪音的环境
现代视频门铃所需的全双工通信增加了其他复杂性,要求设计必须处理因用户将扬声器/麦克风增益调节得过高而导致的不稳定反馈 。例如,接收音频的人需要在扬声器上获得相对较大的增益才能充分辨别远端正在说什么,但是麦克风的近距离很容易检测到声音并经常将其放大,从而导致不良回声(图2) 。过去,半双工通信通过显着降低扬声器接收信号时麦克风的增益来减轻这种回声 。
图2双向音频通信在回响的语音和回声方面要认真考虑
主动调整麦克风和扬声器增益的系统可能会在环境噪声水平相对较低的环境中为全双工通信纠正此问题 。不幸的是,这在具有不可预测的环境噪声源(例如经过的公共汽车或其他交通)的环境中效果不佳 。有几种可以解决此问题的数字信号处理(DSP)技术,包括回声消除(AEC)和自适应频谱降噪(ASNR) 。AEC创建了自适应滤波器,可通过最初识别传输的信号并在某个时间窗口内重新出现该信号时将其消除来有效消除回声 。ASNR利用频域从音频信号中去除环境噪声和有害噪声分量,从而去除背景噪声和宽带噪声 。AGC则旨在改善免提通信的低频语音信号 。诸如此类的音频算法通过保持麦克风和扬声器的增益而不会产生不必要的反馈和回声或诉诸语音切换,从而提供了卓越的音频体验 。
最大限度地利用扬声器
尽管复杂的DSP算法有助于实现全双工音频通信,但它们通常无法最大程度地发挥系统音频扬声器的全部功能 。由于扬声器音圈中的过多热量和超出其偏移极限会导致快速损坏和音锥吹响,因此音频工程师通常会对放大级别施加硬性限制,使其远低于扬声器的实际功能 。与放大器串联使用的软件算法可以实时监控扬声器的温度和偏移,该反馈可实现更精细的声压级和更高的音频清晰度 。
语音命令和语音识别
未来的视频门铃可能会基于语音激活和语音识别技术实现免提控制 。这些语音用户界面再次从一系列麦克风和DSP算法接收命令时,又增加了另一层复杂性 。尽管与接收麦克风的距离相对较大,但这些门铃很可能会使用波束成形算法将所需的音频信号与背景噪声分开 。已经有可用的麦克风板实现了波束形成算法,该算法可以放大来自扬声器方向的语音信号,以便从嘈杂的环境中获得清晰的语音和音频 。
在真正实用的视频门铃产品中,重要的是这些高级功能不需要额外的电源,并且可以对本地麦克风输入信号起作用 。我们正在寻找一种设计策略,以使产品更简单,低功耗,小尺寸 。
功耗预算挑战
实用的视频门铃可以通过以下方式之一供电:使用可充电电池,允许其从房屋现有的低压门铃布线中获取电能,或为其配备以太网供电(PoE)接口 。这些电源选项各有利弊(表1) 。如前所述,电池供电单元所提供的灵活放置方式使安装更加简单,而门铃线则具有维护成本低的优势 。
节能是电池供电的视频门铃的主要关注点,许多上述算法将需要更多的功耗密集型处理 。高度特定的SoC设计,例如德州仪器(TI)CC3120 / CC3220,可通过较少的片外事务(片上RAM和/或闪存)实现更高级别的并行处理(唤醒/睡眠触发器,网络连接),从而降低系统总功耗 。此外,专为电池供电而设计的MCU具有多种电源模式,包括关机,休眠,睡眠,待机和活动模式,精心的开发人员可以使用它们进一步降低能耗 。
设计用于使用家庭现有门铃电源的任何产品的主要考虑因素是,交流电源中没有针对这些产品的标准输出电压,交流电源最初是为使用8 V至24 V AC之间的电压为电铃供电而设计的 。为了最大程度地降低产品的性能下降,重要的是要仔细注意一些参数,例如输出电压精度,电压纹波,满负载下的系统效率和散热 。对于特别敏感的组件,例如经常在视频门铃中使用的CMOS图像传感器,尤其如此 。这些组件对噪声源特别敏感,例如电源波动,电磁干扰和温度变化 。
为了实现最佳性能,视频门铃需要一个电源,该电源可以接受各种低电压转换器,并为其各个子系统(传感器,I/O,音频,内存,UI等)产生干净,稳压良好的直流电,也必须小型化以便放入紧凑型外壳中 。如图3所示,这通常涉及多个降压转换器,最好是采用在重负载下提供高效率的同步降压转换器 。在这种需要宽电压范围或大量分立电源的设计中,可以使用单个降压稳压器为多个线性稳压器供电 。
图三:可视门铃电源架构示意图
对于电池供电的应用,满负荷和轻负荷下的系统效率都是必需的,对于在密闭包装,通风很少或没有通风的情况下运行的产品,也是如此 。对于视频门铃,必须仔细实现诸如用户界面,无线通信监视和运动检测之类的功能,以最大程度地提高电源效率 。必须同样注意待机电流,例如电源的静态电流和关断电流,因为它们会严重影响电池寿命 。低静态电流可以大大延长电池的使用寿命,因为视频门铃将其大部分时间都花费在睡眠/休眠模式下 。此外,同步转换器具有从其脉宽调制模式到省电模式的无缝过渡,使其在满负载和轻负载下均保持相对高效 。
视频门铃是具有严格尺寸限制(有时甚至是功率限制)的几种IoT产品之一,并且必须在处理器功耗高的算法与有限的功率资源之间取得平衡 。这些限制导致了一些独特的设计挑战,现在技术上的进步使得克服这些挑战成为可能 。自然地,随着人工智能以语音,声音和面部识别的形式成为住宅安全系统的必备功能,这些挑战将继续变得越来越复杂 。

    推荐阅读