谈起语音助手,可能大家都会想到苹果手机中的Siri,这是业界都比较认可的语音智能助手,算是目前较为先进的一种人机交互方式。
随着硬件的不断更新迭代,我们也不断在刷新着人机交互的方式,从简单、直接的机械按键,到后来因大屏消费电子产品尤其是智能手机的普及而引领的触摸技术(电阻、电容、3D-Touch),人机交互的方式一直不断在进步。
而语音技术的发展,更是人机交互的一次升华,它让人和机器的距离更加靠近,人机接口更加自然,尤其在大势所趋的物联网产业带动下,智能硬件、智能家居等产品都被憧憬着和谐的人机互动方式——语音互动。
最近,爱板网拿到了一款由北京宇音天下推出的基于Lark7618语音识别WiFi模块的开发板,这是一款集成了云端语音识别、语音合成、语音唤醒及MP3解码的功能模块。
人机交互结合物联网,一看就觉得非常有意思,而且我们从板卡的命名中也可以看出Lark7618语音识别WiFi模块的一个重要特点——语音识别。
众所周知,语音技术的难点莫过于语音识别,主要在于语音识别输入的过程中包含了不可抗拒的环境噪声以及没有一套标准化的输入。语音识别不像我们接触的键盘,有一套专门的输入,不受外界环境影响,语音包含了不同国家、不同地区之间的语种、方言等、甚至跟你的咬字发音都非常关键,所以语音识别要么给制定一套标准的输入方式,人们按照既定的规则进行语音命令的输入,要么依托于语音识别技术的硬件具有强大的处理能力和软件算法,可以任意识别,显然,第二种方式目前不可行。
而对于对于Lark7618语音识别WiFi模块,毋庸置疑,应该属于已经具备一套标准的输入方式,用户需要的只是按照规则去实现命令,至于实际的体验效果,我们一起去看看。
Lark7618语音识别WiFi开发板给人的第一观感不错,能看出设计者的用心,整个板卡用亚克力盒子“封装”起来,像极了创客DIY的一个产品模型。仔细观察的话可以发现,开发板由两部分组成,底板功能板以及Lark7618百灵智能WiFi模块,如下图所示。
为了更清楚的看清板卡内部结构,我们取下亚克力的外壳。可以看到,除了Lark7618百灵智能WiFi模块外,底板实现了一个标准的音频输入输出功能以及包括用于扩展存储的MicroSD接口、供电以及实现USB转串口功能的USB接口,一些状态指示灯以及功能按键。
开发板可以通过板载的USB转串口芯片实现与PC机端的通信。
在开发板的背面是一个喇叭以及一个实现波特率调节的接口座。
比较有意思的是,板卡上的USB接口以及USB转串口都是采用了USB HOST接口,所以无论是供电还是连接电脑都需要一条两端都是USB HOST接口的线。
再来看下板卡上的Lark7618语音识别WiFi模块,这是宇音天下目前新推出的一款语音识别WiFi模块,在前代语音识别模块的基础上增加了联网的WiFi模块,可以说是特别针对物联网应用的特殊定制。
Lark7618模块支持3.3V~4.2V的电压供电,并且内置了充电电路,用户只需要将电池的VBAT、GND 对应接到Lark7618模块;同时,在需要对电池充电时,电脑的USB 的电源或充电器的电源接到Lark7618的VCHG、GND管脚即可。对于不需要电池供电的用户,VCHG 可以悬空。
针对语音功能,Lark7618 WiFi模块还集成了完整的音频输入输出电路,外部只需接上麦克、喇叭即可实现语音的采集输出等,如下图所示。
Lark7618 语音识别wifi 模块在实际的产品应用中需要配合外部的MCU使用,通过UART实现通信,我们拿到的开发板是通过USB转UART芯片实现与PC机的连接。
上电使用
Lark7618语音识别WiFi模块开发板的使用首先需要配置WiFi,目前可以通过手机APP以及电脑端的客户端软件配置。原本笔者想直接以通过电脑客户端进行配置为例说明的,不过在使用手机APP配置的时候发现了一件有趣的事情,所以呢,手机端的配置也跟大家啰嗦下。
手机APP配置
目前手机端只支持Andriod系统的App,App由宇音天下提供。打开APP,按照步骤来即可。
在用手机APP给Lark7618配置WiFi的时候看到了一个非常前卫时髦的WiFi配置方式,声波配置。
我们知道,WIFI设备连接路由器需要密码,但是这种过程比较麻烦,使用声波配置就是为了简化连接路由器的过程,这在我们平时接触的很多产品中都有类似的方式,比如蓝牙的配对可以通过NFC标签来简化连接过程。这里我们通过在手机上输入路由器SSID和密码信息,再转码成声波发给WIFI模块,依托于Lark7618开发板具有完备的音频电路,WIFI模块收到手机端发出的声波后进行解码,然后WIFI模块根据解码后的SSID和密码连接到路由器,过程不是很长,一次就成功,操作简单,噱头很酷,体验很好,这不正是目前智能硬件追求的效果嘛。
配置完成可以看到开发板的WiFi指示灯进入常亮状态。
PC端配置
PC端的WiFi配置是通过串口实现通信的,所以我们需要安装开发板上USB转串口芯片的驱动。
板载的USB转串口芯片是Silicon Labs的CP2102,这个驱动在网上可以找到,安装完成后我们就可以进行串口通信了。
宇音天下提供的PC端软件有两个,一个是Lark7618的资源管理工具,用于模块资源管理、出厂参数配置和烧录的配套工具,要想体验完整的功能,是需要注册的。
另一个是开发板的演示工具,可以用于评估板的功能测试。不过在使用这个工具的时候提示打开失败。咨询宇音天下的技术支持后得知,串口通讯采用Mscomm32.ocx控件,如果没有自动注册的话,需要手动执行注册。
针对win7的32位系统和64位系统,注册的方式还有些不同。在软件的同目录文件夹下有一个MSCOMM32.OCX的文件,64位的WIN7系统,注册方式为:
将MSCOMM32.OCX拷贝到c:windowsSysWOW64
在命令行窗口执行 REGSVR32.exe c:windowsSysWOW64MSCOMM32.OCX
如果是WIN7的32位系统,注册方式为:
将MSCOMM32.OCX拷贝到c:windowssystem32
在命令行窗口执行 REGSVR32.exe c:windowssystem32MSCOMM32.ocx
注:以上操作必须以管理员的命令来执行
注册成功就可以打开使用了。
从演示工具的主界面来看,主要的功能包括了语音识别、MP3播放、语音合成,对于这样一款产品,我们重点关注的还是语音识别以及语音合成。
笔者这里就通过PC端的软件作为上位机操作,发送启动语音识别命令给Lark7618语音模块,此时开发板会进入录音的状态,红色指示灯点亮。
对着开发板上的麦克风说话,模块把从麦克风采集到的语音数据,通过内部的识别模块进行转换成相应的识别结果,通过通讯接口回传给上位机的软件界面上,如下图所示,识别的结果为今天天气如何,很简单的语句可以清洗的识别结果。
但在环境噪声下或者对于普通话不标准的朋友来说,体验结果不如预想的效果好,虽然Lark7618语音识别WiFi模块结合云端语音识别听起来很强大,但是实际上被匹配到的词条还是不可能做到面面俱到,这也没办法,语音识别的准确性是整个行业都面临的困境,目前的语音识别技术体验过比较强的应该是苹果Siri以及科大讯飞的语音识别。
而语音合成这方面,宇音天下做得确实不错,功能挺强大的,目前合成音可以有6种人声选择,模块支持任意中文文本的合成,可以采用GB2312、GBK、BIG5 和Unicode大头或Unicode小头四类五种编码方式;也可以调节语调、语速,在某些智能数字符号的处理上也比较灵活,比如天气、时间、km/h等数字符号都能以正常的方式念出。
但是在使用中也发现了些许的不足,固然语音合成无法识别英文单词,但对于我们目前日常常用的一些短语如WiFi、Siri等也只能以一个一个英文字母念下来。
另外,Lark7618还可以通过UART 接口通讯方式接收命令帧,如控制命令帧、待合成的文本数据,实现文本到语音、语音到文本的转换以及语音唤醒功能,详细内容可以参考宇音天下提供的资料文档。
当然,你也不要把Lark7618语音识别WiFi模块想象的太过强大了,毕竟这只是一款面向物联网领域推出的语音控制型产品,它所适用的场所应该是类似智能家居产品中的简单命令,如开灯、关灯等常用的简短词汇。而面对这些产品,Lark7618本身支持的2000多条词汇也足够胜任,加上其完备的音频电路集成,确实是声控物联网产品的福音,可以广泛的适用于智能家居、高档玩具、教育设备等物联网相关的领域。(转自爱板网)
PS.收到模块的伙伴们,请及时与客服联系,索取开发资料!可在本公众号内留言!
原创文章,作者:筱凯,如若转载,请注明出处:https://www.jingyueyun.com/ask/592.html