科大讯飞六麦环形阵列板

¥349.00

本麦克风阵列采用平面式分布结构,包含6个麦克风,可实现360度等效拾音,唤醒定位分辨率为1度。

库存 100 件

麦克风阵列是由一定数目的声学传感器(一般为麦克风)组成,对声场的空间特性进行采样并处理的系统。其主要作用有声源定位,抑制背景噪声、干扰、混响、回声,信号提取与分离。声源定位是指利用麦克风阵列计算声源距离阵列的角度和距离,基于TDOA(Time Difference Of Arrival,到达时间差)实现对目标声源的跟踪;信号的提取与分离是指在期望方向上有效地形成一个波束,仅拾取波束内的信号,从而达到同时提取声源和抑制噪声的目的;此外利用麦克风阵列提供的信息基于深度神经网络可实现有效的混响去除,从而极大程度上提升了真实应用场景中语音交互的效果。

本麦克风阵列板载系统为Linux系统,用户可以使用任一搭载Linux系统的主机进行通信,主机与麦克风阵列之间的通信方式为基于USB的自定义通信协议。基于这些协议用户可以在主机端进行诸如麦克风板开机、获取音频、设置主麦方向、获取唤醒角度等操作。

为便于用户使用,本麦克风阵列配备SDK供使用,主要是对一些协议进行API的封装,以便于用户使用,除此,还提供了三个案例,供用户学习如何操作麦克风阵列以及利用麦克风阵列进行离线命令词识别和人机交互。用户也可以参照这几个案例进行其他自定义功能的编写。

  • audio:用于存放录制的音频文件,音频文件的命名是自定义的,以sample文件夹中给出的mic_demo_sample为例,其程序中定义的降噪后音频文件的命名为mic_demo_vvui_deno.pcm,原始音频文件命名为mic_demo_vvui_ori.pcm。
  • bin:用于存放可执行文件,call.bnf为自定义的离线命令词识别语法,可根据自己实际场景进行更改。
  • include:包含麦克风阵列启动、给定案例中需要的头文件。
  • libs:包含麦克风阵列启动、给定案例中需要的动态库文件,为了兼容不同的平台,给定了兼容Jetson Nano的ARM版动态库,以及兼容x64系统、x86系统的动态库。
  • sample:包含给出的三个演示案例,分别是:

1)mic_demo_sample:麦克风基本功能测试用例,熟悉麦克风开机、录音、设置主麦方向、获取唤醒角度等基础功能演示demo;

2)offline_command_sample:离线命令词识别用例,通过离线命令词识别进行控制机器人运动,使用技术为讯飞离线命令词识别功能;

3)aiui_sample:在线交互用例,通过在线AIUI进行实时交互,可提供查询、闲聊等能力,该功能基于讯飞AIUI平台。

:在每一个案例中都包含了该案例实现的源码文件,以及编译用的Makefile文件,用户可直接执行相应主机系统的.sh文件进行编译和链接以生产可执行文件。

  • tmp:包含文件麦克风阵列板所需的资源文件,常态下为隐藏文件,用户可忽略。

使用教程

1.科大讯飞六麦克环形阵列板快速上手

购买过此产品并已登录的顾客才可发表评论。