Edge AI 语音交互与MCP外设控制实践 | 技术集结
小智AI是一款集成大语言模型(LLM)的端侧智能交互框架,能够实现从语音唤醒、云端对话到通过MCP协议(Model Context Protocol)实时控制外设的完整闭环。为物联网设备提供了低门槛、高响应的自然语音交互能力,开发者无需精通复杂的人工智能算法,即可快速在嵌入式硬件上构建具备对话和控制功能的智能产品。
本文将手把手带你学习如何在Edgi-Talk平台上部署小智AI,并通过语音指令控制开发板上的LED、屏幕亮度等外设。这套流程不仅适用于Infineon PSOC-E84,其核心原理——包括端侧语音交互设计、MCP协议对接以及硬件驱动适配——同样可迁移至其他ARM嵌入式平台。
小智AI实验
1. 进入小智AI项目工程:Edgi_Talk_M55_XiaoZhi

固件编译:
打开env,输入scons进行工程的编译,编译生成固件在当前目录下:rtthread.hex
固件烧录:和环境搭建环节中的烧录方式一样,使用openocd工具进行命令行烧录即可:
./openocd.exe -s ../scripts -s ../flm/cypress/cat1d -f interface/kitprog3.cfg -f target/infineon/pse84xgxs2.cfg -c"set QSPI_FLASHLOADER ../flm/cypress/cat1d/PSE84_SMIF.FLM"-c"transport select swd"-c"set ENABLE_ACQUIRE 0"-c"init; reset init; flash write_image erase ./rtthread.hex; reset run; exit"
如何配置小智APP联网:
注意:如果手上有SD卡,可以把卡插入到开发板的SD卡槽,下一次开机会自动联网了
开发板第一次默认会进入AP模式,需要找到对应的AP进行连接,密码在屏幕上有显示:
确保连接成功后,在设备的浏览器中输入:192.168.169.1,进入后台界面,进行配网:

先点击 scan 扫描周围 wifi 热点:
连接成功后,会显示如下界面:

当屏幕上显示“待命中”的时候,代表可以正常进行对话了

按一下开发板的第一个用户按键进行对话,然后等待1-2S小智会自动回复。
小智的表情含义:
联网中,请等待完成

监听对话中,此时需要按下用户按键/说出唤醒词“小睿,小睿”,然后进行对话

小智进入聆听状态,此时会处理对话内容,等一句话说完停顿后会进行处理
对话中,此时小智会回复你的对话请求

休眠状态,此时小智进入低功耗,需要手动按一下按键,然后等待小智进入待命中状态,然后就可以继续对话了

实现MCP控制开发板的外设
MCP 是将 Model Context Protocol 极致精简后,适配资源受限的嵌入式设备的轻量实现。
核心目标:让边缘侧的微控制器或小型SoC直接作为 MCP Server,暴露硬件能力(GPIO控制、传感器读取、电机驱动、LED、IoT上报等),供LLM通过标准化协议远程调用,实现“自然语言控制物理世界”。
目前支持的外设控制: LED小灯、屏幕亮度、声音大小
使用方法:
按一下开发板的第一个 用户按键 进行对话
小智进入聆听状态
对小智说“打开灯”、“关闭灯”、“调亮屏幕”、“调大声音”等命令即可实现MCP控制开发板外设
小智MCP小灯控制原理
MCP初始化发送IOT描述符

注册Iot设备

LED灯控制工具

控制方法对应的驱动

Edgi-Talk 开发板基于Infineon PSoC E84 MCU,为工程师提供了一个灵活、全面的嵌入式开发平台。 开发板集成了显示、音频、无线通信与多种外设资源,适用于多传感器融合、GUI 显示、多媒体及联网应用的快速原型验证与产品开发。搭载高性能的Arm Cortex-M55处理器,最高400MHz,以及Arm Cortex-M33,最高200MHz,搭配Ethos-U55和NNLite NPU运算单元,助力设计者为下一代设备打造无与伦比且高度人性化的终端用户体验。
