新用户注册入口 老用户登录入口

[转载]树莓派安装snowboy

文章作者:转载 更新时间:2023-03-05 08:57:02 阅读数量:122
文章标签:snowboy麦克风配置PyAudio
本文摘要:这篇文章主要介绍了在树莓派上利用Snowboy实现语音唤醒功能的详细步骤。首先,为树莓派更换软件源并更新pip3;接着配置麦克风输入,通过安装PyAudio、sox等工具进行测试和调试;解决录音问题后,下载并编译适用于树莓派的Snowboy库,生成自定义唤醒词模型.pmdl文件;最后,在确保snowboydetect.py文件正确导入的前提下,运行demo.py加载自定义唤醒词模型以完成唤醒词识别功能。整个过程中涉及的关键技术与工具包括:树莓派、换源、麦克风配置、PyAudio、录音测试、ALSA-utils、PulseAudio、Snowboy、唤醒词训练及_snowboydetect.so动态链接库。
转载文章

本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_43556844/article/details/113617602。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

1、树莓派换源
参考链接:https://blog.csdn.net/qq_43556844/article/details/113615915
2、更新pip3
参考链接:https://blog.csdn.net/qq_43556844/article/details/113616214
3、存取麦克风
我们使用PortAudio作为音频输入/输出的跨平台支持。我们还使用sox作为快速实用程序来检查麦克风设置是否正确。

sudo apt-get install python-pyaudio python3-pyaudio sox
sudo pip3 install pyaudio

4、录制音频

rec test.wav

这里会报错,can’t open input ‘default’:
5、需要安装以下包,用以麦克风的配置

sudo apt-get install alsa-utils pulseaudio

6、再次测试

rec test.wav

7、使用ctrl + c停止录音,aplay test.wav播放。

8、下载snowboy,编译出适合自己系统的_snowboydetect.so
在这个链接下载:https://github.com/kitt-ai/snowboy
使用命令:git clone https://github.com/Kitt-AI/snowboy.git下载
安装以下工具,用以编译

sudo apt-get install swig (3.0.10或者更高的版本)
sudo apt-get install libatlas-base-dev

进入snowboy目录,执行以下命令,进行编译

cd /snowboy/swig/Python3make

得到了编译好的文件_snowboydetect.so
新建自己文件夹,将snowboy/example/Python3下的文件全复制到自己文件夹下,并将上一步编译后得到的_snowboydetect.so放到自己的文件夹中。
在这里插入图片描述

9、生成自己的唤醒词
训练模型:参考https://github.com/Kitt-AI/snowboy/

10、将自己的模型**.pmdl放到自己创建的文件夹snowboy里。
11、使用以下代码运行

注意:需要将官方案例中的 snowboydecoder.py 文件修改一下,把from . import snowboydetect 改为
import
snowboydetect然后再运行。并将编译后的swig/Python3目录下的snowboydetect.py复制到自己的目录中。

python3 demo.py **.pmdl

听到叮的一声,代表成功了。

完整参考文档:http://docs.kitt.ai/snowboy/#downloads

本篇文章为转载内容。原文链接:https://blog.csdn.net/qq_43556844/article/details/113617602。

该文由互联网用户投稿提供,文中观点代表作者本人意见,并不代表本站的立场。

作为信息平台,本站仅提供文章转载服务,并不拥有其所有权,也不对文章内容的真实性、准确性和合法性承担责任。

如发现本文存在侵权、违法、违规或事实不符的情况,请及时联系我们,我们将第一时间进行核实并删除相应内容。

相关阅读
文章标题:[转载][洛谷P1082]同余方程

更新时间:2023-02-18
[转载][洛谷P1082]同余方程
文章标题:[转载]webpack优化之HappyPack实战

更新时间:2023-08-07
[转载]webpack优化之HappyPack实战
文章标题:[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法

更新时间:2023-09-10
[转载]oracle 同时更新多表,在Oracle数据库中同时更新两张表的简单方法
文章标题:[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo

更新时间:2024-03-11
[转载][Unity] 包括场景互动与射击要素的俯视角闯关游戏Demo
文章标题:[转载]程序员也分三六九等?等级差异,一个看不起一个!

更新时间:2024-05-10
[转载]程序员也分三六九等?等级差异,一个看不起一个!
文章标题:[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集

更新时间:2024-01-12
[转载]海贼王 动漫 全集目录 分章节 精彩打斗剧集
名词解释
作为当前文章的名词解释,仅对当前文章有效。
树莓派(Raspberry Pi)树莓派是一款由英国的 Raspberry Pi 基金会开发的微型单板计算机,具有体积小巧、价格低廉且功能强大的特点。在本文中,它是作为实现语音唤醒功能的主要硬件平台,通过安装和配置相关软件,能够与麦克风等外部设备交互,进而实现对Snowboy库的支持以及自定义唤醒词的识别。
SnowboySnowboy是一个开源的、专为嵌入式设备设计的自定义唤醒词引擎,由Kitt.AI团队研发。在文章中,用户通过在树莓派上安装并编译Snowboy,可以训练自己独特的唤醒词模型,以实现在特定语音命令下激活设备或应用程序的功能。Snowboy具备跨平台支持能力,并且能够在本地运行,有助于保护用户隐私。
PyAudioPyAudio是Python编程语言的一个音频处理库,提供了一套简洁易用的API来处理音频输入/输出流。在本篇文章的上下文中,PyAudio被用于获取和操作树莓派上的麦克风输入数据,确保系统能够正确捕捉到用户的语音信号,为后续的唤醒词检测做准备。
ALSA-utilsALSA(Advanced Linux Sound Architecture)是一套为Linux操作系统设计的音频子系统。ALSA-utils是该架构的一系列实用工具集合,用于管理和调试音频硬件设备。在本文场景中,为了正确配置和测试树莓派的麦克风输入,需要通过`sudo apt-get install alsa-utils`命令安装这些工具,以便解决可能出现的音频输入问题。
PulseAudioPulseAudio是一个开源的声音服务器,它提供了跨多个应用程序的高级音频路由和混音功能,使得在Linux环境下管理音频变得更加灵活和高效。在本文中,当测试录音时遇到错误时,用户需安装PulseAudio以完善树莓派的音频输入配置,确保麦克风能够正常工作,为Snowboy的唤醒词识别提供稳定的声音输入源。
延伸阅读
作为当前文章的延伸阅读,仅对当前文章有效。
在完成树莓派与Snowboy的集成以实现语音唤醒功能后,您可以进一步探索更广阔的智能语音应用领域。近期,开源社区对基于AI的语音识别和处理技术关注度持续提升。例如,Mozilla最近推出了开源语音识别引擎DeepSpeech,它利用深度学习技术提供高精度的实时语音转文本服务,可以与Snowboy结合使用,为树莓派构建更全面的语音交互系统。
此外,针对物联网设备的嵌入式语音助手解决方案也在不断发展。Raspberry Pi Foundation联手Mozilla及多家合作伙伴共同推进Project Things,旨在通过开源平台打造智能家居控制中心,其中就包括了对语音控制的支持。将Snowboy与这类项目结合,可使树莓派成为家庭自动化的核心枢纽。
深入技术层面,Google发布了适用于边缘计算场景的TensorFlow Lite,使得在资源有限的设备如树莓派上运行复杂的机器学习模型成为可能。开发者可以尝试将Snowboy与TensorFlow Lite相结合,实现低功耗、高效的本地语音唤醒及命令识别功能,进一步丰富树莓派在语音交互领域的应用场景。
同时,在隐私保护方面,随着GDPR等法规的实施,越来越多用户关注数据安全问题。自建基于树莓派的语音助手能够有效减少云端数据传输,确保敏感信息不被第三方获取。在此背景下,研究如何优化本地语音识别系统的性能并降低误报率,对于推广和普及此类技术具有重要意义。
综上所述,随着人工智能和物联网技术的不断进步,以及用户对隐私保护意识的增强,树莓派与Snowboy等工具相结合构建的本地化语音交互方案将拥有广阔的应用前景和发展潜力。读者可以通过持续关注相关领域的最新研究成果和技术动态,推动这一技术在实践中的不断创新和突破。
知识学习
实践的时候请根据实际情况谨慎操作。
随机学习一条linux命令:
last - 显示系统最近登录过的用户信息。
随便看看
拉到页底了吧,随便看看还有哪些文章你可能感兴趣。
纯js实用T恤衫花纹图案预览特效 01-26 基于Bootstrap仿Github样式下拉列表框插件 08-08 jQuery电子邮件地址填写自动完成插件 04-30 Superset 数据源连接配置:精细化自定义SQLAlchemy URI实现数据分析与可视化,含SSL加密连接实例 03-19 jquery可任意拖动排序的导航图片效果 02-23 侧边栏个人图文简历HTML模板 12-09 Beego框架升级中的Bee工具版本兼容性问题与迁移策略:结构变更、功能接口变动及社区解决方案 12-07 Kibana无法启动:针对服务器内部错误的Elasticsearch连接、配置文件、端口冲突与资源排查解决(注:由于字数限制,未能完全包含所有关键词,但包含了核心问题描述及几个关键排查点) 11-01 ClickHouse外部表使用中文件权限与不存在问题的解决方案:错误提示、查询操作与文件路径管理实务 09-29 本次刷新还10个文章未展示,点击 更多查看。
Apache Atlas UI无法正常加载与样式丢失问题排查及解决方案:关注网络连接、浏览器缓存与开发者工具应用 09-25 Greenplum数据库中数据插入操作详解:单行多行插入与gpfdist实现大批量导入 08-02 [转载]html5 footer header,html-5 --html5教程article、footer、header、nav、section使用 07-16 [转载][GCC for C]编译选项---IDE掩盖下的天空 06-29 简洁大方珠宝钻石收藏网站模板下载 06-20 黑色高端精致汽车4s店美容html5模板下载 06-01 蓝色互联网项目融资管理平台网站模板 05-16 响应式游戏开发类企业前端cms模板下载 05-02 Beego框架动态路由实现:重定向与命令行参数驱动的路由设计实践 04-05 .NET 中字典操作避免 KeyNotFoundException:TryGetValue、ContainsKey 与 GetOrAdd 实践详解 04-04 [转载]2021/4/23爬虫第五次课(爬虫网络请求模块下下) 03-01
时光飞逝
"流光容易把人抛,红了樱桃,绿了芭蕉。"