Commit Graph

23 Commits

Author SHA1 Message Date
朱潮
939a1721d6 添加预录音功能:解决录音开头丢失问题
- 实现2秒预录音环形缓冲区
- 检测到声音时自动包含前2秒音频
- 实时显示缓冲区使用状态
- 完美解决录音开头丢失问题
- 显示预录音时长信息
2025-09-20 11:44:34 +08:00
朱潮
12c79a5a53 升级声音检测算法:动态阈值+零交叉率
- 实现动态阈值调整(背景噪音+25%)
- 添加零交叉率检测区分语音和噪音
- 优化灵敏度,适应50-70的能量范围
- 实时显示ZCR和背景能量值
- 大幅提高语音检测准确性
2025-09-20 11:39:56 +08:00
朱潮
b526328fe6 降低能量阈值到200以提高灵敏度 2025-09-20 11:38:19 +08:00
朱潮
2612ef5b46 修复Python缩进错误 2025-09-20 11:25:32 +08:00
朱潮
b87be1494d 基于能量检测的极简录音系统:彻底解决树莓派3B延迟问题
- 完全移除Vosk识别依赖,改用能量检测
- 基于RMS能量值判断声音开始/结束
- 自动调整能量阈值适应环境噪音
- 实时性能监控,极低CPU占用
- 预期延迟:<0.1秒(原10秒)
- 支持自动播放录制的音频

优化特点:
- 8kHz采样率,1024块大小
- 自动阈值调整算法
- 静音检测1.5秒结束录音
- 最小录音2秒,最大30秒

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-09-20 11:19:08 +08:00
朱潮
70c42eca15 激进性能优化:大幅降低树莓派3B延迟
- 音频参数:8kHz采样率,4096块大小(4倍)
- 激进模式:直接处理,跳过部分识别结果
- 缓冲优化:5个块缓冲区,0.2秒处理间隔
- 禁用词级识别:提升Vosk处理速度
- 实时延迟监控:显示音频处理延迟
- 预期效果:从10秒延迟降低到<1秒

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-09-20 11:07:54 +08:00
朱潮
eb099d827d config 2025-09-20 10:53:56 +08:00
朱潮
ef39e31a4b config 2025-09-20 01:06:14 +08:00
朱潮
fe102e924c config 2025-09-20 00:39:42 +08:00
朱潮
e432417299 doubao 2025-09-19 19:44:17 +08:00
朱潮
53d53e4555 doubao 2025-09-18 23:34:55 +08:00
朱潮
e6aa7f7be8 config 2025-09-18 21:34:36 +08:00
朱潮
d4ff3fd774 config 2025-09-18 21:21:34 +08:00
朱潮
711df77d38 config 2025-09-18 20:20:36 +08:00
朱潮
313e555589 fix 2025-09-18 20:13:08 +08:00
朱潮
20fbd07675 fix 2025-09-18 20:08:55 +08:00
朱潮
52ad9f559b bigmodel 2025-09-18 19:10:26 +08:00
m15-ai
e70dbf5f86
Add files via upload 2025-05-13 18:52:35 -05:00
m15-ai
ac7cdb6410
Create requirements.txt 2025-05-13 18:22:47 -05:00
m15-ai
136d0ee82a
Add files via upload 2025-05-13 18:17:47 -05:00
m15-ai
ec7f2786ba
Add files via upload 2025-05-13 18:15:47 -05:00
m15-ai
adef09c069
Add files via upload 2025-05-13 18:14:00 -05:00
m15-ai
b8ce4dac61
Initial commit 2025-05-13 18:09:46 -05:00