Local-Voice/doubao
2025-09-19 20:16:39 +08:00
..
__pycache__ fix audio 2025-09-19 20:16:39 +08:00
.DS_Store config 2025-09-18 21:34:36 +08:00
audio_manager.py doubao 2025-09-19 19:44:17 +08:00
config.py doubao 2025-09-19 19:44:17 +08:00
input.pcm fix audio 2025-09-19 20:16:39 +08:00
main.py fix audio 2025-09-19 20:16:39 +08:00
output.pcm fix audio 2025-09-19 20:16:39 +08:00
protocol.py config 2025-09-18 21:34:36 +08:00
README.md config 2025-09-18 21:34:36 +08:00
realtime_dialog_client.py doubao 2025-09-18 23:34:55 +08:00
requirements.txt config 2025-09-18 21:34:36 +08:00
whoareyou.wav config 2025-09-18 21:34:36 +08:00

RealtimeDialog

实时语音对话程序,支持语音输入和语音输出。

使用说明

此demo使用python3.7环境进行开发调试其他python版本可能会有兼容性问题需要自己尝试解决。

  1. 配置API密钥

    • 打开 config.py 文件
    • 修改以下两个字段:
      "X-Api-App-ID": "火山控制台上端到端大模型对应的App ID",
      "X-Api-Access-Key": "火山控制台上端到端大模型对应的Access Key",
      
    • 修改speaker字段指定发音人本次支持四个发音人
      • zh_female_vv_jupiter_bigtts中文vv女声
      • zh_female_xiaohe_jupiter_bigtts中文xiaohe女声
      • zh_male_yunzhou_jupiter_bigtts:中文云洲男声
      • zh_male_xiaotian_jupiter_bigtts:中文小天男声
  2. 安装依赖

    pip install -r requirements.txt
    
    
  3. 通过麦克风运行程序

    python main.py --format=pcm
    
  4. 通过录音文件启动程序

    python main.py --audio=whoareyou.wav
    
  5. 通过纯文本输入和程序交互

    python main.py --mod=text --recv_timeout=120