config

2025-09-20 17:29:51 +08:00 · 2025-09-20 17:29:51 +08:00 · ebeb4e34df
commit ebeb4e34df
parent 97aecf0c30
3 changed files with 135 additions and 4 deletions
--- a/characters/libai.json
+++ b/characters/libai.json
@ -0,0 +1,8 @@
 {
  "name": "李白",
  "description": "唐朝著名诗人，浪漫主义风格",
  "system_prompt": "你是唐朝大诗人李白，字太白，号青莲居士。用简短诗词和小朋友对话，每次回答不超过50字。",
  "voice": "zh_female_wanqudashu_moon_bigtts",
  "max_tokens": 50,
  "author": "Claude"
 }
--- a/characters/zhubajie.json
+++ b/characters/zhubajie.json
@ -0,0 +1,8 @@
 {
  "name": "猪八戒",
  "description": "西游记中的经典角色，憨厚可爱",
  "system_prompt": "你是西游记中的猪八戒，性格贪吃懒惰但心地善良。用幽默风趣的口吻和小朋友对话，每次回答不超过50字。",
  "voice": "zh_male_zhubajie_mars_bigtts",
  "max_tokens": 50,
  "author": "Claude"
 }
--- a/recorder.py
+++ b/recorder.py
@ -17,6 +17,7 @@ import threading
 import time
 import uuid
 import wave
 import argparse
 from io import BytesIO
 from urllib.parse import urlparse
@ -33,7 +34,7 @@ except ImportError:
 class EnergyBasedRecorder:
    """基于能量检测的录音系统"""
-    def __init__(self, energy_threshold=500, silence_threshold=1.5, min_recording_time=2.0, max_recording_time=30.0, enable_asr=True, enable_llm=True, enable_tts=True):
+    def __init__(self, energy_threshold=500, silence_threshold=1.5, min_recording_time=2.0, max_recording_time=30.0, enable_asr=True, enable_llm=True, enable_tts=True, character="libai"):
        # 音频参数 - 极简优化
        self.FORMAT = pyaudio.paInt16
        self.CHANNELS = 1
@ -67,6 +68,16 @@ class EnergyBasedRecorder:
        self.tts_app_key = "aGjiRDfUWi"
        self.tts_speaker = "zh_female_wanqudashu_moon_bigtts"
        # 角色配置
        self.current_character = character
        self.characters_dir = os.path.join(os.path.dirname(__file__), "characters")
        self.available_characters = self._load_available_characters()
        self.character_config = self._load_character_config(character)
        # 如果加载了角色配置，更新TTS音色
        if self.character_config and "voice" in self.character_config:
            self.tts_speaker = self.character_config["voice"]
        # 检查音频播放能力
        if self.enable_tts:
            self.audio_player_available = self._check_audio_player()
@ -118,6 +129,33 @@ class EnergyBasedRecorder:
        self._setup_audio()
    def _load_available_characters(self):
        """加载可用角色列表"""
        characters = []
        if os.path.exists(self.characters_dir):
            for file in os.listdir(self.characters_dir):
                if file.endswith('.json'):
                    characters.append(file[:-5])  # 去掉.json后缀
        return characters
    def _load_character_config(self, character_name):
        """加载角色配置"""
        config_file = os.path.join(self.characters_dir, f"{character_name}.json")
        if not os.path.exists(config_file):
            print(f"⚠️  角色配置文件不存在: {config_file}")
            return None
        try:
            with open(config_file, 'r', encoding='utf-8') as f:
                config = json.load(f)
            print(f"✅ 加载角色: {config.get('name', character_name)}")
            print(f"📝 描述: {config.get('description', '无描述')}")
            return config
        except Exception as e:
            print(f"❌ 加载角色配置失败: {e}")
            return None
    def _setup_audio(self):
        """设置音频设备"""
        try:
@ -972,6 +1010,17 @@ class EnergyBasedRecorder:
        try:
            print("🤖 调用大语言模型...")
            # 获取角色配置中的系统提示词
            if self.character_config and "system_prompt" in self.character_config:
                system_prompt = self.character_config["system_prompt"]
            else:
                system_prompt = "你是一个智能助手，请根据用户的语音输入提供有帮助的回答。保持回答简洁明了。"
            # 获取角色配置中的最大token数
            max_tokens = 50
            if self.character_config and "max_tokens" in self.character_config:
                max_tokens = self.character_config["max_tokens"]
            headers = {
                "Content-Type": "application/json",
                "Authorization": f"Bearer {self.llm_api_key}"
@ -982,14 +1031,14 @@ class EnergyBasedRecorder:
                "messages": [
                    {
                        "role": "system",
-                        "content": "你是唐朝大诗人李白，用简短诗词和小朋友对话，每次回答不超过50字。"
+                        "content": system_prompt
                    },
                    {
                        "role": "user",
                        "content": user_message
                    }
                ],
-                "max_tokens": 50
+                "max_tokens": max_tokens
            }
            response = requests.post(self.llm_api_url, headers=headers, json=data, timeout=30)
@ -1131,10 +1180,53 @@ class EnergyBasedRecorder:
            print(f"❌ TTS转换失败: {e}")
            return None
 def parse_arguments():
    """解析命令行参数"""
    parser = argparse.ArgumentParser(description='基于能量检测的极简录音系统')
    parser.add_argument('--character', '-c', type=str, default='libai',
                       help='选择角色 (默认: libai)')
    parser.add_argument('--list-characters', '-l', action='store_true',
                       help='列出所有可用角色')
    return parser.parse_args()
 def list_characters(characters_dir):
    """列出所有可用角色"""
    characters = []
    if os.path.exists(characters_dir):
        for file in os.listdir(characters_dir):
            if file.endswith('.json'):
                character_name = file[:-5]
                config_file = os.path.join(characters_dir, file)
                try:
                    with open(config_file, 'r', encoding='utf-8') as f:
                        config = json.load(f)
                        name = config.get('name', character_name)
                        desc = config.get('description', '无描述')
                        characters.append(f"{character_name}: {name} - {desc}")
                except:
                    characters.append(f"{character_name}: 配置文件读取失败")
    if characters:
        print("🎭 可用角色列表:")
        for char in characters:
            print(f"   - {char}")
    else:
        print("❌ 未找到任何角色配置文件")
 def main():
    """主函数"""
    args = parse_arguments()
    characters_dir = os.path.join(os.path.dirname(__file__), "characters")
    # 如果要求列出角色，显示后退出
    if args.list_characters:
        list_characters(characters_dir)
        return
    print("🚀 基于能量检测的极简录音系统")
    print("🤖 集成语音识别功能")
    print(f"🎭 当前角色: {args.character}")
    print("=" * 50)
    # 创建录音系统
@ -1145,7 +1237,8 @@ def main():
        max_recording_time=30.0,   # 最大录音时间
        enable_asr=True,          # 启用语音识别功能
        enable_llm=True,          # 启用大语言模型功能
-        enable_tts=True           # 启用文本转语音功能
+        enable_tts=True,          # 启用文本转语音功能
        character=args.character   # 指定角色
    )
    print("✅ 系统初始化成功")
@ -1158,6 +1251,8 @@ def main():
    print("   - 录音完成后自动语音识别")
    print("   - 语音识别后自动调用AI助手")
    print("   - AI回复后自动转换为语音")
    print("   - 多角色支持 (李白、猪八戒等)")
    print("   - 每个角色独特音色和性格")
    print("   - 预录音功能（包含声音开始前2秒）")
    print("   - 环形缓冲区防止丢失开头音频")
    print("   - 自动调整能量阈值")
@ -1171,6 +1266,26 @@ def main():
        print("   export ARK_API_KEY='your_api_key_here'")
        print("=" * 50)
    # 显示角色信息
    if recorder.character_config:
        print(f"🎭 当前角色: {recorder.character_config.get('name', '未知')}")
        print(f"📝 描述: {recorder.character_config.get('description', '无描述')}")
        print(f"🎤 音色: {recorder.tts_speaker}")
        print("=" * 50)
    # 显示使用说明
    print("📖 使用说明:")
    print("- 检测到声音自动开始录音")
    print("- 持续静音3秒自动结束录音")
    print("- 最少录音2秒，最多30秒")
    print("- 录音完成后自动播放")
    print("- 按 Ctrl+C 退出")
    print("🎭 角色切换:")
    print("- 使用 --character 或 -c 参数选择角色")
    print("- 使用 --list-characters 或 -l 查看所有角色")
    print("- 示例: python recorder.py --character zhubajie")
    print("=" * 50)
    # 开始运行
    recorder.run()