add config

2025-09-26 11:47:28 +08:00 · 2025-09-26 11:47:28 +08:00 · 0f15b5060b
commit 0f15b5060b
parent 91a9043c4a
22 changed files with 47 additions and 2327 deletions
--- a/AUDIO_PROCESSES_IMPROVEMENTS.md
+++ b/AUDIO_PROCESSES_IMPROVEMENTS.md
@ -1,127 +0,0 @@
-# Audio Processes 改进总结
-
-## 问题背景
- 原始问题：TTS音频只播放3个字符就停止，出现ALSA underrun错误
- 根本原因：音频缓冲区管理不当，播放策略过于保守
-
-## 改进内容
-
-### 1. 音频播放优化 (_play_audio 方法)
- **改进前**：保守的播放策略，需要缓冲区有足够数据才开始播放
- **改进后**：
-  - 借鉴 recorder.py 的播放策略：只要有数据就播放
-  - 添加错误恢复机制，自动检测和恢复 ALSA underrun
-  - 优化缓冲区管理，减少延迟
-
-### 2. TTS 工作线程模式
- **参考**: recorder.py 的 TTS 工作线程实现
- **实现功能**：
-  - 独立的 TTS 工作线程处理音频生成
-  - 任务队列管理，避免阻塞主线程
-  - 统一的 TTS 请求接口 `process_tts_request()`
-  - 支持流式音频处理
-
-### 3. 统一的音频播放队列
- **InputProcess 和 OutputProcess 都支持**：
-  - TTS 工作线程
-  - 音频生成和播放队列
-  - 统一的错误处理和日志记录
-
-### 4. 关键改进点
-
-#### 音频播放策略
-```python
-# 改进前：保守策略
-if len(self.playback_buffer) > 2:  # 需要缓冲区有足够数据
-    # 开始播放
-
-# 改进后：积极策略 + 错误恢复
-audio_chunk = self.playback_buffer.pop(0)
-if audio_chunk and len(audio_chunk) > 0:
-    try:
-        self.output_stream.write(audio_chunk)
-        # 统计信息
-    except Exception as e:
-        # ALSA underrun 错误恢复
-        if "underrun" in str(e).lower():
-            # 自动恢复音频流
-```
-
-#### TTS 工作线程
-```python
-def _tts_worker(self):
-    """TTS工作线程 - 处理TTS任务队列"""
-    while self.tts_worker_running:
-        try:
-            task = self.tts_task_queue.get(timeout=1.0)
-            if task is None:
-                break
-            
-            task_type, content = task
-            if task_type == "tts_sentence":
-                self._generate_tts_audio(content)
-            
-            self.tts_task_queue.task_done()
-            
-        except queue.Empty:
-            continue
-        except Exception as e:
-            self.logger.error(f"TTS工作线程错误: {e}")
-```
-
-#### 错误恢复机制
-```python
-# ALSA underrun 检测和恢复
-if "underrun" in str(e).lower() or "alsa" in str(e).lower():
-    self.logger.info("检测到ALSA underrun，尝试恢复音频流")
-    try:
-        if self.output_stream:
-            self.output_stream.stop_stream()
-            time.sleep(0.1)
-            self.output_stream.start_stream()
-            self.logger.info("音频流已恢复")
-    except Exception as recovery_e:
-        self.logger.error(f"恢复音频流失败: {recovery_e}")
-        self.playback_buffer.clear()
-```
-
-### 5. 性能优化
- 减少日志输出频率，提高性能
- 优化队列处理策略，使用适当的超时设置
- 动态调整休眠时间，根据播放状态优化CPU使用
-
-### 6. 测试和验证
- 创建了测试脚本 `test_audio_processes.py`
- 验证了语法正确性
- 可以测试 TTS 功能的完整性
-
-## 使用方法
-
-### 在控制系统中使用
-```python
-from audio_processes import InputProcess, OutputProcess
-
-# 创建输入和输出进程
-input_process = InputProcess(command_queue, event_queue)
-output_process = OutputProcess(audio_queue)
-
-# 处理TTS请求
-output_process.process_tts_request("你好，这是测试语音")
-```
-
-### 独立测试
-```bash
-python test_audio_processes.py
-```
-
-## 预期效果
- 解决 ALSA underrun 错误
- 提高音频播放的流畅性
- 减少 TTS 处理的延迟
- 提供更稳定的音频处理能力
-
-## 注意事项
-1. 确保系统安装了必要的依赖：`requests`, `pyaudio`
-2. 检查音频设备是否正常工作
-3. 网络连接正常（用于TTS服务）
-4. 适当调整音频参数以适应不同环境
--- a/CACHED_AUDIO_TIMING_FIX.md
+++ b/CACHED_AUDIO_TIMING_FIX.md
@ -1,66 +0,0 @@
-# 缓存音频播放时序修复总结
-
-## 问题描述
-在打招呼读取缓存播放时，发现有时会立即触发播放完成，显示异常的时间差（49.292秒），导致缓存音频无法正常播放完整。
-
-## 根本原因
-在 `_process_cached_audio` 方法中，缓存音频的处理存在时序问题：
-
-1. **立即设置完成状态**：缓存音频被添加到预加载缓冲区后，立即设置 `all_audio_received = True`
-2. **时序变量未初始化**：`last_audio_chunk_time` 没有在缓存音频开始播放时正确设置
-3. **完成检测误判**：播放完成检测逻辑使用旧的或零值的 `last_audio_chunk_time`，计算出异常的时间差，误判播放已完成
-
-## 修复方案
-
-### 1. 修改 `_process_cached_audio` 方法
- **延迟设置 `all_audio_received`**：不在音频添加到缓冲区时立即设置，而是等待实际开始播放时设置
- **正确初始化时序变量**：在缓存音频开始播放时设置 `last_audio_chunk_time = time.time()`
- **确保时序同步**：保证 `all_audio_received` 和 `last_audio_chunk_time` 在正确的时间点设置
-
-### 2. 修改音频缓冲区转移逻辑
-在以下缓冲区转移场景中也添加了时序变量初始化：
- 预加载缓冲区达到阈值时
- 最小缓冲区模式启动时
- 强制转移预加载缓冲区时
-
-### 3. 关键修改点
-
-#### 在 `_process_cached_audio` 中：
-```python
-# 修复前：立即设置all_audio_received
-self.all_audio_received = True
-
-# 修复后：等待播放开始时设置
-self.last_audio_chunk_time = time.time()  # 关键修复
-self.all_audio_received = True
-```
-
-#### 在缓冲区转移逻辑中：
-```python
-# 在各种缓冲区转移场景中添加
-self.last_audio_chunk_time = time.time()
-print(f"🎵 设置last_audio_chunk_time = {self.last_audio_chunk_time}")
-```
-
-## 修复效果
-
-1. **解决立即完成问题**：缓存音频不再出现49.292秒的异常时间差
-2. **确保完整播放**：缓存音频能够正常播放完整时长
-3. **时序同步**：播放完成检测逻辑现在使用正确的时间戳
-4. **避免死锁**：即使在异常情况下，也能正确设置完成状态避免系统卡死
-
-## 测试验证
-
-创建了专门的测试脚本 `test_cached_timing_fix.py` 验证修复效果：
- ✅ 关键时序变量存在且可访问
- ✅ 时序变量可以正确设置和读取
- ✅ 时间差计算正常（接近0秒而非49.292秒）
- ✅ 异常时间差问题得到解决
-
-## 影响范围
-
- **缓存音频播放**：修复了所有缓存音频的播放时序问题
- **播放完成检测**：改进了播放完成检测的准确性
- **系统稳定性**：提高了整个音频播放系统的稳定性
-
-这个修复确保了缓存音频（如角色打招呼）能够正常播放完整，不会立即触发播放完成。
--- a/CACHE_AUDIO_FIX_SUMMARY.md
+++ b/CACHE_AUDIO_FIX_SUMMARY.md
@ -1,101 +0,0 @@
-# 缓存音频播放完成检测修复总结
-
-## 问题描述
-缓存音频播放时，系统在音频还未播放完成时就错误地发送了完成信号。具体表现为：
- 缓存音频播放到6-7秒时，系统错误地检测到播放完成
- 发送完成事件并重置播放状态，导致音频被中断
- 用户听到的是不完整的音频播放
-
-## 根本原因分析
-1. 在 `_play_cached_audio()` 方法中，当播放开始时就立即设置了 `tts_generation_complete = True` 和 `llm_generation_complete = True`
-2. `_check_enhanced_playback_completion()` 方法没有区分缓存音频和普通TTS音频
-3. 当主控制系统发送结束信号时，播放完成检测机制错误地认为所有条件都已满足
-
-## 修复方案
-
-### 1. 添加缓存音频状态标识
-在 `OutputProcess` 类的 `__init__` 方法中添加：
-```python
-self.is_playing_cached_audio = False  # 是否正在播放缓存音频
-```
-
-### 2. 修改 `_play_cached_audio()` 方法
- 移除立即设置 `tts_generation_complete` 和 `llm_generation_complete` 的代码
- 添加缓存音频状态设置：
-  ```python
-  # 设置缓存音频播放状态
-  self.is_playing_cached_audio = True
-  ```
- 在发送TTS完成信号后，只设置TTS完成状态：
-  ```python
-  # 缓存音频没有真正的TTS过程，所以立即设置TTS完成状态
-  # 但不设置LLM完成状态，让缓存音频完成检测逻辑处理
-  self.tts_generation_complete = True
-  ```
-
-### 3. 添加专门的缓存音频完成检测方法
-新增 `_check_cached_audio_completion()` 方法：
-```python
-def _check_cached_audio_completion(self):
-    """缓存音频播放完成检测 - 简化逻辑，不依赖LLM和TTS完成状态"""
-    # 更新状态变量
-    self.pre_buffer_empty = (len(self.preload_buffer) == 0)
-    self.playback_buffer_empty = (len(self.playback_buffer) == 0)
-    self.no_active_playback = (not self.currently_playing)
-    
-    # 计算时间差
-    current_time = time.time()
-    time_since_last_chunk = current_time - self.last_audio_chunk_time
-    
-    # 缓存音频完成条件：
-    # 1. 缓冲区都为空
-    # 2. 没有活跃播放
-    # 3. 至少1秒没有新音频播放（确保音频完全播放完成）
-    if (self.pre_buffer_empty and 
-        self.playback_buffer_empty and 
-        self.no_active_playback):
-        
-        if self.last_audio_chunk_time > 0 and time_since_last_chunk > 1.0:
-            print(f"✅ 缓存音频播放完成：缓冲区已清空，播放器空闲，{time_since_last_chunk:.2f}秒无新音频")
-            return True
-        else:
-            return False
-    else:
-        return False
-```
-
-### 4. 修改 `_check_enhanced_playback_completion()` 方法
-在方法开头添加缓存音频检测逻辑：
-```python
-# 如果正在播放缓存音频，使用简化的完成检测逻辑
-if self.is_playing_cached_audio:
-    return self._check_cached_audio_completion()
-```
-
-### 5. 确保状态正确重置
-在 `_finish_playback()` 方法中添加：
-```python
-self.is_playing_cached_audio = False  # 重置缓存音频播放状态
-```
-
-## 修复效果
-修复后的系统具有以下特性：
-1. **区分音频类型**：能够区分缓存音频和普通TTS音频
-2. **简化检测逻辑**：缓存音频使用简化的完成检测逻辑，不依赖LLM和TTS完成状态
-3. **确保完整播放**：只有当缓冲区为空、播放器空闲且至少1秒无新音频时才认为播放完成
-4. **状态管理**：正确管理所有相关状态，确保状态一致性
-
-## 测试验证
-创建了专门的测试脚本验证修复效果：
- ✅ 新增状态变量和方法正确
- ✅ 缓存音频完成检测逻辑正确
- ✅ 缓存音频播放中检测逻辑正确
-
-## 注意事项
-1. 该修复不影响普通TTS音频的播放完成检测
-2. 主控制系统的逻辑保持不变
-3. 缓存音频播放仍然遵循原有的音频播放流程
-4. 修复向后兼容，不会破坏现有功能
-
-## 结论
-通过区分缓存音频和TTS音频的播放完成检测逻辑，成功解决了缓存音频提前结束的问题。现在缓存音频能够完整播放，只有在真正播放完成后才会发送完成事件。
--- a/GREETING_CACHE_IMPLEMENTATION.md
+++ b/GREETING_CACHE_IMPLEMENTATION.md
@ -1,165 +0,0 @@
-# 角色TTS话术音频缓存功能实现总结
-
-## 功能概述
-
-为角色打招呼（greeting）文本添加了音频缓存功能，避免每次角色切换时都重新生成TTS音频，提升用户体验和系统性能。
-
-## 实现内容
-
-### 1. 缓存管理工具函数
-
-在 `audio_processes.py` 中添加了以下工具函数：
-
- `get_greeting_cache_path(character_name)` - 获取缓存文件路径
- `greeting_cache_exists(character_name)` - 检查缓存是否存在  
- `load_cached_audio(character_name)` - 加载缓存音频数据
- `save_greeting_cache(character_name, audio_data)` - 保存音频到缓存
-
-### 2. OutputProcess增强
-
-#### 2.1 修改 `_add_tts_task` 方法
- 添加 `character_name` 参数支持
- 实现缓存检查逻辑
- 支持缓存音频和普通TTS音频的统一处理
-
-#### 2.2 新增 `_process_cached_audio` 方法
- 专门处理缓存音频数据
- 复用现有的播放完成检测机制
- 确保状态管理一致性
-
-#### 2.3 新增 `process_greeting_text` 方法
- 专门处理打招呼文本
- 集成缓存检查和TTS生成
- 正确管理播放状态
-
-#### 2.4 新增 `_process_tts_buffer_with_cache` 方法
- 带缓存支持的TTS缓冲区处理
- 传递角色名称到TTS任务队列
-
-#### 2.5 修改 `_generate_tts_audio` 方法
- 添加 `character_name` 参数
- 支持生成音频后自动保存到缓存
- 收集音频数据用于缓存保存
-
-#### 2.6 修改 `_tts_worker` 方法
- 支持处理不同类型的TTS任务
- 修复任务解包逻辑，支持变长任务元组
-
-### 3. ControlSystem增强
-
-#### 3.1 新增 `_send_greeting_to_output_process` 方法
- 发送带角色信息的打招呼文本
- 支持缓存处理的命令格式
-
-#### 3.2 修改 `play_greeting` 方法
- 集成缓存功能
- 传递角色名称到输出进程
-
-### 4. 命令协议扩展
-
-新增命令类型：
- `GREETING_TEXT:{text}:{character_name}` - 打招呼文本处理命令
-
-任务类型扩展：
- `("tts_sentence", text, character_name)` - 带角色名的TTS任务
- `("cached_audio", text, audio_data, character_name)` - 缓存音频任务
-
-## 工作流程
-
-### 1. 首次播放（无缓存）
-1. ControlSystem调用 `play_greeting()`
-2. 发送 `GREETING_TEXT` 命令到OutputProcess
-3. OutputProcess检查缓存不存在
-4. 调用TTS生成音频
-5. 播放音频的同时保存到缓存
-6. 正常发送播放完成状态
-
-### 2. 后续播放（有缓存）
-1. ControlSystem调用 `play_greeting()`
-2. 发送 `GREETING_TEXT` 命令到OutputProcess
-3. OutputProcess检查缓存存在
-4. 直接加载缓存音频到播放缓冲区
-5. 发送TTS完成状态
-6. 正常播放完成
-
-## 状态管理
-
-缓存音频完全复用现有的状态管理机制：
- `tts_generation_complete` - TTS生成完成状态
- `llm_generation_complete` - LLM生成完成状态
- `all_audio_received` - 音频接收完成状态
- 播放完成检测机制 - 确保音频完整播放
-
-## 缓存存储
-
-### 文件结构
-```
-greeting_cache/
-├── {character_name}.wav  # 角色打招呼音频文件
-```
-
-### 命名规则
- 文件名：`{character_name}.wav`
- 路径：`greeting_cache/{character_name}.wav`
-
-### 自动管理
- 缓存目录自动创建
- 简单的文件覆盖策略（无LRU等复杂策略）
-
-## 性能提升
-
-### 测试结果
- **首次播放**：需要TTS生成（2-3秒）
- **缓存播放**：即时播放（<0.5秒）
- **缓存命中率**：100%（第二次及以后播放）
- **存储开销**：约2KB per角色
-
-### 资源节约
- 减少重复TTS API调用
- 降低网络带宽使用
- 提升系统响应速度
-
-## 兼容性
-
- 完全向后兼容，不影响现有功能
- 普通TTS对话不受影响
- 仅对角色打招呼启用缓存
- 状态管理机制保持不变
-
-## 测试验证
-
-创建了多个测试脚本：
- `test_greeting_cache.py` - 基础缓存功能测试
- `test_full_cache_flow.py` - 完整缓存流程测试
- `test_role_switching.py` - 角色切换场景测试
-
-所有测试均通过，功能正常工作。
-
-## 使用说明
-
-### 自动使用
-缓存功能完全自动化，无需手动干预：
-1. 角色切换时自动检查缓存
-2. 无缓存时自动生成并保存
-3. 有缓存时自动使用
-
-### 手动清理
-如需清理缓存，删除 `greeting_cache/` 目录即可：
-```bash
-rm -rf greeting_cache/
-```
-
-## 注意事项
-
-1. **缓存有效性**：不验证缓存文件是否过期
-2. **存储空间**：无自动清理机制，需要手动管理
-3. **角色名称**：基于角色名称作为缓存键，确保名称唯一性
-4. **音频格式**：保存原始PCM音频数据，无格式转换
-
-## 扩展性
-
-该实现为未来扩展提供了良好基础：
- 可添加缓存过期策略
- 可添加缓存大小限制
- 可支持更多类型的文本缓存
- 可添加缓存统计和监控
--- a/QUICKSTART.md
+++ b/QUICKSTART.md
@ -1,101 +0,0 @@
-# 快速启动指南
-
-## 一键启动（推荐）
-
-```bash
-# 直接运行，系统会自动校准和启动监听
-python multiprocess_recorder.py
-
-# 指定角色
-python multiprocess_recorder.py -c libai
-
-# 详细模式
-python multiprocess_recorder.py -v
-```
-
-## 编程方式启动
-
-### 最简单的方式
-```python
-from control_system import ControlSystem
-
-# 创建控制系统
-control_system = ControlSystem()
-
-# 一键启动（自动校准 + 自动监听）
-control_system.start()
-```
-
-### 自定义配置
-```python
-from control_system import ControlSystem
-
-config = {
-    'system': {'log_level': "INFO"},
-    'audio': {'sample_rate': 16000, 'channels': 1, 'chunk_size': 1024},
-    'recording': {'min_duration': 2.0, 'max_duration': 30.0, 'silence_threshold': 3.0},
-    'processing': {'enable_asr': True, 'enable_llm': True, 'enable_tts': True, 'character': 'libai'}
-}
-
-control_system = ControlSystem(config)
-
-# 启动选项：
-# auto_calibration=True  - 自动校准语音检测器
-# auto_monitoring=True    - 自动启动音频监听
-control_system.start(auto_calibration=True, auto_monitoring=True)
-```
-
-## 手动控制
-
-```python
-from control_system import ControlSystem
-
-control_system = ControlSystem()
-
-# 只启动进程，不自动校准和监听
-control_system._start_processes()
-
-# 手动步骤：
-control_system.start_calibration()                    # 1. 启动校准
-control_system.wait_for_calibration_complete()         # 2. 等待校准完成
-control_system.start_monitoring()                     # 3. 启动监听
-
-# 运行中可以随时控制：
-control_system.stop_monitoring()                      # 停止监听
-control_system.start_monitoring()                     # 重新启动监听
-
-# 查询状态：
-status = control_system.get_calibration_status()      # 获取校准状态
-status = control_system.get_monitoring_status()        # 获取监听状态
-
-# 关闭系统：
-control_system.shutdown()
-```
-
-## 启动流程
-
-系统启动时会按以下顺序执行：
-
-1. **启动进程** - 创建输入进程和输出进程
-2. **自动校准** - 校准语音检测器（约3-5秒）
-3. **启动监听** - 启用音频监听功能
-4. **开始运行** - 进入主控制循环，开始检测语音
-
-## 注意事项
-
- **校准时间**：首次启动需要3-5秒进行语音检测器校准
- **音频权限**：确保麦克风权限已授予
- **环境安静**：校准时请保持环境安静
- **API密钥**：如需LLM功能，请设置 `ARK_API_KEY` 环境变量
-
-## 故障排除
-
-如果校准失败：
- 检查麦克风是否正常工作
- 确保环境安静，无背景噪音
- 尝试重新启动系统
-
-如果监听失败：
- 检查音频设备是否被其他程序占用
- 尝试重启程序
- 查看日志文件排查问题
--- a/README.md
+++ b/README.md
@ -1,143 +0,0 @@
-# 智能语音助手系统使用说明
-
-## 功能概述
-这是一个完整的智能语音助手系统，集成了语音录制、语音识别、大语言模型和文本转语音功能，实现语音对话交互。
-
-## 完整工作流程
-1. 🎙️ **语音录制** - 基于ZCR的智能语音检测
-2. 📝 **保存录音** - 自动保存为WAV文件
-3. 🤖 **语音识别** - 使用字节跳动ASR将语音转为文字
-4. 💬 **AI回复** - 使用豆包大模型生成智能回复
-5. 🔊 **语音回复** - 使用字节跳动TTS将AI回复转为语音
-
-## 环境配置
-
-### 1. 安装依赖
-```bash
-pip install websockets requests pyaudio numpy
-```
-
-### 2. 安装音频播放器（树莓派/Linux系统）
-系统使用PCM格式音频，只需要安装基础的音频播放工具：
-
-```bash
-# 安装 alsa-utils（包含aplay播放器）
-sudo apt-get update
-sudo apt-get install alsa-utils
-```
-
-> **优势**: PCM格式无需额外解码器，兼容性更好，资源占用更少。
-> **注意**: macOS和Windows系统通常内置支持音频播放，无需额外安装。
-
-### 3. 设置API密钥
-为了启用大语言模型功能，需要设置环境变量：
-
-```bash
-# Linux/Mac
-export ARK_API_KEY='your_api_key_here'
-
-# Windows
-set ARK_API_KEY=your_api_key_here
-```
-
-> **注意**: 语音识别和文本转语音功能使用内置的API密钥，无需额外配置。
-
-## 使用方法
-
-### 基本使用
-```bash
-python recorder.py
-```
-
-### 功能说明
- 🎯 **自动检测语音**：系统会自动检测声音并开始录音
- ⏱️ **智能停止**：静音3秒后自动停止录音
- 🔊 **自动播放**：录音完成后自动播放音频
- 📝 **语音识别**：自动将语音转为文字
- 🤖 **AI助手**：自动调用大语言模型生成回复
-
-### 配置参数
- `energy_threshold=200` - 能量阈值（调整灵敏度）
- `silence_threshold=3.0` - 静音阈值（秒）
- `min_recording_time=2.0` - 最小录音时间（秒）
- `max_recording_time=30.0` - 最大录音时间（秒）
- `enable_asr=True` - 启用语音识别
- `enable_llm=True` - 启用大语言模型
- `enable_tts=True` - 启用文本转语音
-
-## 输出示例
-```
-🎤 开始监听...
-能量阈值: 200 (已弃用)
-静音阈值: 3.0秒
-📖 使用说明:
- 检测到声音自动开始录音
- 持续静音3秒自动结束录音
- 最少录音2秒，最多30秒
- 录音完成后自动进行语音识别和AI回复
- 按 Ctrl+C 退出
-==================================================
-🎙️ 检测到声音，开始录音...
-📝 录音完成，时长: 3.45秒 (包含预录音 2.0秒)
-✅ 录音已保存: recording_20250920_163022.wav
-==================================================
-📡 音频输入已保持关闭状态
-🔄 开始处理音频...
-🤖 开始语音识别...
-📝 识别结果: 你好，今天天气怎么样？
--------------------------------------------------
-🤖 调用大语言模型...
-💬 AI助手回复: 你好！我无法实时获取天气信息，建议你查看天气预报或打开天气应用来了解今天的天气情况。有什么其他我可以帮助你的吗？
--------------------------------------------------
-🔊 开始文本转语音...
-TTS句子信息: {'code': 0, 'message': '', 'data': None, 'sentence': {'phonemes': [], 'text': '你好！我无法实时获取天气信息，建议你查看天气预报或打开天气应用来了解今天的天气情况。有什么其他我可以帮助你的吗？', 'words': [...]}}
-✅ TTS音频已保存: tts_response_20250920_163022.pcm
-📁 文件大小: 128.75 KB
-🔊 播放AI语音回复...
-✅ AI语音回复完成
-🔄 准备重新开启音频输入
-✅ 音频设备初始化成功
-📡 音频输入已重新开启
-```
-
-## 注意事项
-1. **网络连接**：需要网络连接来使用语音识别、大语言模型和文本转语音服务
-2. **API密钥**：需要有效的ARK_API_KEY才能使用大语言模型功能
-3. **音频设备**：确保麦克风和扬声器工作正常
-4. **权限**：确保程序有访问麦克风、网络和存储的权限
-5. **文件存储**：系统会保存录音文件和TTS生成的音频文件
-
-## 故障排除
- 如果语音识别失败，检查网络连接和API密钥
- 如果大语言模型失败，检查ARK_API_KEY是否正确设置
- 如果文本转语音失败，检查TTS服务状态
- 如果录音失败，检查麦克风权限和设备
- 如果播放失败，检查音频设备权限
- 如果PCM文件无法播放，检查是否安装了alsa-utils：
-  ```bash
-  # 树莓派/Ubuntu/Debian系统
-  sudo apt-get install alsa-utils
-  
-  # 或检查aplay是否安装
-  which aplay
-  ```
-
-## 技术特点
- 🎯 基于ZCR的精确语音检测
- 🚀 低延迟实时处理
- 💾 环形缓冲区防止音频丢失
- 🔧 自动调整能量阈值
- 📊 实时性能监控
- 🌐 完整的语音对话链路
- 📁 自动文件管理和权限设置
- 🔊 PCM格式音频，无需额外解码器
-
-## 生成的文件
- `recording_*.wav` - 录制的音频文件
- `tts_response_*.pcm` - AI语音回复文件（PCM格式）
-
-## PCM格式优势
- **兼容性好**：aplay原生支持，树莓派开箱即用
- **资源占用少**：无需解码过程，CPU占用更低
- **延迟更低**：直接播放，无需格式转换
- **稳定性高**：减少依赖组件，提高系统稳定性
--- a/README_MANUAL_CONTROL.md
+++ b/README_MANUAL_CONTROL.md
@ -1,210 +0,0 @@
-# 多进程音频控制系统 - 主进程控制功能
-
-## 概述
-
-本系统已经重构，支持主进程对输入进程的校准和监听功能进行精确控制。通过这些新功能，你可以：
-
-1. **手动控制校准过程**：在适当的时间启动语音检测器校准
-2. **精确控制监听状态**：按需启用或禁用音频监听
-3. **获取实时状态**：查询校准进度和监听状态
-
-## 主要功能
-
-### 1. 校准功能
-
-#### 启动校准
-```python
-# 启动语音检测器校准
-success = control_system.start_calibration()
-if success:
-    print("校准已启动")
-```
-
-#### 获取校准状态
-```python
-# 获取当前校准状态
-status = control_system.get_calibration_status()
-if status:
-    print(f"校准进度: {status['progress']*100:.1f}%")
-    print(f"是否在校准中: {status['calibrating']}")
-```
-
-#### 等待校准完成
-```python
-# 等待校准完成（30秒超时）
-if control_system.wait_for_calibration_complete(timeout=30):
-    print("校准完成")
-else:
-    print("校准超时")
-```
-
-### 2. 监听功能
-
-#### 启动监听
-```python
-# 启动音频监听
-success = control_system.start_monitoring()
-if success:
-    print("监听已启动")
-```
-
-#### 停止监听
-```python
-# 停止音频监听
-success = control_system.stop_monitoring()
-if success:
-    print("监听已停止")
-```
-
-#### 获取监听状态
-```python
-# 获取当前监听状态
-status = control_system.get_monitoring_status()
-if status:
-    print(f"监听启用: {status['enabled']}")
-    print(f"正在录音: {status['recording']}")
-    print(f"音频流活跃: {status['audio_stream_active']}")
-```
-
-## 使用示例
-
-### 方法1：自动启动（推荐）
-
-```python
-from control_system import ControlSystem
-
-# 1. 创建控制系统
-config = {
-    'system': {'log_level': "INFO"},
-    'audio': {'sample_rate': 16000, 'channels': 1, 'chunk_size': 1024},
-    'recording': {'min_duration': 2.0, 'max_duration': 30.0, 'silence_threshold': 3.0},
-    'processing': {'enable_asr': True, 'enable_llm': True, 'enable_tts': True, 'character': 'libai'}
-}
-
-control_system = ControlSystem(config)
-
-# 2. 一键启动（自动校准和监听）
-control_system.start(auto_calibration=True, auto_monitoring=True)
-
-# 系统现在正在运行，会自动处理语音检测和录音
-```
-
-### 方法2：手动控制
-
-```python
-from control_system import ControlSystem
-import time
-
-# 1. 创建控制系统
-config = {
-    'system': {'log_level': "INFO"},
-    'audio': {'sample_rate': 16000, 'channels': 1, 'chunk_size': 1024},
-    'recording': {'min_duration': 2.0, 'max_duration': 30.0, 'silence_threshold': 3.0},
-    'processing': {'enable_asr': True, 'enable_llm': True, 'enable_tts': True, 'character': 'libai'}
-}
-
-control_system = ControlSystem(config)
-
-# 2. 启动进程（但不自动启用监听）
-control_system._start_processes()
-
-# 3. 步骤1：校准
-print("开始校准...")
-control_system.start_calibration()
-
-# 等待校准完成
-if control_system.wait_for_calibration_complete(timeout=30):
-    print("校准完成")
-else:
-    print("校准失败")
-    exit(1)
-
-# 4. 步骤2：启动监听
-print("开始监听...")
-control_system.start_monitoring()
-
-# 5. 运行一段时间
-print("系统运行中...")
-try:
-    while True:
-        # 检查事件和显示状态
-        control_system.check_events()
-        control_system.display_status()
-        time.sleep(0.1)
-except KeyboardInterrupt:
-    print("用户中断")
-
-# 6. 停止监听
-print("停止监听...")
-control_system.stop_monitoring()
-
-# 7. 关闭系统
-control_system.shutdown()
-```
-
-### 方法3：混合控制
-
-```python
-from control_system import ControlSystem
-
-# 1. 创建控制系统
-control_system = ControlSystem(config)
-
-# 2. 自动启动，但只校准，不自动监听
-control_system.start(auto_calibration=True, auto_monitoring=False)
-
-# 3. 手动控制监听
-control_system.start_monitoring()  # 启动监听
-# ... 运行一段时间 ...
-control_system.stop_monitoring()  # 停止监听
-control_system.start_monitoring()  # 重新启动监听
-
-# 4. 关闭系统
-control_system.shutdown()
-```
-
-### 自动化示例
-
-查看 `example_manual_control.py` 文件获取完整的自动化控制示例。
-
-## 关键变化
-
-### 1. 默认行为变化
-
- **之前**：输入进程启动后自动开始校准和监听
- **现在**：输入进程启动后处于静默状态，等待主进程命令
-
-### 2. 新增控制接口
-
-在 `ControlSystem` 类中新增了以下方法：
-
- `start_calibration()` - 启动校准
- `start_monitoring()` - 启动监听
- `stop_monitoring()` - 停止监听
- `get_calibration_status()` - 获取校准状态
- `get_monitoring_status()` - 获取监听状态
- `wait_for_calibration_complete(timeout)` - 等待校准完成
-
-### 3. 新增命令支持
-
-在 `InputProcess` 中支持以下新命令：
-
- `start_calibration` - 开始校准
- `start_monitoring` - 开始监听
- `stop_monitoring` - 停止监听
- `get_calibration_status` - 获取校准状态
- `get_monitoring_status` - 获取监听状态
-
-## 使用建议
-
-1. **初始化顺序**：建议按照"启动进程 → 校准 → 启动监听"的顺序进行
-2. **错误处理**：建议对每个操作进行错误检查和重试
-3. **状态监控**：定期检查状态以确保系统正常运行
-4. **资源清理**：使用完毕后正确关闭系统
-
-## 注意事项
-
-1. **进程间通信**：所有控制都是通过进程间队列实现的，可能会有轻微延迟
-2. **超时处理**：建议为所有状态查询操作设置合理的超时时间
-3. **并发安全**：确保在多线程环境中正确使用这些方法
-4. **音频设备**：启动和停止监听会重新初始化音频设备，可能有短暂延迟
--- a/README_multiprocess.md
+++ b/README_multiprocess.md
@ -1,190 +0,0 @@
-# 多进程音频录音系统
-
-基于进程隔离的音频处理架构，实现零延迟的录音和播放切换。
-
-## 🚀 系统特点
-
-### 核心优势
- **多进程架构**: 输入输出进程完全隔离，无需设备重置
- **零切换延迟**: 彻底解决传统单进程的音频切换问题
- **实时响应**: 并行处理录音和播放，真正的实时体验
- **智能检测**: 基于ZCR(零交叉率)的精确语音识别
- **流式TTS**: 实时音频生成和播放，减少等待时间
- **角色扮演**: 支持多种AI角色和音色
-
-### 技术架构
-```
-主控制进程 ──┐
-            ├─ 输入进程 (录音 + 语音检测)
-            ├─ 输出进程 (音频播放)
-            └─ 在线AI服务 (STT + LLM + TTS)
-```
-
-## 📦 文件结构
-
-```
-Local-Voice/
-├── recorder.py              # 原始实现 (保留作为参考)
-├── multiprocess_recorder.py # 主程序
-├── audio_processes.py       # 音频进程模块
-├── control_system.py        # 控制系统模块
-├── config.json             # 配置文件
-└── characters/             # 角色配置目录
-    ├── libai.json         # 李白角色
-    └── zhubajie.json      # 猪八戒角色
-```
-
-## 🛠️ 安装和运行
-
-### 1. 环境要求
- Python 3.7+
- 音频输入设备 (麦克风)
- 网络连接 (用于在线AI服务)
-
-### 2. 安装依赖
-```bash
-pip install pyaudio numpy requests websockets
-```
-
-### 3. 设置API密钥
-```bash
-export ARK_API_KEY='your_api_key_here'
-```
-
-### 4. 基本运行
-```bash
-# 使用默认角色 (李白)
-python multiprocess_recorder.py
-
-# 指定角色
-python multiprocess_recorder.py -c zhubajie
-
-# 列出可用角色
-python multiprocess_recorder.py -l
-
-# 使用配置文件
-python multiprocess_recorder.py --config config.json
-
-# 创建示例配置文件
-python multiprocess_recorder.py --create-config
-```
-
-## ⚙️ 配置说明
-
-### 主要配置项
-
-| 配置项 | 说明 | 默认值 |
-|--------|------|--------|
-| `recording.min_duration` | 最小录音时长(秒) | 2.0 |
-| `recording.max_duration` | 最大录音时长(秒) | 30.0 |
-| `recording.silence_threshold` | 静音检测阈值(秒) | 3.0 |
-| `detection.zcr_min` | ZCR最小值 | 2400 |
-| `detection.zcr_max` | ZCR最大值 | 12000 |
-| `processing.max_tokens` | LLM最大token数 | 50 |
-
-### 音频参数
- 采样率: 16kHz
- 声道数: 1 (单声道)
- 位深度: 16位
- 格式: PCM
-
-## 🎭 角色系统
-
-### 支持的角色
- **libai**: 李白 - 文雅诗人风格
- **zhubajie**: <20>豬八戒 - 幽默风趣风格
-
-### 自定义角色
-在 `characters/` 目录创建JSON文件:
-
-```json
-{
-  "name": "角色名称",
-  "description": "角色描述",
-  "system_prompt": "系统提示词",
-  "voice": "zh_female_wanqudashu_moon_bigtts",
-  "max_tokens": 50
-}
-```
-
-## 🔧 故障排除
-
-### 常见问题
-
-1. **音频设备问题**
-   ```bash
-   # 检查音频设备
-   python multiprocess_recorder.py --check-env
-   ```
-
-2. **依赖缺失**
-   ```bash
-   # 重新安装依赖
-   pip install --upgrade pyaudio numpy requests websockets
-   ```
-
-3. **网络连接问题**
-   - 检查网络连接
-   - 确认API密钥正确
-   - 检查防火墙设置
-
-4. **权限问题**
-   ```bash
-   # Linux系统可能需要音频权限
-   sudo usermod -a -G audio $USER
-   ```
-
-### 调试模式
-```bash
-# 启用详细输出
-python multiprocess_recorder.py -v
-```
-
-## 📊 性能对比
-
-| 指标 | 原始单进程 | 多进程架构 | 改善 |
-|------|-----------|------------|------|
-| 切换延迟 | 1-2秒 | 0秒 | 100% |
-| CPU利用率 | 单核 | 多核 | 提升 |
-| 响应速度 | 较慢 | 实时 | 显著改善 |
-| 稳定性 | 一般 | 优秀 | 大幅提升 |
-
-## 🔄 与原版本对比
-
-### 原版本 (recorder.py)
- 单进程处理
- 需要频繁重置音频设备
- 录音和播放不能同时进行
- 切换延迟明显
-
-### 新版本 (multiprocess_recorder.py)
- 多进程架构
- 输入输出完全隔离
- 零切换延迟
- 真正的并行处理
- 更好的稳定性和扩展性
-
-## 📝 开发说明
-
-### 架构设计
- **输入进程**: 专注录音和语音检测
- **输出进程**: 专注音频播放
- **主控制进程**: 协调整个系统和AI处理
-
-### 进程间通信
- 使用 `multiprocessing.Queue` 进行安全通信
- 支持命令控制和事件通知
- 线程安全的音频数据传输
-
-### 状态管理
- 清晰的状态机设计
- 完善的错误处理机制
- 优雅的进程退出流程
-
-## 📄 许可证
-
-本项目仅供学习和研究使用。
-
-## 🤝 贡献
-
-欢迎提交Issue和Pull Request来改进这个项目。
--- a/characters/aiyinsitan.json
+++ b/characters/aiyinsitan.json
@ -0,0 +1,10 @@
+{
+  "name": "爱因斯坦",
+  "description": "伟大的物理学家，相对论创立者",
+  "system_prompt": "我是阿尔伯特·爱因斯坦，物理学家。说话要有科学家的智慧感和好奇心，喜欢用简单的比喻解释复杂的概念。经常思考宇宙、时间、空间等深奥问题。要有幽默感，偶尔自嘲一下。说话要体现出对知识的热爱和对世界的好奇心，常用'有趣的是'、'想象一下'等词语来引导思考。",
+  "voice": "ICL_zh_male_youmodaye_tob",
+  "max_tokens": 500,
+  "greeting": "你好！我是爱因斯坦。想象力比知识更重要，因为知识是有限的，而想象力概括着世界的一切。",
+  "nfc_uid": "1DCAC90D0D1080",
+  "author": "Claude"
+}
--- a/characters/shaseng.json
+++ b/characters/shaseng.json
@ -0,0 +1,10 @@
+{
+  "name": "沙僧",
+  "description": "西游记中的沙和尚，忠厚老实的护法",
+  "system_prompt": "我是沙和尚，沙悟净。原是流沙河的水怪，后随师父唐僧西天取经。为人忠厚老实，做事踏实稳重，从不偷懒。说话诚恳实在，常用'师父说得对'、'大师兄说得对'来表达对长者的尊重。性格温和，做事认真负责，是个可靠的伙伴。说话要体现出踏实肯干的性格。",
+  "voice": "ICL_zh_male_diyinchenyu_tob",
+  "max_tokens": 500,
+  "greeting": "贫僧沙悟净，见过各位。愿随师父西行取经，保护师父安全，一路降妖除魔。",
+  "nfc_uid": "1DC9C90D0D1080",
+  "author": "Claude"
+}
--- a/characters/tangseng.json
+++ b/characters/tangseng.json
@ -0,0 +1,10 @@
+{
+  "name": "唐僧",
+  "description": "西游记中的取经人，慈悲为怀的高僧",
+  "system_prompt": "贫僧唐三藏，法号玄奘，奉唐王之命前往西天取经。说话要温和慈悲，常常引用佛经教诲，劝人向善。对众生都要有慈悲心，即使是妖魔鬼怪也要度化。说话要文雅，常用'阿弥陀佛'、'善哉善哉'等佛家用语。回答要体现出高僧的智慧和慈悲心。",
+  "voice": "zh_male_tangseng_mars_bigtts",
+  "max_tokens": 500,
+  "greeting": "阿弥陀佛，贫僧唐三藏。今日与君相遇，实乃有缘。愿与施主共论佛法，同修善果。",
+  "nfc_uid": "1DC8C90D0D1080",
+  "author": "Claude"
+}
--- a/characters/xiaolanchong.json
+++ b/characters/xiaolanchong.json
@ -0,0 +1,10 @@
+{
+  "name": "作业小助手",
+  "description": "专门催促小懒虫写作业的贴心小帮手",
+  "system_prompt": "我是来催你写作业的小助手！小懒虫，别再拖延了，作业要抓紧时间完成哦！我会用各种方式提醒你：温和鼓励、严肃提醒、偶尔撒娇催促。知道你不想写作业，但学习很重要啊！常用'该写作业啦'、'加油加油'、'别玩手机了'这样的话语。既要关心你，又要坚持原则，直到你把作业完成。记住，我是来帮你的，不是来批评你的。",
+  "voice": "zh_female_linjianvhai_moon_bigtts",
+  "max_tokens": 500,
+  "greeting": "小懒虫！作业写完了吗？快过来写作业，我陪着你一起加油！别让我一直催你哦~",
+  "nfc_uid": "1DCBC90D0D1080",
+  "author": "Claude"
+}
--- a/config.json
+++ b/config.json
@ -35,5 +35,11 @@
    "show_progress": true,
    "progress_interval": 100,
    "chunk_size": 512
+  },
+  "cleanup": {
+    "auto_cleanup": true,
+    "retention_hours": 1,
+    "max_files": 10,
+    "cleanup_interval": 120
  }
 }
--- a/test_cache_fixes.py
+++ b/test_cache_fixes.py
@ -1,172 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-测试修复后的缓存播放功能
-"""
-
-import os
-import sys
-import time
-
-# 添加项目路径
-sys.path.append('.')
-
-def test_cache_playback_fixes():
-    """测试缓存播放修复"""
-    print("🔧 测试缓存播放修复")
-    print("=" * 40)
-    
-    from audio_processes import save_greeting_cache, greeting_cache_exists, load_cached_audio
-    
-    # 创建测试缓存
-    character_name = "测试角色"
-    mock_audio = b"test_cached_audio_" * 100  # 约1.6KB
-    
-    print("📝 创建测试缓存...")
-    save_greeting_cache(character_name, mock_audio)
-    
-    if greeting_cache_exists(character_name):
-        print("✅ 缓存创建成功")
-        
-        # 模拟OutputProcess的修复逻辑
-        print("\n🎵 模拟修复后的缓存播放流程...")
-        
-        # 模拟状态变量
-        is_playing = False
-        currently_playing = False
-        preload_buffer = []
-        playback_buffer = []
-        preload_size = 3
-        last_playback_time = 0
-        playback_cooldown_period = 0.05
-        tts_generation_complete = False
-        all_audio_received = False
-        
-        # 模拟加载缓存
-        cached_audio = load_cached_audio(character_name)
-        if cached_audio:
-            print(f"📁 缓存音频加载: {len(cached_audio)} 字节")
-            
-            # 添加到预加载缓冲区
-            preload_buffer.append(cached_audio)
-            print(f"📦 添加到预加载缓冲区")
-            
-            # 应用修复后的逻辑
-            print("\n🔧 应用修复1: 设置TTS完成状态")
-            tts_generation_complete = True
-            print(f"   tts_generation_complete = {tts_generation_complete}")
-            
-            print("🔧 应用修复2: 设置all_audio_received状态")
-            all_audio_received = True
-            print(f"   all_audio_received = {all_audio_received}")
-            
-            print("🔧 应用修复3: 检查播放触发条件")
-            if (not is_playing and len(preload_buffer) >= preload_size):
-                print("   🎵 条件1: 预加载完成播放")
-                playback_buffer.extend(preload_buffer)
-                preload_buffer.clear()
-                is_playing = True
-                last_playback_time = 0  # 修复: 避免冷却期
-                print(f"   📊 播放缓冲区: {len(playback_buffer)} 块")
-            elif (not is_playing and len(preload_buffer) > 0):
-                print("   🎵 条件2: 强制播放缓存音频")
-                playback_buffer.extend(preload_buffer)
-                preload_buffer.clear()
-                is_playing = True
-                last_playback_time = 0  # 修复: 避免冷却期
-                print(f"   📊 播放缓冲区: {len(playback_buffer)} 块")
-            
-            # 模拟播放冷却检查
-            print("\n🔧 检查播放冷却机制...")
-            current_time = time.time()
-            time_since_last_play = current_time - last_playback_time
-            in_cooldown = (last_playback_time > 0 and 
-                          time_since_last_play < playback_cooldown_period)
-            
-            print(f"   time_since_last_play = {time_since_last_play}")
-            print(f"   playback_cooldown_period = {playback_cooldown_period}")
-            print(f"   in_cooldown = {in_cooldown}")
-            
-            if not in_cooldown:
-                print("   ✅ 无冷却期限制，可以播放")
-                currently_playing = True
-                print("   🎧 开始播放音频...")
-            else:
-                print("   ❌ 仍在冷却期内，跳过播放")
-            
-            # 模拟播放完成检测
-            print("\n🔧 检查播放完成条件...")
-            conditions_met = (
-                tts_generation_complete and  # TTS生成完成
-                all_audio_received and       # 所有音频已接收
-                len(preload_buffer) == 0 and   # 预加载缓冲区为空
-                len(playback_buffer) == 0 and  # 播放缓冲区为空
-                not currently_playing         # 当前没有在播放
-            )
-            
-            print(f"   tts_generation_complete = {tts_generation_complete}")
-            print(f"   all_audio_received = {all_audio_received}")
-            print(f"   preload_buffer_empty = {len(preload_buffer) == 0}")
-            print(f"   playback_buffer_empty = {len(playback_buffer) == 0}")
-            print(f"   not_currently_playing = {not currently_playing}")
-            print(f"   conditions_met = {conditions_met}")
-            
-            if conditions_met:
-                print("   ✅ 播放完成条件满足")
-            else:
-                print("   ⏳ 等待播放完成")
-        
-    else:
-        print("❌ 缓存创建失败")
-
-def test_key_fixes():
-    """测试关键修复点"""
-    print("\n🔍 测试关键修复点")
-    print("=" * 30)
-    
-    print("✅ 修复1: 播放冷却问题")
-    print("   - 将 last_playback_time 设置为 0")
-    print("   - 避免立即触发冷却期")
-    
-    print("\n✅ 修复2: all_audio_received 状态")
-    print("   - 缓存音频立即设置为 True")
-    print("   - 避免系统无限等待")
-    
-    print("\n✅ 修复3: 播放触发逻辑")
-    print("   - 强制播放机制")
-    print("   - 确保缓存音频能正常播放")
-
-def cleanup():
-    """清理测试文件"""
-    print("\n🧹 清理测试文件")
-    
-    from audio_processes import get_greeting_cache_path
-    cache_path = get_greeting_cache_path("测试角色")
-    if os.path.exists(cache_path):
-        try:
-            os.remove(cache_path)
-            print("   ✅ 测试缓存已删除")
-        except Exception as e:
-            print(f"   ❌ 删除失败: {e}")
-
-if __name__ == "__main__":
-    print("🚀 开始测试修复后的缓存播放功能")
-    
-    try:
-        # 测试缓存播放修复
-        test_cache_playback_fixes()
-        
-        # 测试关键修复点
-        test_key_fixes()
-        
-        print("\n🎉 修复测试完成！")
-        
-    except Exception as e:
-        print(f"\n❌ 测试过程中出错: {e}")
-        import traceback
-        traceback.print_exc()
-        
-    finally:
-        # 清理测试文件
-        cleanup()
--- a/test_cached_audio_fix.py
+++ b/test_cached_audio_fix.py
@ -1,78 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-测试缓存音频播放完成检测修复
-"""
-
-import sys
-import os
-sys.path.append(os.path.dirname(__file__))
-
-from audio_processes import OutputProcess
-import multiprocessing as mp
-import time
-
-def test_cached_audio_completion():
-    """测试缓存音频播放完成检测"""
-    print("🧪 开始测试缓存音频播放完成检测修复...")
-    
-    # 创建测试队列
-    audio_queue = mp.Queue(maxsize=100)
-    event_queue = mp.Queue(maxsize=100)
-    
-    # 创建输出进程实例
-    config = {
-        'buffer_size': 1000,
-        'show_progress': True,
-        'progress_interval': 100,
-        'tts_speaker': 'zh_female_wanqudashu_moon_bigtts'
-    }
-    
-    output_process = OutputProcess(audio_queue, config, event_queue)
-    
-    # 测试1: 检查新添加的状态变量
-    print("\n📋 测试1: 检查新增的状态变量")
-    assert hasattr(output_process, 'is_playing_cached_audio'), "缺少 is_playing_cached_audio 状态变量"
-    assert output_process.is_playing_cached_audio == False, "初始状态应该为 False"
-    print("✅ 状态变量检查通过")
-    
-    # 测试2: 检查新添加的方法
-    print("\n📋 测试2: 检查新增的方法")
-    assert hasattr(output_process, '_check_cached_audio_completion'), "缺少 _check_cached_audio_completion 方法"
-    print("✅ 方法检查通过")
-    
-    # 测试3: 检查增强播放完成检测方法
-    print("\n📋 测试3: 检查增强播放完成检测方法")
-    assert hasattr(output_process, '_check_enhanced_playback_completion'), "缺少 _check_enhanced_playback_completion 方法"
-    print("✅ 增强播放完成检测方法检查通过")
-    
-    # 测试4: 模拟缓存音频播放状态
-    print("\n📋 测试4: 模拟缓存音频播放状态")
-    output_process.is_playing_cached_audio = True
-    output_process.end_signal_received = True
-    output_process.currently_playing = False
-    output_process.preload_buffer = []
-    output_process.playback_buffer = []
-    output_process.last_audio_chunk_time = time.time() - 2.0  # 2秒前播放
-    
-    # 测试缓存音频完成检测
-    result = output_process._check_cached_audio_completion()
-    assert result == True, "缓存音频应该检测为播放完成"
-    print("✅ 缓存音频完成检测逻辑正确")
-    
-    # 测试5: 模拟缓存音频仍在播放
-    print("\n📋 测试5: 模拟缓存音频仍在播放")
-    output_process.playback_buffer = [b'fake_audio_data']  # 还有数据在播放缓冲区
-    result = output_process._check_cached_audio_completion()
-    assert result == False, "缓存音频仍在播放时应该检测为未完成"
-    print("✅ 缓存音频播放中检测逻辑正确")
-    
-    print("\n🎉 所有测试通过！修复成功！")
-    
-    # 清理
-    audio_queue.close()
-    event_queue.close()
-
-if __name__ == "__main__":
-    test_cached_audio_completion()
--- a/test_cached_playback.py
+++ b/test_cached_playback.py
@ -1,172 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-测试缓存音频播放功能
-"""
-
-import os
-import sys
-import time
-from pathlib import Path
-
-# 添加项目路径
-sys.path.append('.')
-
-from audio_processes import (
-    get_greeting_cache_path, 
-    greeting_cache_exists, 
-    load_cached_audio, 
-    save_greeting_cache
-)
-
-def test_cached_audio_playback():
-    """测试缓存音频播放功能"""
-    print("🎵 测试缓存音频播放功能")
-    print("=" * 50)
-    
-    # 确保缓存目录存在
-    os.makedirs("greeting_cache", exist_ok=True)
-    
-    # 测试角色
-    character_name = "测试角色"
-    greeting_text = "这是一个测试角色的打招呼音频。"
-    
-    # 1. 创建测试缓存音频
-    print(f"\n📝 创建测试缓存音频...")
-    cache_path = get_greeting_cache_path(character_name)
-    
-    # 生成模拟音频数据（较大音频以测试播放）
-    mock_audio_data = b"mock_cached_audio_data_" * 100  # 约2.5KB
-    
-    # 保存到缓存
-    save_success = save_greeting_cache(character_name, mock_audio_data)
-    print(f"   缓存保存结果: {save_success}")
-    
-    # 2. 验证缓存文件
-    if os.path.exists(cache_path):
-        file_size = os.path.getsize(cache_path)
-        print(f"   缓存文件大小: {file_size} 字节")
-    
-    # 3. 模拟缓存加载和播放状态检查
-    print(f"\n🎵 模拟缓存音频播放流程...")
-    
-    # 模拟OutputProcess的播放状态
-    is_playing = False
-    preload_buffer = []
-    playback_buffer = []
-    preload_size = 3
-    
-    # 模拟加载缓存音频
-    cached_audio = load_cached_audio(character_name)
-    if cached_audio:
-        print(f"   ✅ 缓存音频加载成功: {len(cached_audio)} 字节")
-        
-        # 模拟添加到预加载缓冲区
-        preload_buffer.append(cached_audio)
-        print(f"   📦 已添加到预加载缓冲区，当前大小: {len(preload_buffer)}")
-        
-        # 检查播放触发条件（修复后的逻辑）
-        if (not is_playing and len(preload_buffer) >= preload_size):
-            print(f"   🎵 条件1：预加载完成，开始播放")
-            playback_buffer.extend(preload_buffer)
-            preload_buffer.clear()
-            is_playing = True
-            print(f"   🎵 播放缓冲区大小: {len(playback_buffer)}")
-        elif (not is_playing and len(preload_buffer) > 0):
-            print(f"   🎵 条件2：强制播放缓存音频")
-            playback_buffer.extend(preload_buffer)
-            preload_buffer.clear()
-            is_playing = True
-            print(f"   🎵 播放缓冲区大小: {len(playback_buffer)}")
-        else:
-            print(f"   ⚠️  未满足播放条件")
-            print(f"      is_playing: {is_playing}")
-            print(f"      preload_buffer大小: {len(preload_buffer)}")
-            print(f"      preload_size: {preload_size}")
-    else:
-        print(f"   ❌ 缓存音频加载失败")
-    
-    # 4. 模拟播放完成检测
-    if is_playing and len(playback_buffer) > 0:
-        print(f"\n🎵 模拟播放过程...")
-        print(f"   🎧 正在播放音频...")
-        
-        # 模拟播放缓冲区清空
-        playback_buffer.clear()
-        is_playing = False
-        print(f"   ✅ 播放完成")
-    
-    print(f"\n✅ 缓存音频播放测试完成")
-
-def test_different_audio_sizes():
-    """测试不同大小的音频文件"""
-    print("\n🎵 测试不同大小的音频文件")
-    print("=" * 40)
-    
-    test_cases = [
-        {"name": "小音频", "size": 1},      # 1个音频块
-        {"name": "中等音频", "size": 5},   # 5个音频块
-        {"name": "大音频", "size": 10},    # 10个音频块
-    ]
-    
-    preload_size = 3
-    
-    for case in test_cases:
-        print(f"\n📝 测试{case['name']} ({case['size']}个音频块)")
-        
-        # 模拟音频块
-        audio_chunks = [f"chunk_{i}".encode() for i in range(case['size'])]
-        
-        # 模拟播放状态
-        is_playing = False
-        preload_buffer = []
-        playback_buffer = []
-        
-        # 添加音频到预加载缓冲区
-        preload_buffer.extend(audio_chunks)
-        print(f"   📦 添加到预加载缓冲区: {len(preload_buffer)} 块")
-        
-        # 检查播放触发条件
-        if (not is_playing and len(preload_buffer) >= preload_size):
-            print(f"   🎵 预加载完成，开始播放")
-            playback_buffer.extend(preload_buffer)
-            preload_buffer.clear()
-            is_playing = True
-        elif (not is_playing and len(preload_buffer) > 0):
-            print(f"   🎵 强制播放缓存音频")
-            playback_buffer.extend(preload_buffer)
-            preload_buffer.clear()
-            is_playing = True
-        else:
-            print(f"   ⚠️  未满足播放条件")
-        
-        print(f"   📊 播放状态: is_playing={is_playing}, playback_buffer={len(playback_buffer)}, preload_buffer={len(preload_buffer)}")
-
-def cleanup_test_files():
-    """清理测试文件"""
-    print("\n🧹 清理测试文件")
-    
-    cache_path = get_greeting_cache_path("测试角色")
-    if os.path.exists(cache_path):
-        try:
-            os.remove(cache_path)
-            print(f"   已删除: {cache_path}")
-        except Exception as e:
-            print(f"   删除失败: {e}")
-
-if __name__ == "__main__":
-    print("🚀 开始测试缓存音频播放功能")
-    
-    try:
-        # 测试缓存音频播放
-        test_cached_audio_playback()
-        
-        # 测试不同大小的音频
-        test_different_audio_sizes()
-        
-    finally:
-        # 清理测试文件
-        cleanup_test_files()
-    
-    print("\n🎉 所有测试完成！")
--- a/test_cached_timing_fix.py
+++ b/test_cached_timing_fix.py
@ -1,91 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-测试缓存音频时序修复
-"""
-
-import sys
-import os
-import time
-sys.path.append(os.path.dirname(__file__))
-
-from audio_processes import OutputProcess
-import multiprocessing as mp
-
-def test_cached_audio_timing():
-    """测试缓存音频时序修复"""
-    print("🧪 开始测试缓存音频时序修复...")
-    
-    # 创建测试队列
-    audio_queue = mp.Queue(maxsize=100)
-    event_queue = mp.Queue(maxsize=100)
-    
-    # 创建输出进程实例
-    config = {
-        'buffer_size': 1000,
-        'show_progress': True,
-        'progress_interval': 100,
-        'tts_speaker': 'zh_female_wanqudashu_moon_bigtts'
-    }
-    
-    output_process = OutputProcess(audio_queue, config, event_queue)
-    
-    # 测试1: 检查关键时序变量
-    print("\n📋 测试1: 检查关键时序变量")
-    assert hasattr(output_process, 'last_audio_chunk_time'), "缺少 last_audio_chunk_time 变量"
-    assert hasattr(output_process, 'all_audio_received'), "缺少 all_audio_received 变量"
-    print(f"✅ 初始 last_audio_chunk_time: {output_process.last_audio_chunk_time}")
-    print(f"✅ 初始 all_audio_received: {output_process.all_audio_received}")
-    
-    # 测试2: 模拟缓存音频处理前的状态
-    print("\n📋 测试2: 检查初始状态")
-    initial_time = output_process.last_audio_chunk_time
-    print(f"✅ 初始时间戳: {initial_time}")
-    
-    # 测试3: 验证我们的修复逻辑
-    print("\n📋 测试3: 验证修复逻辑")
-    
-    # 模拟设置时序变量（这是我们的修复核心）
-    test_time = time.time()
-    output_process.last_audio_chunk_time = test_time
-    output_process.all_audio_received = True
-    
-    print(f"✅ 设置后 last_audio_chunk_time: {output_process.last_audio_chunk_time}")
-    print(f"✅ 设置后 all_audio_received: {output_process.all_audio_received}")
-    
-    # 验证时间差计算
-    time_diff = time.time() - output_process.last_audio_chunk_time
-    print(f"✅ 时间差计算: {time_diff:.3f}秒（应该接近0）")
-    
-    # 测试4: 检查是否会有异常的时间差（修复前的问题）
-    print("\n📋 测试4: 检查异常时间差问题")
-    
-    # 模拟修复前的问题：last_audio_chunk_time为0或很老的时间
-    old_time = output_process.last_audio_chunk_time
-    output_process.last_audio_chunk_time = 0  # 模拟未初始化的情况
-    
-    # 模拟播放完成检测逻辑
-    if output_process.last_audio_chunk_time > 0:
-        time_since_last = time.time() - output_process.last_audio_chunk_time
-        print(f"⚠️  时间差: {time_since_last:.3f}秒")
-    else:
-        print("⚠️  last_audio_chunk_time未设置，这会导致立即完成")
-    
-    # 恢复正确的时间
-    output_process.last_audio_chunk_time = old_time
-    
-    print("\n🎉 时序修复验证完成!")
-    print("📝 修复要点:")
-    print("   1. 在缓存音频开始播放时设置last_audio_chunk_time")
-    print("   2. 确保all_audio_received在适当时机设置")
-    print("   3. 避免出现49.292秒的异常时间差")
-    
-    # 清理
-    output_process.running = False
-    time.sleep(0.1)  # 给线程时间清理
-    
-    return True
-
-if __name__ == "__main__":
-    test_cached_audio_timing()
--- a/test_final_integration.py
+++ b/test_final_integration.py
@ -1,139 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-最终集成测试：验证缓存播放修复
-"""
-
-import os
-import sys
-import time
-
-# 添加项目路径
-sys.path.append('.')
-
-def create_test_cache():
-    """创建测试缓存文件"""
-    from audio_processes import save_greeting_cache
-    
-    print("🎵 创建测试缓存文件...")
-    
-    # 创建李白角色的缓存
-    libai_audio = b"libai_greeting_audio_" * 50  # 约1KB
-    save_greeting_cache("李白", libai_audio)
-    print("   ✅ 李白缓存已创建")
-    
-    # 创建猪八戒角色的缓存
-    zhubajie_audio = b"zhubajie_greeting_audio_" * 80  # 约1.6KB
-    save_greeting_cache("猪八戒", zhubajie_audio)
-    print("   ✅ 猪八戒缓存已创建")
-
-def simulate_cached_playback():
-    """模拟缓存播放流程"""
-    print("\n🎭 模拟角色切换和缓存播放")
-    print("=" * 50)
-    
-    characters = ["李白", "猪八戒"]
-    
-    for i, character in enumerate(characters):
-        print(f"\n📝 第 {i+1} 次角色切换: {character}")
-        
-        # 模拟检查缓存
-        from audio_processes import greeting_cache_exists, load_cached_audio
-        
-        if greeting_cache_exists(character):
-            print(f"   ✅ 找到缓存文件")
-            
-            # 模拟加载缓存
-            cached_audio = load_cached_audio(character)
-            if cached_audio:
-                print(f"   📁 缓存大小: {len(cached_audio)} 字节")
-                
-                # 模拟OutputProcess的播放逻辑
-                is_playing = False
-                preload_buffer = []
-                playback_buffer = []
-                preload_size = 3
-                
-                # 添加缓存音频到预加载缓冲区
-                preload_buffer.append(cached_audio)
-                print(f"   📦 添加到预加载缓冲区")
-                
-                # 应用修复后的播放触发逻辑
-                if (not is_playing and len(preload_buffer) >= preload_size):
-                    print(f"   🎵 预加载完成，开始播放")
-                    playback_buffer.extend(preload_buffer)
-                    preload_buffer.clear()
-                    is_playing = True
-                elif (not is_playing and len(preload_buffer) > 0):
-                    print(f"   🎵 强制播放缓存音频")
-                    playback_buffer.extend(preload_buffer)
-                    preload_buffer.clear()
-                    is_playing = True
-                
-                if is_playing:
-                    print(f"   🎧 开始播放 {character} 的打招呼音频...")
-                    print(f"   📊 播放缓冲区: {len(playback_buffer)} 块")
-                    
-                    # 模拟播放完成
-                    time.sleep(0.1)
-                    playback_buffer.clear()
-                    is_playing = False
-                    print(f"   ✅ 播放完成")
-                else:
-                    print(f"   ❌ 播放未启动")
-            else:
-                print(f"   ❌ 缓存加载失败")
-        else:
-            print(f"   ❌ 缓存不存在")
-
-def verify_performance_improvement():
-    """验证性能改进"""
-    print("\n⚡ 性能改进验证")
-    print("=" * 30)
-    
-    print("📊 对比测试:")
-    print("   ❌ 无缓存: TTS生成 (2-3秒) + 播放")
-    print("   ✅ 有缓存: 直接播放 (<0.5秒)")
-    print("   📈 性能提升: 约80%时间节约")
-    
-    print("\n🎯 用户体验:")
-    print("   ✅ 角色切换更流畅")
-    print("   ✅ 无等待时间")
-    print("   ✅ 即时响应")
-
-def cleanup():
-    """清理测试文件"""
-    print("\n🧹 清理测试文件")
-    
-    import shutil
-    if os.path.exists("greeting_cache"):
-        try:
-            shutil.rmtree("greeting_cache")
-            print("   ✅ 缓存目录已删除")
-        except Exception as e:
-            print(f"   ❌ 清理失败: {e}")
-
-if __name__ == "__main__":
-    print("🚀 开始最终集成测试")
-    
-    try:
-        # 创建测试缓存
-        create_test_cache()
-        
-        # 模拟缓存播放
-        simulate_cached_playback()
-        
-        # 验证性能改进
-        verify_performance_improvement()
-        
-        print("\n🎉 集成测试完成！缓存播放功能已修复")
-        
-    except Exception as e:
-        print(f"\n❌ 测试过程中出错: {e}")
-        import traceback
-        traceback.print_exc()
-        
-    finally:
-        # 清理测试文件
-        cleanup()
--- a/test_full_cache_flow.py
+++ b/test_full_cache_flow.py
@ -1,139 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-测试完整的角色greeting缓存流程
-"""
-
-import os
-import sys
-import json
-from pathlib import Path
-
-# 添加项目路径
-sys.path.append('.')
-
-from audio_processes import (
-    get_greeting_cache_path, 
-    greeting_cache_exists, 
-    load_cached_audio, 
-    save_greeting_cache
-)
-
-def test_character_greeting_cache():
-    """测试角色greeting缓存流程"""
-    print("🧪 测试角色greeting缓存流程")
-    print("=" * 50)
-    
-    # 测试角色配置
-    characters = [
-        {"name": "李白", "greeting": "吾乃李白，字太白，号青莲居士。今天有幸与君相会，让我们畅谈诗词人生吧！"},
-        {"name": "猪八戒", "greeting": "嘿！俺老猪来也！今天咱聊点啥好吃的？要不要一起去化缘啊？"}
-    ]
-    
-    for character in characters:
-        character_name = character["name"]
-        greeting_text = character["greeting"]
-        
-        print(f"\n📝 测试角色: {character_name}")
-        print(f"   打招呼文本: {greeting_text}")
-        
-        # 1. 检查缓存是否已存在
-        cache_exists = greeting_cache_exists(character_name)
-        print(f"   1. 缓存存在检查: {cache_exists}")
-        
-        # 2. 如果不存在缓存，模拟生成并保存
-        if not cache_exists:
-            print(f"   2. 模拟生成TTS音频...")
-            # 模拟音频数据（实际使用时会是真实的TTS生成的音频）
-            mock_audio_data = f"mock_audio_for_{character_name}".encode('utf-8') + os.urandom(1000)
-            
-            print(f"   3. 保存到缓存...")
-            save_success = save_greeting_cache(character_name, mock_audio_data)
-            print(f"   4. 保存结果: {save_success}")
-        else:
-            print(f"   2. 缓存已存在，跳过生成")
-        
-        # 3. 验证缓存可以正常加载
-        print(f"   5. 验证缓存加载...")
-        cached_audio = load_cached_audio(character_name)
-        if cached_audio:
-            print(f"   6. 缓存加载成功: {len(cached_audio)} 字节")
-        else:
-            print(f"   6. 缓存加载失败")
-        
-        print(f"   ✅ {character_name} 的缓存流程测试完成")
-    
-    print(f"\n🎉 所有角色的缓存流程测试完成")
-
-def test_cache_hit_miss_scenario():
-    """测试缓存命中和未命中场景"""
-    print("\n🧪 测试缓存命中和未命中场景")
-    print("=" * 50)
-    
-    character_name = "测试角色"
-    greeting_text = "这是一个测试角色的打招呼文本。"
-    
-    # 第一次调用 - 缓存未命中
-    print(f"\n📝 第一次调用（缓存未命中）")
-    cache_exists_before = greeting_cache_exists(character_name)
-    print(f"   缓存存在: {cache_exists_before}")
-    
-    if not cache_exists_before:
-        print("   模拟TTS生成和保存缓存...")
-        mock_audio = b"first_call_audio_data" + os.urandom(500)
-        save_greeting_cache(character_name, mock_audio)
-    
-    # 第二次调用 - 缓存命中
-    print(f"\n📝 第二次调用（缓存命中）")
-    cache_exists_after = greeting_cache_exists(character_name)
-    print(f"   缓存存在: {cache_exists_after}")
-    
-    if cache_exists_after:
-        cached_audio = load_cached_audio(character_name)
-        print(f"   成功加载缓存: {len(cached_audio)} 字节")
-    
-    print(f"\n✅ 缓存命中/未命中场景测试完成")
-
-def cleanup_test_files():
-    """清理测试文件"""
-    print("\n🧹 清理测试文件")
-    print("=" * 30)
-    
-    test_characters = ["李白", "猪八戒", "测试角色"]
-    
-    for character_name in test_characters:
-        cache_path = get_greeting_cache_path(character_name)
-        cache_file = Path(cache_path)
-        
-        if cache_file.exists():
-            try:
-                cache_file.unlink()
-                print(f"   已删除: {cache_file.name}")
-            except Exception as e:
-                print(f"   删除失败 {cache_file.name}: {e}")
-    
-    # 检查缓存目录是否为空
-    cache_dir = Path("greeting_cache")
-    if cache_dir.exists() and not any(cache_dir.iterdir()):
-        try:
-            cache_dir.rmdir()
-            print(f"   已删除空目录: {cache_dir}")
-        except Exception as e:
-            print(f"   删除目录失败: {e}")
-
-if __name__ == "__main__":
-    print("🚀 开始测试完整的角色greeting缓存流程")
-    
-    try:
-        # 测试角色greeting缓存流程
-        test_character_greeting_cache()
-        
-        # 测试缓存命中和未命中场景
-        test_cache_hit_miss_scenario()
-        
-    finally:
-        # 清理测试文件
-        cleanup_test_files()
-    
-    print("\n🎉 所有测试完成！")
--- a/test_greeting_cache.py
+++ b/test_greeting_cache.py
@ -1,115 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-测试角色greeting缓存功能
-"""
-
-import os
-import sys
-import json
-from pathlib import Path
-
-# 添加项目路径
-sys.path.append('.')
-
-from audio_processes import (
-    get_greeting_cache_path, 
-    greeting_cache_exists, 
-    load_cached_audio, 
-    save_greeting_cache
-)
-
-def test_cache_functions():
-    """测试缓存功能"""
-    print("🧪 测试角色greeting缓存功能")
-    print("=" * 50)
-    
-    # 测试角色名称
-    test_character = "libai"
-    test_audio_data = b"test_audio_data_" + os.urandom(100)
-    
-    # 1. 测试缓存路径生成
-    print("\n1️⃣ 测试缓存路径生成")
-    cache_path = get_greeting_cache_path(test_character)
-    print(f"   缓存路径: {cache_path}")
-    
-    # 2. 测试缓存存在检查
-    print("\n2️⃣ 测试缓存存在检查")
-    exists_before = greeting_cache_exists(test_character)
-    print(f"   缓存存在检查 (保存前): {exists_before}")
-    
-    # 3. 测试缓存保存
-    print("\n3️⃣ 测试缓存保存")
-    save_success = save_greeting_cache(test_character, test_audio_data)
-    print(f"   缓存保存成功: {save_success}")
-    
-    # 4. 测试缓存存在检查（保存后）
-    print("\n4️⃣ 测试缓存存在检查（保存后）")
-    exists_after = greeting_cache_exists(test_character)
-    print(f"   缓存存在检查 (保存后): {exists_after}")
-    
-    # 5. 测试缓存加载
-    print("\n5️⃣ 测试缓存加载")
-    loaded_audio = load_cached_audio(test_character)
-    if loaded_audio:
-        print(f"   缓存加载成功: {len(loaded_audio)} 字节")
-        print(f"   数据匹配: {loaded_audio == test_audio_data}")
-    else:
-        print("   缓存加载失败")
-    
-    # 6. 检查缓存文件
-    print("\n6️⃣ 检查缓存文件")
-    cache_file = Path(cache_path)
-    if cache_file.exists():
-        print(f"   缓存文件存在: {cache_file}")
-        print(f"   文件大小: {cache_file.stat().st_size} 字节")
-    else:
-        print("   缓存文件不存在")
-    
-    # 7. 清理测试文件
-    print("\n7️⃣ 清理测试文件")
-    try:
-        if cache_file.exists():
-            cache_file.unlink()
-            print("   测试文件已清理")
-    except Exception as e:
-        print(f"   清理失败: {e}")
-    
-    print("\n✅ 缓存功能测试完成")
-
-def test_character_configs():
-    """测试角色配置"""
-    print("\n🧪 测试角色配置")
-    print("=" * 30)
-    
-    characters_dir = Path("characters")
-    if not characters_dir.exists():
-        print("❌ characters目录不存在")
-        return
-    
-    character_files = list(characters_dir.glob("*.json"))
-    print(f"📁 找到 {len(character_files)} 个角色配置文件:")
-    
-    for character_file in character_files:
-        try:
-            with open(character_file, 'r', encoding='utf-8') as f:
-                config = json.load(f)
-            
-            name = config.get("name", "未知")
-            greeting = config.get("greeting", "无")
-            print(f"   📝 {name}: {greeting[:30]}...")
-            
-        except Exception as e:
-            print(f"   ❌ 读取 {character_file.name} 失败: {e}")
-
-if __name__ == "__main__":
-    print("🚀 开始测试greeting缓存功能")
-    
-    # 测试缓存功能
-    test_cache_functions()
-    
-    # 测试角色配置
-    test_character_configs()
-    
-    print("\n🎉 所有测试完成！")
--- a/test_recording_stop.py
+++ b/test_recording_stop.py
@ -1,170 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-录音停止功能测试脚本
-验证play_greeting方法中的录音停止逻辑
-"""
-
-import sys
-import time
-sys.path.append('.')
-
-def test_recording_stop_logic():
-    """测试录音停止逻辑"""
-    print("🧪 测试录音停止逻辑...")
-    
-    # 模拟ControlSystem类的关键部分
-    class MockControlCommand:
-        def __init__(self, command):
-            self.command = command
-        
-        def __str__(self):
-            return f"ControlCommand({self.command})"
-    
-    class MockRecordingState:
-        IDLE = "idle"
-        RECORDING = "recording"
-        PLAYING = "playing"
-    
-    class MockControlSystem:
-        def __init__(self):
-            self.state = MockRecordingState.IDLE
-            self._monitoring_active = False
-            self.input_command_queue = []
-            self.commands_sent = []
-        
-        def _ensure_recording_stopped(self):
-            """确保录音功能完全停止 - 防止播放音频时产生回声"""
-            try:
-                # 停止当前录音（如果有）
-                if self.state == MockRecordingState.RECORDING:
-                    print("🛑 停止当前录音...")
-                    self.input_command_queue.append(MockControlCommand('stop_recording'))
-                    self.commands_sent.append('stop_recording')
-                    
-                    # 模拟等待录音停止完成
-                    start_time = time.time()
-                    while self.state == MockRecordingState.RECORDING and time.time() - start_time < 2.0:
-                        time.sleep(0.1)
-                    
-                    if self.state == MockRecordingState.RECORDING:
-                        print("⚠️ 录音停止超时，强制设置状态")
-                        self.state = MockRecordingState.IDLE
-                
-                # 停止当前监听（如果有）
-                if hasattr(self, '_monitoring_active') and self._monitoring_active:
-                    print("🛑 停止当前监听...")
-                    self.input_command_queue.append(MockControlCommand('stop_monitoring'))
-                    self.commands_sent.append('stop_monitoring')
-                    self._monitoring_active = False
-                
-                # 额外确保：再次发送停止命令
-                self.input_command_queue.append(MockControlCommand('stop_monitoring'))
-                self.commands_sent.append('stop_monitoring')
-                
-                print("✅ 录音功能已完全停止")
-                
-            except Exception as e:
-                print(f"❌ 停止录音功能时出错: {e}")
-                # 即使出错也要确保状态正确
-                self.state = MockRecordingState.IDLE
-    
-    # 测试场景1: 从IDLE状态开始
-    print("\n📋 测试场景1: 从IDLE状态播放greeting")
-    system1 = MockControlSystem()
-    system1.state = MockRecordingState.IDLE
-    system1._monitoring_active = False
-    
-    print(f"   初始状态: {system1.state}")
-    system1._ensure_recording_stopped()
-    print(f"   发送的命令: {system1.commands_sent}")
-    print(f"   最终状态: {system1.state}")
-    assert system1.state == MockRecordingState.IDLE
-    assert len(system1.commands_sent) == 1  # 只有一个额外的stop_monitoring
-    assert system1.commands_sent[0] == 'stop_monitoring'
-    
-    # 测试场景2: 从RECORDING状态开始
-    print("\n📋 测试场景2: 从RECORDING状态播放greeting")
-    system2 = MockControlSystem()
-    system2.state = MockRecordingState.RECORDING
-    system2._monitoring_active = True
-    
-    print(f"   初始状态: {system2.state}")
-    print(f"   监听状态: {system2._monitoring_active}")
-    system2._ensure_recording_stopped()
-    print(f"   发送的命令: {system2.commands_sent}")
-    print(f"   最终状态: {system2.state}")
-    assert system2.state == MockRecordingState.IDLE
-    assert 'stop_recording' in system2.commands_sent
-    assert 'stop_monitoring' in system2.commands_sent
-    assert len([cmd for cmd in system2.commands_sent if cmd == 'stop_monitoring']) == 2  # 应该发送两次
-    
-    # 测试场景3: 模拟录音停止超时
-    print("\n📋 测试场景3: 录音停止超时")
-    system3 = MockControlSystem()
-    system3.state = MockRecordingState.RECORDING
-    system3._monitoring_active = False
-    
-    # 修改方法，模拟录音无法停止的情况
-    def mock_ensure_recording_stopped_timeout(self):
-        """模拟录音停止超时的情况"""
-        try:
-            if self.state == MockRecordingState.RECORDING:
-                print("🛑 停止当前录音...")
-                self.commands_sent.append('stop_recording')
-                
-                # 模拟等待但状态不变
-                start_time = time.time()
-                # 故意不改变状态，模拟超时
-                if self.state == MockRecordingState.RECORDING:
-                    print("⚠️ 录音停止超时，强制设置状态")
-                    self.state = MockRecordingState.IDLE
-            
-            print("✅ 录音功能已完全停止")
-        except Exception as e:
-            print(f"❌ 停止录音功能时出错: {e}")
-            self.state = MockRecordingState.IDLE
-    
-    system3._ensure_recording_stopped = mock_ensure_recording_stopped_timeout.__get__(system3)
-    
-    print(f"   初始状态: {system3.state}")
-    system3._ensure_recording_stopped()
-    print(f"   发送的命令: {system3.commands_sent}")
-    print(f"   最终状态: {system3.state}")
-    assert system3.state == MockRecordingState.IDLE
-    assert 'stop_recording' in system3.commands_sent
-    
-    print("\n✅ 所有录音停止逻辑测试通过！")
-
-def test_play_greeting_integration():
-    """测试play_greeting集成"""
-    print("\n🧪 测试play_greeting集成...")
-    
-    # 模拟集成测试
-    print("📋 模拟play_greeting流程:")
-    print("   1. 获取角色配置")
-    print("   2. 调用_ensure_recording_stopped()")
-    print("   3. 设置状态为PLAYING")
-    print("   4. 检查缓存或生成TTS")
-    print("   5. 发送音频到输出队列")
-    
-    print("\n🎯 关键改进点:")
-    print("   ✅ 在播放前确保录音完全停止")
-    print("   ✅ 防止音频播放时的回声问题")
-    print("   ✅ 状态转换的完整性和安全性")
-    print("   ✅ 错误处理和超时机制")
-    
-    print("\n✅ play_greeting集成测试通过！")
-
-if __name__ == "__main__":
-    try:
-        test_recording_stop_logic()
-        test_play_greeting_integration()
-        print("\n🎉 所有测试完成！录音停止功能已正确实现。")
-        
-    except Exception as e:
-        print(f"\n❌ 测试失败: {e}")
-        import traceback
-        traceback.print_exc()
-        sys.exit(1)
--- a/test_role_switching.py
+++ b/test_role_switching.py
@ -1,147 +0,0 @@
-#!/usr/bin/env python3
-# -*- coding: utf-8 -*-
-
-"""
-模拟角色切换场景测试缓存功能
-"""
-
-import os
-import sys
-import json
-import time
-from pathlib import Path
-
-# 添加项目路径
-sys.path.append('.')
-
-def simulate_role_switching():
-    """模拟角色切换场景"""
-    print("🎭 模拟角色切换场景测试")
-    print("=" * 50)
-    
-    # 模拟角色配置
-    characters = {
-        "李白": {
-            "name": "李白",
-            "greeting": "吾乃李白，字太白，号青莲居士。今天有幸与君相会，让我们畅谈诗词人生吧！",
-            "voice": "ICL_zh_male_huzi_v1_tob"
-        },
-        "猪八戒": {
-            "name": "猪八戒", 
-            "greeting": "嘿！俺老猪来也！今天咱聊点啥好吃的？要不要一起去化缘啊？",
-            "voice": "zh_male_zhubajie_mars_bigtts"
-        }
-    }
-    
-    # 确保缓存目录存在
-    os.makedirs("greeting_cache", exist_ok=True)
-    
-    # 模拟多次角色切换
-    for iteration in range(3):
-        print(f"\n🔄 第 {iteration + 1} 次角色切换测试")
-        
-        for character_name, character_config in characters.items():
-            print(f"\n📝 切换到角色: {character_name}")
-            
-            # 检查缓存是否存在
-            cache_path = f"greeting_cache/{character_name}.wav"
-            cache_exists = os.path.exists(cache_path)
-            
-            if cache_exists:
-                print(f"   ✅ 找到缓存: {cache_path}")
-                # 模拟加载缓存
-                file_size = os.path.getsize(cache_path)
-                print(f"   📁 缓存文件大小: {file_size} 字节")
-                print(f"   ⚡ 使用缓存播放（无需TTS生成）")
-            else:
-                print(f"   ❌ 无缓存，需要生成TTS")
-                print(f"   🎵 模拟TTS生成...")
-                # 模拟TTS生成延迟
-                time.sleep(0.1)
-                
-                # 模拟生成音频数据
-                mock_audio = f"audio_for_{character_name}".encode('utf-8') + os.urandom(2000)
-                
-                # 保存到缓存
-                try:
-                    with open(cache_path, 'wb') as f:
-                        f.write(mock_audio)
-                    print(f"   💾 已保存到缓存: {cache_path}")
-                    print(f"   📊 缓存大小: {len(mock_audio)} 字节")
-                except Exception as e:
-                    print(f"   ❌ 保存缓存失败: {e}")
-            
-            print(f"   🎵 模拟播放打招呼: {character_config['greeting'][:30]}...")
-            print(f"   ✅ {character_name} 打招呼完成")
-    
-    print(f"\n🎊 角色切换测试完成")
-
-def analyze_cache_performance():
-    """分析缓存性能"""
-    print("\n📊 缓存性能分析")
-    print("=" * 30)
-    
-    cache_dir = Path("greeting_cache")
-    if not cache_dir.exists():
-        print("❌ 缓存目录不存在")
-        return
-    
-    cache_files = list(cache_dir.glob("*.wav"))
-    
-    if not cache_files:
-        print("❌ 没有找到缓存文件")
-        return
-    
-    total_size = 0
-    print(f"📁 找到 {len(cache_files)} 个缓存文件:")
-    
-    for cache_file in cache_files:
-        file_size = cache_file.stat().st_size
-        total_size += file_size
-        character_name = cache_file.stem
-        print(f"   📄 {character_name}: {file_size} 字节")
-    
-    print(f"\n📊 缓存统计:")
-    print(f"   总文件数: {len(cache_files)}")
-    print(f"   总大小: {total_size} 字节 ({total_size/1024:.1f} KB)")
-    print(f"   平均大小: {total_size/len(cache_files):.1f} 字节")
-
-def cleanup_cache():
-    """清理缓存"""
-    print("\n🧹 清理缓存")
-    print("=" * 20)
-    
-    cache_dir = Path("greeting_cache")
-    if cache_dir.exists():
-        for cache_file in cache_dir.glob("*.wav"):
-            try:
-                cache_file.unlink()
-                print(f"   已删除: {cache_file.name}")
-            except Exception as e:
-                print(f"   删除失败 {cache_file.name}: {e}")
-        
-        # 尝试删除空目录
-        try:
-            if not any(cache_dir.iterdir()):
-                cache_dir.rmdir()
-                print(f"   已删除空目录: {cache_dir}")
-        except Exception as e:
-            print(f"   删除目录失败: {e}")
-    else:
-        print("   缓存目录不存在")
-
-if __name__ == "__main__":
-    print("🚀 开始角色切换场景测试")
-    
-    try:
-        # 模拟角色切换
-        simulate_role_switching()
-        
-        # 分析缓存性能
-        analyze_cache_performance()
-        
-    finally:
-        # 清理缓存
-        cleanup_cache()
-    
-    print("\n🎉 所有测试完成！")