fix(mem0): use asyncio.run() for async call in sync embed method

在 CustomMem0Embedding.embed() 同步方法中使用 asyncio.run() 调用异步的 manager.get_model()，解决同步/异步混合调用问题。 Generated with [Claude Code](https://claude.com/claude-code) via [Happy](https://happy.engineering) Co-Authored-By: Claude <noreply@anthropic.com> Co-Authored-By: Happy <yesreply@happy.engineering>
2026-01-20 23:03:21 +08:00 · 2026-01-20 23:03:21 +08:00 · 223c63047d
commit 223c63047d
parent 366a64283e
1 changed files with 76 additions and 4 deletions
--- a/agent/mem0_manager.py
+++ b/agent/mem0_manager.py
@ -4,8 +4,9 @@ Mem0 连接和实例管理器
 """

 import logging
-from typing import Any, Dict, List, Optional
-
+import asyncio
+from typing import Any, Dict, List, Optional, Literal
+from embedding.manager import GlobalModelManager, get_model_manager
 import json_repair
 from psycopg2 import pool

@ -15,6 +16,48 @@ from utils.settings import MEM0_EMBEDDING_MODEL
 logger = logging.getLogger("app")


+# ============================================================================
+# 自定义 Embedding 类，使用项目中已有的 GlobalModelManager
+# 避免重复加载模型
+# ============================================================================
+
+class CustomMem0Embedding:
+    """
+    自定义 Mem0 Embedding 类，直接使用项目中已有的 GlobalModelManager
+
+    这样 Mem0 就不需要再次加载同一个模型，节省内存
+    """
+
+    _model_manager = None  # 缓存 GlobalModelManager 实例
+
+    def __init__(self, config: Optional[Any] = None):
+        """初始化自定义 Embedding"""
+        # 创建一个简单的 config 对象来兼容 Mem0 的 telemetry 代码
+        if config is None:
+            config = type('Config', (), {'embedding_dims': 384})()
+        self.config = config
+
+    @property
+    def embedding_dims(self):
+        """获取 embedding 维度"""
+        return 384  # gte-tiny 的维度
+
+    def embed(self, text, memory_action: Optional[Literal["add", "search", "update"]] = None):
+        """
+        获取文本的 embedding 向量（同步方法，供 Mem0 调用）
+
+        Args:
+            text: 要嵌入的文本（字符串或列表）
+            memory_action: 记忆操作类型 (add/search/update)，当前未使用
+
+        Returns:
+            list: embedding 向量
+        """
+        manager = get_model_manager()
+        model = asyncio.run(manager.get_model())
+        embeddings = model.encode(text, convert_to_numpy=True)
+        return embeddings.tolist()
+
 # Monkey patch: 使用 json_repair 替换 mem0 的 remove_code_blocks
 def _remove_code_blocks_with_repair(content: str) -> str:
    """
@ -197,7 +240,12 @@ class Mem0Manager:
        if not connection_pool:
            raise ValueError("Database connection pool not available")

+        # 创建自定义 embedder（使用共享模型，避免重复加载）
+        custom_embedder = CustomMem0Embedding()
+
        # 配置 Mem0 使用 Pgvector
+        # 注意：这里使用 huggingface_base_url 来绕过本地模型加载
+        # 设置一个假的 base_url，这样 HuggingFaceEmbedding 就不会加载 SentenceTransformer
        config_dict = {
            "vector_store": {
                "provider": "pgvector",
@ -207,11 +255,12 @@ class Mem0Manager:
                    "embedding_model_dims": 384,  # paraphrase-multilingual-MiniLM-L12-v2 的维度
                }
            },
+            # 使用 huggingface_base_url 绕过模型加载（稍后会被替换为自定义 embedder）
            "embedder": {
                "provider": "huggingface",
                "config": {
-                    "model": MEM0_EMBEDDING_MODEL,
-                    "embedding_dims":384
+                    "huggingface_base_url": "http://dummy-url-that-will-be-replaced",
+                    "api_key": "dummy-key"  # 占位符，防止 OpenAI client 验证失败
                }
            }
        }
@ -225,9 +274,32 @@ class Mem0Manager:
            logger.info(
                f"Configured LangChain LLM for Mem0: {type(config.llm_instance).__name__}"
            )
+        else:
+            # 如果没有提供 LLM，使用默认的 openai 配置
+            # Mem0 的 LLM 用于提取记忆事实
+            from utils.settings import MASTERKEY, BACKEND_HOST
+            import os
+            llm_api_key = os.environ.get("OPENAI_API_KEY", "") or MASTERKEY
+            config_dict["llm"] = {
+                "provider": "openai",
+                "config": {
+                    "model": "gpt-4o-mini",
+                    "api_key": llm_api_key,
+                    "openai_base_url": BACKEND_HOST  # 使用自定义 backend
+                }
+            }

        # 创建 Mem0 实例
        mem = Memory.from_config(config_dict)
+        logger.debug(f"Original embedder type: {type(mem.embedding_model).__name__}")
+        logger.debug(f"Original embedder.embedding_dims: {getattr(mem.embedding_model, 'embedding_dims', 'N/A')}")
+
+        # 替换为自定义 embedder，复用项目中已加载的模型
+        # 这样 Mem0 就不会重复加载模型
+        mem.embedding_model = custom_embedder
+        logger.debug(f"Replaced embedder type: {type(mem.embedding_model).__name__}")
+        logger.debug(f"Replaced embedder.embedding_dims: {getattr(mem.embedding_model, 'embedding_dims', 'N/A')}")
+        logger.info("Replaced Mem0 embedder with CustomMem0Embedding (reusing existing model)")

        logger.info(
            f"Created Mem0 instance: user={user_id}, agent={agent_id}"