qwen_agent/.features/memory/decisions/2026-06-custom-embedding.md
2026-06-01 11:51:21 +08:00

880 B
Raw Blame History

date status topic impact
2026-06-01 adopted custom-embedding
memory
performance

复用项目 embedding 模型而非 Mem0 自带 SentenceTransformer

背景

Mem0 默认会自行加载一个 SentenceTransformer 做 embedding。项目本身已经通过 GlobalModelManager 加载了 paraphrase-multilingual-MiniLM-L12-v2384 维)。若放任 Mem0 自加载,会出现同一模型在内存中加载两份,浪费显存/内存。

决策

agent/mem0_manager.py 实现 CustomMem0Embedding,把 Mem0 的 embedder 接到项目已加载的全局模型上,复用同一份权重。

影响

  • 内存占用显著下降(不重复加载模型)。
  • embedding 维度固定为 384与项目主模型一致换模型时 pgvector 列维度必须同步调整。

备注

相关连接池/实例缓存策略见 2026-06-connection-pool