qwen_agent/.features/memory/decisions/2026-06-custom-embedding.md
2026-06-01 11:51:21 +08:00

23 lines
880 B
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
date: "2026-06-01"
status: adopted
topic: "custom-embedding"
impact: [memory, performance]
---
# 复用项目 embedding 模型而非 Mem0 自带 SentenceTransformer
## 背景
Mem0 默认会自行加载一个 SentenceTransformer 做 embedding。项目本身已经通过 `GlobalModelManager`
加载了 `paraphrase-multilingual-MiniLM-L12-v2`384 维)。若放任 Mem0 自加载,会出现同一模型在内存中加载两份,浪费显存/内存。
## 决策
`agent/mem0_manager.py` 实现 `CustomMem0Embedding`,把 Mem0 的 embedder 接到项目已加载的全局模型上,复用同一份权重。
## 影响
- 内存占用显著下降(不重复加载模型)。
- embedding 维度固定为 384与项目主模型一致换模型时 pgvector 列维度必须同步调整。
## 备注
相关连接池/实例缓存策略见 [[2026-06-connection-pool]]。