23 lines
880 B
Markdown
23 lines
880 B
Markdown
---
|
||
date: "2026-06-01"
|
||
status: adopted
|
||
topic: "custom-embedding"
|
||
impact: [memory, performance]
|
||
---
|
||
|
||
# 复用项目 embedding 模型而非 Mem0 自带 SentenceTransformer
|
||
|
||
## 背景
|
||
Mem0 默认会自行加载一个 SentenceTransformer 做 embedding。项目本身已经通过 `GlobalModelManager`
|
||
加载了 `paraphrase-multilingual-MiniLM-L12-v2`(384 维)。若放任 Mem0 自加载,会出现同一模型在内存中加载两份,浪费显存/内存。
|
||
|
||
## 决策
|
||
在 `agent/mem0_manager.py` 实现 `CustomMem0Embedding`,把 Mem0 的 embedder 接到项目已加载的全局模型上,复用同一份权重。
|
||
|
||
## 影响
|
||
- 内存占用显著下降(不重复加载模型)。
|
||
- embedding 维度固定为 384,与项目主模型一致;换模型时 pgvector 列维度必须同步调整。
|
||
|
||
## 备注
|
||
相关连接池/实例缓存策略见 [[2026-06-connection-pool]]。
|