6.8 KiB
6.8 KiB
| name | description |
|---|---|
| iterative-retrieval | 逐步優化內容擷取的模式,旨在解決子 Agent (Subagent) 的上下文 (Context) 缺失問題。 |
疊代擷取模式 (Iterative Retrieval Pattern)
用於解決多 Agent 工作流中的「上下文問題」— 即子 Agent 在開始工作前,往往不知道自己具體需要哪些上下文資訊。
何時啟用
- 當啟動子 Agent 時,它們需要事前無法預知的程式碼庫上下文。
- 建構需要逐步優化上下文的廣泛多 Agent 工作流。
- Agent 任務中遇到「內容過載 (Context too large)」或「缺少上下文 (Missing context)」的失敗情況。
- 為程式碼探索設計類 RAG (檢索增強生成) 的擷取流水線。
- 在 Agent 編排中優化 Token 使用量。
問題所在
子 Agent 啟動時僅具備有限的上下文。它們通常不知道:
- 哪些檔案包含相關程式碼。
- 程式碼庫中存在哪些既定模式。
- 專案使用了哪些特定術語。
標準做法通常會失敗:
- 發送全部內容:超出上下文限制。
- 什麼都不發送:Agent 缺少關鍵資訊。
- 猜測需求:往往猜錯。
解決方案:疊代擷取 (Iterative Retrieval)
一個分為 4 階段的迴圈,用於逐步精煉上下文:
┌─────────────────────────────────────────────┐
│ │
│ ┌──────────┐ ┌──────────┐ │
│ │ 派發 │─────▶│ 評估 │ │
│ └──────────┘ └──────────┘ │
│ ▲ │ │
│ │ ▼ │
│ ┌──────────┐ ┌──────────┐ │
│ │ 迴圈 │◀─────│ 精煉 │ │
│ └──────────┘ └──────────┘ │
│ │
│ 最多 3 個週期,隨後繼續執行 │
└─────────────────────────────────────────────┘
階段 1:派發 (DISPATCH)
初始階段:執行廣泛查詢以蒐集候選檔案。
// 從高階意圖開始
const initialQuery = {
patterns: ['src/**/*.ts', 'lib/**/*.ts'],
keywords: ['authentication', 'user', 'session'],
excludes: ['*.test.ts', '*.spec.ts']
};
// 派發給擷取 Agent
const candidates = await retrieveFiles(initialQuery);
階段 2:評估 (EVALUATE)
評估所擷取內容的相關性:
function evaluateRelevance(files, task) {
return files.map(file => ({
path: file.path,
relevance: scoreRelevance(file.content, task),
reason: explainRelevance(file.content, task),
missingContext: identifyGaps(file.content, task)
}));
}
評分標準:
- 高 (0.8-1.0):直接實作了目標功能。
- 中 (0.5-0.7):包含相關的模式或型別定義。
- 低 (0.2-0.4):僅有些微關聯。
- 無 (0-0.2):不相關,應排除。
階段 3:精煉 (REFINE)
根據評估結果更新搜尋準則:
function refineQuery(evaluation, previousQuery) {
return {
// 加入在高度相關檔案中發現的新模式
patterns: [...previousQuery.patterns, ...extractPatterns(evaluation)],
// 加入程式碼庫中使用的術語
keywords: [...previousQuery.keywords, ...extractKeywords(evaluation)],
// 排除已確認不相關的路徑
excludes: [...previousQuery.excludes, ...evaluation
.filter(e => e.relevance < 0.2)
.map(e => e.path)
],
// 針對特定的資訊缺口
focusAreas: evaluation
.flatMap(e => e.missingContext)
.filter(unique)
};
}
階段 4:迴圈 (LOOP)
使用精煉後的準則重複執行(最多 3 次週期):
async function iterativeRetrieve(task, maxCycles = 3) {
let query = createInitialQuery(task);
let bestContext = [];
for (let cycle = 0; cycle < maxCycles; cycle++) {
const candidates = await retrieveFiles(query);
const evaluation = evaluateRelevance(candidates, task);
// 檢查是否有足夠的上下文
const highRelevance = evaluation.filter(e => e.relevance >= 0.7);
if (highRelevance.length >= 3 && !hasCriticalGaps(evaluation)) {
return highRelevance;
}
// 精煉並繼續
query = refineQuery(evaluation, query);
bestContext = mergeContext(bestContext, highRelevance);
}
return bestContext;
}
實戰範例
範例 1:除錯任務的上下文
任務:「修復身份驗證權杖 (Auth Token) 過期的錯誤」
週期 1:
- 派發:在
src/**中搜尋 "token", "auth", "expiry"。 - 評估:發現
auth.ts(0.9),tokens.ts(0.8),user.ts(0.3)。 - 精煉:加入關鍵字 "refresh", "jwt";排除
user.ts。
週期 2:
- 派發:搜尋精煉後的詞彙。
- 評估:發現
session-manager.ts(0.95),jwt-utils.ts(0.85)。 - 精煉:上下文已足夠。
結果:auth.ts, tokens.ts, session-manager.ts, jwt-utils.ts
範例 2:功能實作
任務:「為 API 端點加入速率限制 (Rate Limiting)」
週期 1:
- 派發:在
routes/**中搜尋 "rate", "limit", "api"。 - 評估:無相符結果 — 程式碼庫使用的是 "throttle" 術語。
- 精煉:加入關鍵字 "throttle", "middleware"。
週期 2:
- 派發:搜尋精煉後的詞彙。
- 評估:發現
throttle.ts(0.9),middleware/index.ts(0.7)。 - 精煉:還需要路由模式。
週期 3:
- 派發:搜尋 "router", "express" 相關模式。
- 評估:發現
router-setup.ts(0.8)。 - 精煉:上下文已足夠。
結果:throttle.ts, middleware/index.ts, router-setup.ts
整合至 Agent
可以在 Agent 提示詞中使用此邏輯:
在為此任務擷取上下文時:
1. 從廣泛的關鍵字搜尋開始。
2. 評估每個檔案的相關性 (0-1 評分)。
3. 識別仍缺失的上下文內容。
4. 精煉搜尋準則並重複執行 (最多 3 次週期)。
5. 回傳相關性評分 >= 0.7 的檔案內容。
最佳實踐
- 先廣後窄 — 初次查詢不要過於具體。
- 學習程式碼庫術語 — 第一個週期通常會揭示專案的命名慣例。
- 追蹤缺失內容 — 明確識別資訊缺口是驅動精煉的關鍵。
- 「夠好」即停 — 3 個高度相關的檔案優於 10 個平庸的檔案。
- 果斷排除 — 相關性低的檔案通常在後續週期也不會變為相關。