199 lines
6.8 KiB
Markdown
199 lines
6.8 KiB
Markdown
---
|
||
name: iterative-retrieval
|
||
description: 逐步優化內容擷取的模式,旨在解決子 Agent (Subagent) 的上下文 (Context) 缺失問題。
|
||
---
|
||
|
||
# 疊代擷取模式 (Iterative Retrieval Pattern)
|
||
|
||
用於解決多 Agent 工作流中的「上下文問題」— 即子 Agent 在開始工作前,往往不知道自己具體需要哪些上下文資訊。
|
||
|
||
## 何時啟用
|
||
|
||
- 當啟動子 Agent 時,它們需要事前無法預知的程式碼庫上下文。
|
||
- 建構需要逐步優化上下文的廣泛多 Agent 工作流。
|
||
- Agent 任務中遇到「內容過載 (Context too large)」或「缺少上下文 (Missing context)」的失敗情況。
|
||
- 為程式碼探索設計類 RAG (檢索增強生成) 的擷取流水線。
|
||
- 在 Agent 編排中優化 Token 使用量。
|
||
|
||
## 問題所在
|
||
|
||
子 Agent 啟動時僅具備有限的上下文。它們通常不知道:
|
||
- 哪些檔案包含相關程式碼。
|
||
- 程式碼庫中存在哪些既定模式。
|
||
- 專案使用了哪些特定術語。
|
||
|
||
標準做法通常會失敗:
|
||
- **發送全部內容**:超出上下文限制。
|
||
- **什麼都不發送**:Agent 缺少關鍵資訊。
|
||
- **猜測需求**:往往猜錯。
|
||
|
||
## 解決方案:疊代擷取 (Iterative Retrieval)
|
||
|
||
一個分為 4 階段的迴圈,用於逐步精煉上下文:
|
||
|
||
```
|
||
┌─────────────────────────────────────────────┐
|
||
│ │
|
||
│ ┌──────────┐ ┌──────────┐ │
|
||
│ │ 派發 │─────▶│ 評估 │ │
|
||
│ └──────────┘ └──────────┘ │
|
||
│ ▲ │ │
|
||
│ │ ▼ │
|
||
│ ┌──────────┐ ┌──────────┐ │
|
||
│ │ 迴圈 │◀─────│ 精煉 │ │
|
||
│ └──────────┘ └──────────┘ │
|
||
│ │
|
||
│ 最多 3 個週期,隨後繼續執行 │
|
||
└─────────────────────────────────────────────┘
|
||
```
|
||
|
||
### 階段 1:派發 (DISPATCH)
|
||
|
||
初始階段:執行廣泛查詢以蒐集候選檔案。
|
||
|
||
```javascript
|
||
// 從高階意圖開始
|
||
const initialQuery = {
|
||
patterns: ['src/**/*.ts', 'lib/**/*.ts'],
|
||
keywords: ['authentication', 'user', 'session'],
|
||
excludes: ['*.test.ts', '*.spec.ts']
|
||
};
|
||
|
||
// 派發給擷取 Agent
|
||
const candidates = await retrieveFiles(initialQuery);
|
||
```
|
||
|
||
### 階段 2:評估 (EVALUATE)
|
||
|
||
評估所擷取內容的相關性:
|
||
|
||
```javascript
|
||
function evaluateRelevance(files, task) {
|
||
return files.map(file => ({
|
||
path: file.path,
|
||
relevance: scoreRelevance(file.content, task),
|
||
reason: explainRelevance(file.content, task),
|
||
missingContext: identifyGaps(file.content, task)
|
||
}));
|
||
}
|
||
```
|
||
|
||
評分標準:
|
||
- **高 (0.8-1.0)**:直接實作了目標功能。
|
||
- **中 (0.5-0.7)**:包含相關的模式或型別定義。
|
||
- **低 (0.2-0.4)**:僅有些微關聯。
|
||
- **無 (0-0.2)**:不相關,應排除。
|
||
|
||
### 階段 3:精煉 (REFINE)
|
||
|
||
根據評估結果更新搜尋準則:
|
||
|
||
```javascript
|
||
function refineQuery(evaluation, previousQuery) {
|
||
return {
|
||
// 加入在高度相關檔案中發現的新模式
|
||
patterns: [...previousQuery.patterns, ...extractPatterns(evaluation)],
|
||
|
||
// 加入程式碼庫中使用的術語
|
||
keywords: [...previousQuery.keywords, ...extractKeywords(evaluation)],
|
||
|
||
// 排除已確認不相關的路徑
|
||
excludes: [...previousQuery.excludes, ...evaluation
|
||
.filter(e => e.relevance < 0.2)
|
||
.map(e => e.path)
|
||
],
|
||
|
||
// 針對特定的資訊缺口
|
||
focusAreas: evaluation
|
||
.flatMap(e => e.missingContext)
|
||
.filter(unique)
|
||
};
|
||
}
|
||
```
|
||
|
||
### 階段 4:迴圈 (LOOP)
|
||
|
||
使用精煉後的準則重複執行(最多 3 次週期):
|
||
|
||
```javascript
|
||
async function iterativeRetrieve(task, maxCycles = 3) {
|
||
let query = createInitialQuery(task);
|
||
let bestContext = [];
|
||
|
||
for (let cycle = 0; cycle < maxCycles; cycle++) {
|
||
const candidates = await retrieveFiles(query);
|
||
const evaluation = evaluateRelevance(candidates, task);
|
||
|
||
// 檢查是否有足夠的上下文
|
||
const highRelevance = evaluation.filter(e => e.relevance >= 0.7);
|
||
if (highRelevance.length >= 3 && !hasCriticalGaps(evaluation)) {
|
||
return highRelevance;
|
||
}
|
||
|
||
// 精煉並繼續
|
||
query = refineQuery(evaluation, query);
|
||
bestContext = mergeContext(bestContext, highRelevance);
|
||
}
|
||
|
||
return bestContext;
|
||
}
|
||
```
|
||
|
||
## 實戰範例
|
||
|
||
### 範例 1:除錯任務的上下文
|
||
任務:「修復身份驗證權杖 (Auth Token) 過期的錯誤」
|
||
|
||
週期 1:
|
||
- **派發**:在 `src/**` 中搜尋 "token", "auth", "expiry"。
|
||
- **評估**:發現 `auth.ts` (0.9), `tokens.ts` (0.8), `user.ts` (0.3)。
|
||
- **精煉**:加入關鍵字 "refresh", "jwt";排除 `user.ts`。
|
||
|
||
週期 2:
|
||
- **派發**:搜尋精煉後的詞彙。
|
||
- **評估**:發現 `session-manager.ts` (0.95), `jwt-utils.ts` (0.85)。
|
||
- **精煉**:上下文已足夠。
|
||
|
||
結果:`auth.ts`, `tokens.ts`, `session-manager.ts`, `jwt-utils.ts`
|
||
|
||
### 範例 2:功能實作
|
||
任務:「為 API 端點加入速率限制 (Rate Limiting)」
|
||
|
||
週期 1:
|
||
- **派發**:在 `routes/**` 中搜尋 "rate", "limit", "api"。
|
||
- **評估**:無相符結果 — 程式碼庫使用的是 "throttle" 術語。
|
||
- **精煉**:加入關鍵字 "throttle", "middleware"。
|
||
|
||
週期 2:
|
||
- **派發**:搜尋精煉後的詞彙。
|
||
- **評估**:發現 `throttle.ts` (0.9), `middleware/index.ts` (0.7)。
|
||
- **精煉**:還需要路由模式。
|
||
|
||
週期 3:
|
||
- **派發**:搜尋 "router", "express" 相關模式。
|
||
- **評估**:發現 `router-setup.ts` (0.8)。
|
||
- **精煉**:上下文已足夠。
|
||
|
||
結果:`throttle.ts`, `middleware/index.ts`, `router-setup.ts`
|
||
|
||
## 整合至 Agent
|
||
|
||
可以在 Agent 提示詞中使用此邏輯:
|
||
|
||
```markdown
|
||
在為此任務擷取上下文時:
|
||
1. 從廣泛的關鍵字搜尋開始。
|
||
2. 評估每個檔案的相關性 (0-1 評分)。
|
||
3. 識別仍缺失的上下文內容。
|
||
4. 精煉搜尋準則並重複執行 (最多 3 次週期)。
|
||
5. 回傳相關性評分 >= 0.7 的檔案內容。
|
||
```
|
||
|
||
## 最佳實踐
|
||
|
||
1. **先廣後窄** — 初次查詢不要過於具體。
|
||
2. **學習程式碼庫術語** — 第一個週期通常會揭示專案的命名慣例。
|
||
3. **追蹤缺失內容** — 明確識別資訊缺口是驅動精煉的關鍵。
|
||
4. **「夠好」即停** — 3 個高度相關的檔案優於 10 個平庸的檔案。
|
||
5. **果斷排除** — 相關性低的檔案通常在後續週期也不會變為相關。
|