
https://i.urusai.cc/LCW4K.jpg
# AI Coding 工具生態深度盤點 — 專案報告 v2
> **版本**:v2.6 / 2026-05-02
> **資料截止**:2026-05-02(本次針對模型 / Agent / MCP / 採購結論做官方來源抽樣核驗;價格與配額仍需採購前逐頁確認)
> **更新說明**:
> - v2.6 深化 5.10 GitHub Copilot:補入「形式」三重身份標註、「外部工具 / 擴充生態」(Copilot Extensions / Skillsets / MCP / Spaces / Custom Instructions)與「限制」段落
> - v2.5 修正 4 處錯置:(1) 第 6.1 Routing 表 4 個過時模型對應(GPT-4o / o3 / Gemini 2.5 Pro / Gemini Thinking)→ GPT-5.x / Gemini 3.x;(2) 第 6.4 Fallback 策略 GPT-4o → GPT-5.4;(3) 第 16.4 AnythingLLM 加註「自架 RAG 平台,非筆記 app」;(4) 第 5 章開頭新增「形式對照表」,呼應 v2.4 第 1 章四分法
> - v2.4 補入「AI 形式四分法」維度(獨立 app / 焊死進 IDE / 外掛塞進別人 app / 雲端服務);修正原表把 Cursor (焊死) 和 Cline / Aider (外掛) 混在同一類的錯誤歸類
> - v2.3 增補 Google Gemini 3.1 Pro 2M context 規格、Gemini CLI 原生運作機制與混合雲採購路徑
> **用途**:對外簡報 / 採購評估
> **標記體系**(內審用,定稿可移除):
> - **[事實]** = 直接讀過 / 驗證過
> - **[推論]** = 沒驗證但有外部 source(必附驗證方法)
> - **[猜測]** = 純推估(必附驗證方法)
> - **[做了]** = 動作完成 / **[等待回應]** = 等決策 / **[過時]** = 標的已不適用
---
## 目錄
1. Executive Summary
2. 6 層市場架構
3. 平台支援矩陣
4. 模型層深度比較
5. Coding Agent 平台深度檔案
6. 多模型策略
7. MCP 協議深度解析
8. Computer Use 深度解析
9. 專業軟體整合
10. 計費 / TCO 模型
11. 安全與合規
12. 採購決策框架
13. 風險矩陣
14. Roadmap 信號
15. 三家原廠生態系全圖(Anthropic / OpenAI / Google)
16. 知識管理 / 筆記 AI 工具(Obsidian 等)
- 附錄 A. 標記體系說明
- 附錄 B. 驗證方法清單
- 附錄 C. 名詞 / 縮寫表
- 附錄 D. 參考資料
- 附錄 E. 用戶環境啟用狀態(內部用,呈報前移除)
---
## 1. Executive Summary(TL;DR)
**[事實]** AI 寫程式 / AI 助理工具按 **「產品類別」** 維度分(這工具做什麼?):
| 大類 | 形式 | 典型產品 |
|---|---|---|
| **聊天助理** | Web / 桌面 / 手機 | Claude.ai, ChatGPT, Gemini |
| **Coding Agent**(原廠) | CLI / 桌面 / Web / IDE 擴充 | Claude Code, OpenAI Codex CLI, Gemini CLI, Jules |
| **第三方 AI IDE**(焊死型)| fork VS Code 把 AI 焊死進去,拆不掉 | Cursor, Windsurf |
| **AI 編程外掛**(外掛型)| 主編輯器(VS Code / JetBrains 等)本來沒 AI,外掛塞進去才有 | **GitHub Copilot**, Cline, Continue, Aider |
| **自主 Agent / Computer Use** | 雲端 / 本地 agent | OpenHands, Devin, Manus, OpenAI Operator |
| **API / SDK** | REST / 套件 | Anthropic API, OpenAI API, Google AI |
**[事實]** 換維度按 **「AI 形式」**(AI 怎麼進到你電腦?)看,可分 4 種裝載形式(同一產品可能跨多形式):
| AI 形式 | 跟主 app 的關係 | 例子 |
|---|---|---|
| **1. 獨立 app**(AI 自己就是 app) | 打開直接是 AI,不寄生在別人身上 | Claude.ai 網頁、Claude Desktop、**Claude Code CLI**、ChatGPT、**Gemini CLI**、Codex CLI |
| **2. 焊死進整套 IDE**(一體成型) | 主 app 出廠就含 AI,拆不掉 | **Cursor**、Windsurf |
| **3. 外掛塞進別人 app**(外掛型) | 主 app 本來沒 AI,後裝外掛才有 | VS Code / JetBrains + **GitHub Copilot**、VS Code + Cline / Continue / Aider、Obsidian + Copilot for Obsidian |
| **4. 雲端服務 / API**(不在你電腦) | 透過瀏覽器、雲端 VM 或自己寫程式呼叫 API | Jules、Devin、Manus、Operator、Copilot cloud agent、Anthropic / OpenAI / Google API |
**為什麼要兩個維度看**:
- 「**產品類別**」回答:**這工具做什麼?**(聊天 / 寫程式 / 自主跑任務 / API)
- 「**AI 形式**」回答:**我電腦上要怎麼裝、怎麼用?**(獨立 app / 焊死 / 外掛 / 雲端)
許多產品**跨多形式**:例如 GitHub Copilot = Coding Agent(類別)+ 外掛(形式)+ 雲端 agent(部分功能)三重身份;Claude Code 同時有獨立 CLI 形式、VS Code 外掛形式、Web 雲端形式。
**[事實]** AI coding 工具市場在 2024–2026 經歷三個結構性變化:
1. **協議標準化**:MCP(Model Context Protocol)2024-11 由 Anthropic 開放;2025 後 ChatGPT / Cursor / Gemini / Microsoft Copilot / VS Code 等已採用或整合,且 MCP 已移交 Linux Foundation 旗下 Agentic AI Foundation(AAIF)治理
2. **Agent 化**:從「補完式 Copilot」轉向「自主 Agent」(Claude Code、Codex、Gemini CLI、Cursor Agent、Windsurf Cascade、Copilot cloud agent、OpenHands)
3. **多模型 Routing**:第三方 IDE 普遍支援 4+ 家 LLM;原廠工具仍以自家模型為主,但企業架構層面已很難只押單一供應商
**關鍵數據**(**[推論]** 業界普遍引用,**驗證方法**:搜「SWE-bench Verified leaderboard 2026」與各家官網):
| 指標 | 2023 | 2026 |
|---|---|---|
| 頂級模型 SWE-bench Verified | ~10–20% | **70–80%+**(Claude Opus 4.x / GPT-5.x 級,需看當期 leaderboard)|
| 主流 context window | 8k–32k | **200k 起,1M-2M 成為旗艦級規格**(Gemini 3.1 Pro 已達 2M tokens)|
| MCP server 數量 | 0 | **10,000+ active public MCP servers**(Anthropic 2025-12 官方說法,仍需核驗口徑)|
| Agent 自主完成 PR 比例 | <5% | **無統一公開指標**;簡單 issue 可顯著提升,但正式採購不應用固定百分比承諾 |
**核心結論**:
1. **原廠工具以自家模型為核心**(Claude Code → Claude;Codex → OpenAI GPT/Codex 系;Gemini CLI → Gemini);**第三方工具**普遍支援 Claude / GPT / Gemini / OpenRouter / 本地模型
2. **手機端主要支援聊天與雲端任務查看**;本地 repo 編輯、測試、MCP、shell 權限仍以桌面 / IDE / CLI / 雲端 runner 為主
3. **MCP 協議** 是 2025–2026 最大變革,但「控制 Adobe / Unity / Blender」多屬社群 MCP 或腳本橋接,成熟度要逐項驗證
4. **混合模型工作流**(雙 agent 互審、多模型製圖管線、**Claude 推理+Gemini 掃描**)成為頭部團隊新常態
5. **採購已不只「買哪個工具」,而是「組哪一條 stack」**:模型層 + Agent 平台層 + MCP 擴充層 + 觀測層
---
## 2. 6 層市場架構
**[事實]** 從技術棧角度,AI coding 生態可剝為 6 層,採購決策需各層獨立思考:
```
┌─────────────────────────────────────────┐
│ Layer 6: 觀測 / 治理 (LangSmith/Helicone)│
├─────────────────────────────────────────┤
│ Layer 5: 工作流編排 (n8n/Temporal/自製) │
├─────────────────────────────────────────┤
│ Layer 4: Agent / IDE 平台 │
│ ├─ 原廠: Claude Code / Codex CLI / │
│ │ Gemini CLI / Jules │
│ ├─ 第三方: Cursor / Windsurf / Cline │
│ ├─ 自主: OpenHands / Devin / Manus │
│ └─ Agent SDK: 自製 │
├─────────────────────────────────────────┤
│ Layer 3: 工具 / MCP 擴充層 │
│ ├─ 檔案/Git/通訊/雲服務/設計/3D 等 │
├─────────────────────────────────────────┤
│ Layer 2: 模型路由 (OpenRouter/Portkey) │
├─────────────────────────────────────────┤
│ Layer 1: 模型 API │
│ ├─ Anthropic / OpenAI / Google │
│ ├─ AWS Bedrock / GCP Vertex │
│ └─ 開源: Llama / Qwen / DeepSeek │
└─────────────────────────────────────────┘
```
**對採購的意涵**:
- 多數企業誤把「選工具」當作 Layer 4 一層決策;實際上 **Layer 1 + Layer 4 是兩個獨立決策**
- Layer 2(路由層)是新興必要層 — 規模 10+ 團隊應預先設計,避免後期切換成本
---
## 3. 平台支援矩陣
**[事實]** 各產品的桌面 / 手機支援:
| 產品 | Win | Mac | Linux | iOS | Android | Web |
|---|---|---|---|---|---|---|
| **Claude.ai**(聊天) | – | – | – | – | – | |
| **Claude Desktop**(聊天) | | | **[推論]**| – | – | – |
| **Claude Mobile**(聊天) | – | – | – | | | – |
| **Claude Code CLI** | | | | | | – |
| **Claude Code 桌面** | | | **[推論]**| | | – |
| **Claude Code Web** | – | – | – | (限 web) | (限 web) | |
| **VS Code 擴充**(Anthropic) | | | | | | – |
| **JetBrains 擴充**(Anthropic) | | | | | | – |
| **OpenAI Codex CLI** | | | | | | – |
| **Gemini CLI**(Google) | | | | | | – |
| **Cursor**(第三方 IDE) | | | | | | – |
| **Windsurf**(第三方 IDE) | | | | | | – |
| **Cline**(VS Code 擴充) | | | | | | – |
**驗證方法**:[推論] Linux 桌面支援 — 上各家官網 download 頁確認
**桌面 vs 手機關鍵 takeaway**:
- **Windows / Mac 桌面**:所有產品基本全可用,無重大缺項
- **iOS / Android 手機**:僅支援聊天類產品,**所有 coding agent 不支援**
- **Linux**:開源 / CLI 類完整支援;原廠桌面 app **[推論]** 多無原生版
- **跨裝置同步**:原廠帳號內同條線(聊天 / 寫 code)對話互通;不同條線**不互通**(iOS 聊天不會看到桌面 Coding Agent 對話歷史)
---
## 4. 模型層深度比較(Layer 1)
### 4.1 Anthropic Claude 系列
**[事實]** 公開官方線(2026-05-02 抽樣核驗;採購前仍以 claude.com/pricing 與 Claude docs 為準):
| 模型 | Model ID | Context | Output | 推理模式 |
|---|---|---|---|---|
| Claude Opus 4.7 | `claude-opus-4-7` | **1M tokens**(官方稱旗艦 / coding / agents) | 依 API 限制 | Extended Thinking |
| Claude Sonnet 4.6 | `claude-sonnet-4-6` | **1M tokens beta**(API)| 依 API 限制 | Extended Thinking |
| Claude Haiku 4.5 | `claude-haiku-4-5` | 依 API 限制 | 依 API 限制 | 輕量 / 速度 |
**[事實]** 計費(claude.com/pricing,USD / MTok):
| 模型 | Input ($/MTok) | Output ($/MTok) | Cache 寫入 | Cache 讀取 |
|---|---|---|---|---|
| Opus 4.7 | $5 | $25 | $6.25 | $0.50 |
| Sonnet 4.6 | $3 | $15 | $3.75 | $0.30 |
| Haiku 4.5 | $1 | $5 | $1.25 | $0.10 |
**關鍵特性**:
- **Prompt Caching**(**[事實]** Anthropic 文件):5-min TTL,cache hit 讀取費降 **90%**
- **Extended Thinking**:可指定推理 token budget,複雜任務可達 64k+ thinking tokens
- **Tool Use 並行**:單次回應可發起多個 tool calls
### 4.2 OpenAI GPT 系列(更新至 2026-05)
**[事實]/[推論]**(**驗證方法**:developers.openai.com/api/docs/models + openai.com/api/pricing;不同帳戶 rollout 可能不同):
| 模型 | Context / Output | 強項 | 計費 |
|---|---|---|---|
| **GPT-5.5** | 1M / 128k | 最新旗艦;複雜 reasoning、agentic coding、professional work | $5 input / $30 output |
| **GPT-5.5 Pro** | **[推論]** 同系 | 最高準確度 / 高難度推理 | $30 input / $180 output(API rollout 需確認)|
| **GPT-5.4** | **[推論]** 400k–1M | 成本較低的旗艦級工作模型 | $2.5 input / $15 output |
| **GPT-5.4 mini** | **[推論]** 400k 級 | coding / computer use / subagents 的成本平衡 | $0.75 input / $4.5 output |
| **GPT-5.4 nano** | **[推論]** 128k+ | 高吞吐 / 低延遲 / batch | $0.10 級以下需查 pricing |
| **GPT-5.2-Codex** | 400k / 128k | Codex / agentic coding 優化 | $1.75 input / $14 output |
| GPT-5、GPT-4.1、4o | 依模型 | legacy / 過渡 | 新採購不建議作基準 |
**關鍵特性**:
- **Reasoning effort**:GPT-5.x 系列可調 reasoning effort;成本和 latency 需按任務類型測
- **Predicted Outputs**:預測輸出加速,編輯任務 latency 降 30–50%
- **Prompt Caching**:快取輸入通常較標準輸入便宜,具體折扣按模型定價表
- **Codex**:已不只是 CLI;官方 docs 有 CLI / IDE extension / Web / App / GitHub Action / MCP / hooks / skills / subagents 等線
- **Agents SDK / Agent Builder / Apps SDK**:OpenAI 自製 agent 與 ChatGPT app 生態的核心入口
- **Realtime API**:低延遲語音/即時對話
- **MCP / Connectors**:Responses API 支援 remote MCP servers 與 OpenAI 維護的 connectors(Gmail、Drive、Dropbox、SharePoint 等)
### 4.3 Google Gemini 系列(更新至 2026-05)
**[事實]/[推論]**(**驗證方法**:ai.google.dev/gemini-api/docs/gemini-3 + models 頁;3.x 多為 preview):
| 模型 | Context / Output | 強項 |
|---|---|---|
| **Gemini 3.1 Pro Preview** | **2M / 64k** | 複雜 reasoning、多模態、2.1M token 巨量 Context、agentic / coding |
| **Gemini 3 Flash Preview** | 1M / 64k | Pro 級智能 + Flash 成本 / 速度 |
| **Gemini 3.1 Flash-Lite Preview** | 1M / 64k | 高吞吐、成本效率(1/10 Sonnet 成本級別) |
| Gemini 2.5 Pro / Flash / Flash-Lite | 1M+ | 生產可用性通常比 3.x preview 穩,需看當期模型頁 |
| **Nano Banana** | 圖像 | Gemini 2.5 Flash Image,低延遲圖像生成 / 編輯 |
| **Nano Banana Pro** | 圖像 | Gemini 3 Pro Image Preview,高品質文字渲染 / 專業素材 |
| **Nano Banana 2** | 圖像 | Gemini 3.1 Flash Image Preview,高效率 / 低價位圖像線 |
| **Veo 3.x** | 影片 | 文字 / 圖像 → 影片,價格與可用區域需逐項查 |
**關鍵特性**:
- **超大 context (2M)** — Gemini 3.1 Pro 在 Vertex AI/AI Studio 已開放 2.1M tokens,適合跨多個微服務 Repo 進行全局重構。
- **Linear Attention 優化** — 底層技術確保在 1M+ token時的檢索準確率(Needle In A Haystack)仍接近 100%。
- **多模態原生應用** —
- **影片 Bug 定位**:直接讀取「復現螢幕錄影」,自動匹配 Console Log 執行 Root Cause 分析。
- **Nano Banana 2 參考圖模式**:從 UI 原型截圖直接產出 Tailwind/CSS 佈局代碼。
- **計費最低候選** — Flash-Lite 為大規模索引(Indexing)與基礎 Linting 任務的首選。
- **Workspace 整合** — Docs / Sheets / Slides / Gmail 內 Gemini 嵌入。
- **Preview caveat** — 3.x preview 模型適合試點;嚴格 SLA / 回歸穩定性需用固定 model version。
### 4.3.1 Nano Banana 詳細(2026-05 最新)
**[事實]** Google 文件已將 Nano Banana 作為 Gemini 原生圖像生成 / 編輯能力的產品命名使用,不再稱之為社群綽號。
**版本演進**(**驗證方法**:ai.google.dev/gemini-api/docs/nanobanana):
| 版本 | 別名 | 特性 |
|---|---|---|
| Nano Banana | Gemini 2.5 Flash Image | 快速、便宜、適合大量圖像生成 / 編輯 |
| Nano Banana Pro | Gemini 3 Pro Image Preview | 專業素材、複雜指令、文字渲染更強 |
| Nano Banana 2 | Gemini 3.1 Flash Image Preview | 高效率、低價位、適合高吞吐圖片工作流 |
**對標**:
- OpenAI **GPT-Image-1** — 高解析、文字渲染強
- Black Forest Labs **Flux Kontext** — 開源編輯模型
- Adobe **Firefly** — 設計生態整合
### 4.4 Benchmark 對照
**驗證方法**:上 https://www.swebench.com / Aider leaderboard / LMArena 看當前排行
| 模型 | SWE-bench Verified | Aider Polyglot | LMArena Coding |
|---|---|---|---|
| Claude Opus 4.7 | **[推論]** 第一梯隊 | **[推論]** 第一梯隊 | top tier |
| GPT-5.5 / GPT-5.2-Codex | **[推論]** 第一梯隊 | **[推論]** 第一梯隊 | top tier |
| Gemini 3.1 Pro Preview | **[推論]** 第一梯隊 / preview | **[推論]** 需看當期榜 | top tier |
| 開源(Qwen / DeepSeek) | **[推論]** 40–60% | **[推論]** 50–65% | mid-tier |
**[推論]** 結論:頂級閉源模型在 coding benchmark 上仍快速輪替;簡報不宜寫死單一百分比,正式採購應以當週 SWE-bench / Aider / LMArena + 自家私有 repo eval 共同判斷。
---
## 5. Coding Agent 平台層深度檔案(Layer 4)
> **形式對照表**(呼應第 1 章 AI 形式四分法;同一工具可能跨多形式):
>
> | # | 工具 | AI 形式 | host / 部署 |
> |---|---|---|---|
> | 5.1 | Claude Code | **獨立 app** + **外掛型** | CLI / 桌面 / Web + VS Code / JetBrains 擴充 |
> | 5.2 | OpenAI Codex CLI | **獨立 app** + **外掛型** + **雲端** | CLI + IDE 擴充 + Web / App / GitHub Action |
> | 5.3 | Gemini CLI | **獨立 app** | CLI(可接 GitHub Actions)|
> | 5.4 | Jules | **雲端服務** | GitHub 整合 → Google Cloud VM |
> | 5.5 | Cursor | **焊死型 IDE** | fork VS Code |
> | 5.6 | Windsurf | **焊死型 IDE** | 自家 IDE |
> | 5.7 | Cline | **外掛型** + **獨立 app** | VS Code / Cursor / JetBrains 擴充 + CLI |
> | 5.8 | Continue.dev | **外掛型** | VS Code / JetBrains 擴充 |
> | 5.9 | Aider | **獨立 app** | CLI |
> | 5.10 | GitHub Copilot | **外掛型** + **獨立 app** + **雲端** | VS Code / JetBrains / Vim / Visual Studio 擴充 + CLI + cloud agent |
> | 5.11 | OpenHands | **獨立 app** + **雲端** | 自架 / Docker / 雲端 sandbox |
> | 5.12 | Devin | **雲端服務** | 商用 VM sandbox |
> | 5.13 | Manus | **雲端服務** | 通用 agent,coding 為子集 |
> | 5.14 | OpenAI Operator | **雲端服務** | 瀏覽器自動化(Computer Use)|
### 5.1 Claude Code(Anthropic)
**[事實]** 部署形式:CLI / 桌面 / Web (claude.ai/code) / VS Code 擴充 / JetBrains 擴充
**核心架構**:
- **Tool 系統**:Read / Write / Edit / Glob / Grep / Bash / WebFetch / WebSearch / Agent (subagent) / Task / Schedule 等內建
- **Sub-agent 系統**:可開 specialized agent(如 Explore、Plan、code-reviewer)並行任務
- **Hooks 系統**:PreToolUse / PostToolUse / UserPromptSubmit / Stop 等事件 hook
- **Skills 系統**:可重複呼叫的指令包,slash command 觸發
- **MCP 原生支援**:可裝任意 MCP server
- **Plan Mode**:先產 plan、用戶確認再執行
- **模型 / 速度模式**:依帳號方案與當期 rollout 切換 Opus / Sonnet / Haiku;高速模式與費率需看當期產品頁
**獨家優勢**:
- **Memory 系統**:自動保存 user / feedback / project / reference 4 類記憶跨對話持久化
- **Hooks**:第三方 IDE 多無此細粒度事件鉤
- **Sub-agent 隔離**:可用 worktree 隔離分支實驗
**限制**:
- **單一模型** — 鎖 Claude(Opus / Sonnet / Haiku 三模型可切換)
- **無原生 IDE 體驗**(VS Code 擴充為 panel 形式)
### 5.2 OpenAI Codex CLI
**[事實]** 2025 推出對標 Claude Code;到 2026 已形成 **CLI / IDE extension / Web / App / GitHub Action / SDK / MCP server** 多入口產品線。
**核心功能**(**驗證方法**:developers.openai.com/codex):
- **本地 agent loop**:CLI 在本機讀檔、改檔、跑命令;模型推理走 Responses API / ChatGPT Codex endpoint
- **Approval modes**:suggest / auto-edit / full-auto 類型模式控制人工介入程度
- **模型線**:GPT-5.2-Codex / GPT-5.5 / GPT-5.x 系;可接 Responses-compatible endpoint,含本地 gpt-oss 場景
- **MCP / hooks / skills / subagents / AGENTS.md**:官方 docs 已列為 Codex 配置與自動化能力
**獨家優勢**:
- **OpenAI 生態整合**深 — Responses API、Agents SDK、Computer Use、Image / Video / Realtime 等工具線一致
- **ChatGPT / Codex 訂閱整合** — 對已採購 ChatGPT Team / Enterprise / Edu 的組織摩擦低
**限制**:
- **模型供應商仍以 OpenAI 為主**;多模型 routing 需外接第三方或 Responses-compatible layer
- **Windows 支援需逐版本驗證**;官方曾標示 macOS / Linux 優先、Windows 可能需 WSL 或專用支援頁
### 5.3 Gemini CLI(Google)
**[事實]** Google 2025-06 推出,定位為高效、開源的 terminal AI agent,與使用者協作完成複雜開發任務。
**核心特性**:
- **運作邏輯:Research -> Strategy -> Execution**:
- 不同於一般的 Chatbot,Gemini CLI 遵循開發生命週期。在執行修改前會先進入 **Plan Mode** 生成設計文件,確保架構符合專案規範。
- **外科手術式編輯(Surgical Edits)**:
- 傾向使用精確的代碼替換(replace),而非重寫整個檔案,降低 Token 消耗並減少對無關代碼的干擾。
- **自主驗證與自我修復(Self-healing)**:
- 修改後自動尋找並執行相關測試(npm test, pytest 等)。若驗證失敗,會自動進入修復循環直到通過。
- **Google Search 整合**:
- 原生支援即時檢索最新的 API 文件或 StackOverflow 討論,解決模型知識切斷問題。
- **Gemini 2.5 / 3.x 模型線**:個人 Google 帳號可用高額免費額度;企業可接 AI Studio / Vertex AI key。
- **2M context 級別**:適合跨多個微服務 Repo 進行全局重構與大規模分析。
- **多模態原生**:影片(Bug 錄影)/ 圖片 / PDF 可直接作為分析 input。
- **Gemini CLI GitHub Actions**:把 CLI agent 放到 repo workflow 內做 issue triage / PR review / 背景任務。
**獨家優勢**:
- **GCP 整合** — Vertex AI / Workspace / Drive 順暢調用。
- **成本領先** — Flash-Lite 系列為三家閉源模型中最便宜的高吞吐選項。
### 5.4 Jules(Google)
**[事實]** Google Labs 2025 推出並走出 beta;定位為非同步雲端 coding agent。
**核心特性**:
- **GitHub 整合**:連 repo → Jules clone 到 Google Cloud VM → 擬定計畫 → 產 diff / PR
- **完整 task 自動化**:對標 Devin / OpenHands
- **VM 沙盒執行**
- **Jules Tools / Jules API**:可接終端與內部系統
**戰略定位**:**雲端非同步 agent**(vs Claude Code 的本地互動式 agent)
### 5.5 Cursor(Anysphere)
**[事實]** 規格(**驗證方法**:cursor.com/pricing + docs;2026 已改 usage-based,舊版「fast requests」口徑不再可靠):
| 方案 | 月費 | 口徑 |
|---|---|---|
| Hobby(免費)| $0 | limited Agent / Tab |
| Pro | $20 | frontier models + MCPs / skills / hooks + cloud agents |
| Pro+ | $60 | Pro 的 3x OpenAI / Claude / Gemini 用量 |
| Ultra | $200 | Pro 的 20x 用量 + priority |
| Teams | $40/seat | shared chats / commands / rules + org privacy controls / SSO |
**核心功能**:
- **Agent / Composer**:多檔案同時編輯,diff preview 後 apply
- **Tab 補完**:行內 / 多行補完
- **`@` 引用**:`@file` / `@folder` / `@web` / `@docs` / `@git` 精準注入 context
- **`.cursorrules` / MDC**:專案規則檔,全域 inject
- **Cloud agents / hooks / skills / MCPs**:2026 官方定價頁已列為 Pro 以上能力
**支援模型**:Claude / GPT / Gemini / o-系列 / 自管 API key
**獨家優勢**:
- **IDE 整合最深** — fork VS Code 而非擴充
- **多模型切換零摩擦**
**限制**:
- 訂閱不可轉
- 隱私 — 程式碼預設經 Cursor 伺服器,企業需 Privacy Mode
### 5.6 Windsurf(前 Codeium)
**[事實]/[推論]** 規格(**驗證方法**:docs.windsurf.com / windsurf.com/pricing;2026-03 後自助方案改 usage-based):
| 方案 | 特色 |
|---|---|
| Free | 入門限額 |
| Pro / Max | 個人付費,依模型與用量給額度 |
| Teams / Enterprise | 集中帳單、SSO / RBAC / admin dashboard、企業治理 |
**核心功能**:
- **Cascade**:對標 Cursor Composer 的 agent
- **Supercomplete**:補完 + 推測下一步意圖
- **Memories / Rules / Workflows / Skills / AGENTS.md**:跨對話與 repo 規則管理
- **MCP / Cascade Hooks**:可接 stdio / Streamable HTTP / SSE;Teams/Enterprise 有 admin controls
**獨家優勢**:
- **Cascade 產品化早**,IDE 內 agent 體驗成熟
- **企業治理選項較完整**(從 Codeium 企業線延伸)
### 5.7 Cline(前 Claude Dev)
**[事實]** 開源 AI coding agent,支援 VS Code / Cursor / JetBrains,也有 CLI。
**核心功能**:
- **Plan / Act 雙模式**:
- Plan mode:讀 code / 搜尋 / 討論策略,但不改檔、不執行命令
- Act mode:執行 tool
- **MCP 原生支援**
- **`.clinerules`**:專案規則檔
- **Auto-approve 細粒度**:tool 確認設定
**支援模型**:Claude / GPT / Gemini / OpenRouter / Bedrock / Vertex / 本地(Ollama / LM Studio)
**獨家優勢**:
- **完全開源** + **支援本地模型** + **MCP 原生** = **隱私敏感場景首選**
- **Plan / Act 雙模**為其他工具罕見
### 5.8 Continue.dev
**[推論]** 開源 VS Code / JetBrains 擴充。
**核心功能**:
- **Indexer**:本地索引 repo
- **Custom commands**:YAML 設定自定 slash command
- **多模型 routing**:autocompletion vs chat 可分配不同模型
**戰略定位**:**比 Cline 更輕量**,較不像 agent,更像「強化版 Copilot」
### 5.9 Aider(開源 CLI)
**[事實]** 開源、CLI、社群驅動。
**核心架構**:
- **Repo-map**:用 tree-sitter 解析整個 repo,**將 100k 檔案 repo 壓縮為 ~20k tokens** 結構摘要(**驗證方法**:aider.chat/docs/repomap.html)
- **Git auto-commit**:每次 agent 變更自動 commit
- **Voice coding**:語音輸入支援
- **Model 切換**:CLI flag 即可切換 Claude / GPT / Gemini / 本地
**獨家優勢**:
- 完全開源,企業可 fork 客製
- **Repo-map 演算法**為業界最成熟
### 5.10 GitHub Copilot
**形式**:**外掛型** + **獨立 app**(CLI)+ **雲端 agent** 三重身份(裝在 VS Code / JetBrains / Vim / Visual Studio / GitHub.com 等多種 host)
**[事實]** 規格(**驗證方法**:docs.github.com/copilot;2026 起 pricing / billing 口徑正在轉 usage-based):
| 方案 | 月費 | 特色 |
|---|---|---|
| Free | $0 | 有限 chat / 補完 / agent 功能 |
| Pro | $10 | 個人付費,含 premium requests 與 cloud agent |
| Pro+ | $39 | 更多 premium requests / 高階模型 |
| Business | $19/seat | 中央政策、組織管理、cloud agent |
| Enterprise | $39/seat | Business + enterprise-grade 功能 |
**核心定位**:從「補完 + Chat」升級為 GitHub 內建 agent 平台;**Copilot coding agent 2025-09 GA**,可背景開 draft PR;**Copilot CLI 2026-02 GA**,可在 terminal 規劃、改檔、跑測試。
**外部工具 / 擴充生態**(**[推論]**,**驗證方法**:docs.github.com/copilot/customizing-copilot + GitHub Marketplace「Copilot Extensions」分類;partner 清單以 Marketplace 即時為準,常見 partner 隨時異動):
- **Copilot Extensions / Apps**(2024-09 GA):第三方應用在 Copilot Chat 用 `@app` 呼叫;代表性合作方含 **Stripe、Sentry、Atlassian (Jira / Confluence)、Microsoft (Teams / Loop)、DataStax、Heroku、Octopus Deploy、LaunchDarkly、Docker、MongoDB** 等
- **擴充開發兩種模式**:
- **GitHub App**(自架後端,自由度高)— 複雜業務邏輯、自家認證
- **Skillsets**(GitHub 託管,描述式)— OpenAPI / 工具描述即可,免自架
- **MCP client 支援**(2025 後):VS Code Copilot Chat 已加入 MCP 支援,可裝任意 MCP server,跟 Cursor / Claude Code / Cline 同生態
- **Copilot Spaces**(2024-12):圈一組 repo / files / docs 為對話 context 基準
- **Custom Instructions / `.github/copilot-instructions.md`**:repo 級規則檔,類似 `.cursorrules` / `.clinerules`
**獨家優勢**:
- GitHub 生態深整合(PR、issues、Actions)
- Enterprise 採購最容易(多數公司已有 GitHub 訂閱)
- **唯一同時提供「IDE 擴充 + 獨立 CLI + 雲端 agent + 擴充生態」全套** 的工具
**限制**:
- **模型主要為 OpenAI / Anthropic 等 GitHub 簽約供應商**,不像 Cline / Cursor 可自管 API key 接百家
- **Extensions vs MCP 雙生態並存**:部分功能重疊(外部工具呼叫),企業需在兩條線之間做技術選型
- **效益綁 GitHub repo 工作流**:沒在 GitHub 上的場景(GitLab / Bitbucket / 內部 git server)效益打折
### 5.11 OpenHands(前 OpenDevin)
**[推論]** 開源自主 SWE agent,社群驅動。
**核心特性**:
- **SWE-bench 常勝軍**(**驗證方法**:swebench.com 排行)
- **完整 agent loop**:感知 → 規劃 → 執行
- **多 backend 支援**:Claude / GPT / Gemini / 本地
- **Docker 沙盒執行**
**戰略定位**:**對標 Cognition Devin 的開源版本**
### 5.12 Devin(Cognition)
**[推論]** 商用自主 SWE agent,引爆 2024 「AI 軟體工程師」討論。
**核心特性**:
- **完整任務自主**:assign 一個 issue 從頭做到開 PR
- **VM 沙盒**
- **企業訂閱**
**[推論]** 限制:價格高(**驗證方法**:cognition.ai/pricing);**體驗成熟度爭議**
### 5.13 Manus(蝴蝶效應)
**[推論]** 中國團隊 2025 推出的通用 agent,coding 為其中一個能力。
**核心特性**:
- 通用 agent(不限於 coding)
- 雲端非同步任務
- **2025 病毒級爆紅**
### 5.14 OpenAI Operator
**[推論]** 2025 Jan 推出,OpenAI 官方 Computer Use 產品。
**核心特性**:
- **瀏覽器自動化** agent
- **GPT 系列驅動**
- **訂閱 ChatGPT Pro 用**(**驗證方法**:openai.com/operator)
**戰略定位**:**對標 Anthropic Computer Use API + Browserbase**
---
## 6. 多模型策略(Layer 2)
### 6.1 為什麼需要 Routing 層
**[推論]** 原因(**驗證方法**:搜當期 SWE-bench / LMArena / 各家官網):
| 任務 | 最適模型 | 為什麼 |
|---|---|---|
| 架構設計討論 | Claude Opus 4.7 | reasoning + 長文一致性 |
| 大量重複編輯 | GPT-5.4 mini / Claude Sonnet 4.6 / Haiku 4.5 | 速度 + 便宜 |
| 超長 context(>500k) | **Gemini 3.1 Pro Preview (2M)** | context 最大 |
| 數學 / 演算法 | GPT-5.5 / Gemini 3.x reasoning mode | 推理深度 |
| 圖像理解 | Gemini 3 Pro / GPT-5.x(多模態) | 多模態原生 |
| Cost-sensitive batch | Haiku 4.5 / Gemini 3.1 Flash-Lite | 便宜 5–10x |
### 6.2 工具支援多模型對照
| 工具 | Claude | GPT | Gemini | 本地 | 其他 |
|---|---|---|---|---|---|
| Claude Code(全形式) | | | | | – |
| OpenAI Codex CLI | | | | | – |
| Gemini CLI | | | | | – |
| Cursor | | | | **[推論]** | – |
| Windsurf | | | | | – |
| Cline | | | | Ollama 等 | OpenRouter 接百家 |
| Continue.dev | | | | | OpenRouter |
| Aider | | | | | OpenRouter |
### 6.3 Routing 工具對照
| 工具 | 形式 | 計費 | 強項 |
|---|---|---|---|
| **OpenRouter** | API 中介 | +5% markup | 一個 key 接百家 |
| **Portkey** | Gateway + 觀測 | 訂閱 + token | 企業治理 / 觀測 |
| **LiteLLM** | 開源代理 | 自架免費 | 自管基礎建設 |
| **Anthropic / OpenAI Native** | 直連 | 各家計費 | 無中介費 + 最低 latency |
**[推論]** 實作建議:團隊 10 人以下用 OpenRouter;30 人以上考慮自架 LiteLLM 或 Portkey
### 6.4 Fallback 策略
**[推論]** 業界常見模式:
```
Primary: Claude Opus 4.7
↓ (rate limit / error)
Fallback1: Claude Sonnet 4.6
↓ (still failing)
Fallback2: GPT-5.4 / GPT-5.4 mini
↓ (last resort)
Fallback3: Gemini 3.1 Flash-Lite
```
---
## 7. MCP 協議深度解析(Layer 3)
### 7.1 技術架構
**[事實]** MCP 是基於 **JSON-RPC 2.0** 的協議,定義 client / server 通訊。
**核心概念**:
- **Server**:暴露 tools / resources / prompts
- **Client**:發起呼叫(Claude Desktop / Code / Cursor 等)
- **Transport**:STDIO(本地進程)/ SSE(Server-Sent Events,遠端)/ Streamable HTTP(2025 spec 已列)
- **Auth**:HTTP transport 有授權框架;STDIO 通常透過本機環境變數或外部配置取憑證
**Handshake 流程**:
```
Client → Server: initialize { protocolVersion, capabilities }
Server → Client: initialize-response { capabilities, serverInfo }
Client → Server: tools/list
Server → Client: { tools: [...] }
Client → Server: tools/call { name, arguments }
Server → Client: { content: [...] }
```
**[事實]** 2025-12 Anthropic 宣布將 MCP 捐給 Linux Foundation 旗下 AAIF;官方稱 MCP 已被 ChatGPT、Cursor、Gemini、Microsoft Copilot、VS Code 等採用,並有 10,000+ active public MCP servers。此數字是生態口徑,不等於「10,000 個皆可安全上 production」。
### 7.2 主流 MCP server 詳細對照
**[推論]**(**驗證方法**:官方 MCP Registry / mcp.so / Smithery / 各廠商 docs;維護方與安全狀態需逐項確認):
#### 早期 reference / 常見基礎類
| Server | 用途 | 配置複雜度 |
|---|---|---|
| filesystem | 讀寫指定路徑 | 低 |
| git | 本地 git 操作 | 低 |
| github | issues / PR / repos | 中(OAuth)|
| google-drive | 雲端硬碟 | 中(OAuth)|
| slack | 訊息 / 頻道 | 中(OAuth)|
| postgres | SQL 查詢 | 中 |
| puppeteer | headless Chrome | 高(瀏覽器依賴)|
| brave-search | Web 搜尋 | 低(API key)|
| memory | 鍵值記憶 | 低 |
| sequentialthinking | 思考鏈 | 低 |
#### 第三方 / 官方
| Server | 維護方 | 用途 |
|---|---|---|
| **figma** | Figma 官方 | 讀設計檔 / 轉 code |
| **stripe** | Stripe 官方 | 支付 / 訂閱 |
| **sentry** | Sentry 官方 | 錯誤追蹤 |
| **cloudflare** | Cloudflare 官方 | DNS / Workers / R2 |
| **notion** | **[推論]** 官方 | 筆記讀寫 |
| **linear** | 社群 / 官方 | issue 追蹤 |
| **blender-mcp** | ahujasid(社群) | 3D 建模 |
| **playwright-mcp** | Microsoft | 跨瀏覽器自動化 |
| **browserbase** | Browserbase | 雲端 headless 瀏覽器 |
### 7.3 MCP 安全考量
**[事實]**
- MCP server 跑在**本機**(STDIO 模式)— 有完整檔案 / 網路存取權
- **未經審計的 MCP server = 等於跑陌生 binary**
- 企業部署應**白名單**,禁止使用者隨意 `pip install` / `npm install`
- Remote MCP / connectors 要把 OAuth scope、token refresh、審計 log 納入資安設計
**[推論]** 風險:
- 惡意 server 可竊取 API key、檔案、私鑰
- Tool output prompt injection:工具回傳內容可能誘導 agent 執行不該做的命令
- 已有 MCP / coding agent supply-chain 相關報導(**驗證方法**:搜「MCP security incident 2025」「Gemini CLI vulnerability 2025」)
---
## 8. Computer Use 深度解析
### 8.1 架構
**[事實]** Anthropic Computer Use API 流程:
```
1. Claude 呼叫 computer tool: { action: "screenshot" }
2. Sandbox 截圖回傳給 Claude
3. Claude 分析畫面,決定下一步: { action: "left_click", coordinate: [x, y] }
4. Sandbox 執行點擊
5. 重複 1–4 直到任務完成
```
**支援動作**(**[事實]**):
- screenshot
- mouse_move / left_click / right_click / middle_click / double_click
- left_click_drag
- key(組合鍵)/ type
- scroll
- cursor_position
### 8.2 Sandbox 部署
**[推論]** 生產部署選項:
- **本機 Docker**:開發測試
- **Browserbase / Anchor Browser**:雲端 headless(**驗證方法**:browserbase.com/computer-use)
- **AWS / GCP VM**:自建
### 8.3 已知失敗模式
**[推論]**(業界 2025 共識):
| 失敗模式 | 原因 | 緩解 |
|---|---|---|
| **點錯位置** | 模型 grounding 不夠精確 | 加 zoom / OCR pre-process |
| **無限迴圈** | 看不出任務已完成 | 加 max_steps + 完成判斷 |
| **誤操作** | 點到關閉 / 刪除按鈕 | 沙盒隔離 + dry-run mode |
| **速度慢** | 每步驟都要截圖 + 推理 | 預期 10–30 秒/步驟 |
**[推論]** 適用場景判斷:
- 老桌面軟體無 API
- 網頁 QA 自動化
- 高頻重複任務(成本太高)
- 需要 1 秒內回應的 UI 流程
---
## 9. 專業軟體整合 — 分項成熟度
**[推論]**(**驗證方法**:mcp.so 各 server 頁面 + 該軟體 scripting 文件):
| 軟體 | 底層 API | 主流 MCP server | 成熟度 | 限制 |
|---|---|---|---|---|
| **Adobe Photoshop** | UXP / ExtendScript | 社群多版(如 photoshop-mcp)| | UXP 需 PS 25+ |
| **Adobe Premiere** | ExtendScript / UXP | premiere-mcp(社群)| | 部分功能 UXP 未補齊 |
| **Adobe After Effects** | ExtendScript / UXP | ae-mcp(社群)| | 渲染慢 |
| **Adobe Illustrator** | UXP / ExtendScript | illustrator-mcp(社群)| | 同 PS |
| **Unity** | C# Editor API + Python | unity-mcp(社群多版)| | 需 Editor 開啟 |
| **Unreal Engine** | Python + Blueprint | unreal-mcp(社群)| | 較新,文件少 |
| **Blender** | Python | **blender-mcp**(ahujasid)| | 強推 |
| **Figma** | Plugin API | **官方 figma-mcp** | | 官方支援 |
| **Sketchup** | Ruby API | sketchup-mcp(社群)| | 冷門 |
| **AutoCAD** | LISP / .NET | autocad-mcp(**[推論]** 社群)| | 不確定活躍度 |
| **DaVinci Resolve** | Python API | resolve-mcp(**[推論]** 社群)| | 影片剪接替代 |
| **Ableton Live** | Max for Live / Python | **ableton-mcp**(ahujasid)| | 音樂製作 |
### 9.1 多模型製圖管線(2026 最新)
**[推論]** 2025–2026 LLM 主導圖像 / 影片生成的標準工作流(**驗證方法**:搜「multi-model image pipeline 2026」):
```
[Agent 層: Claude Code / Codex CLI / Gemini CLI]
↓ 寫 prompt
[概念圖] Midjourney v7 / Flux Pro / Imagen 4 / GPT-Image-1
↓
[編輯層] Nano Banana Pro / Nano Banana 2 / Flux Kontext / GPT-Image-1 edit
↓
[高解析] Magnific / Topaz / Recraft
↓
[後製] Photoshop MCP / Figma MCP(自動圖層 / 字幕)
↓
[影片合成] Premiere MCP / Sora / Veo 3.x
↓
[語音/字幕] ElevenLabs / OpenAI TTS / Gemini Live
```
**[推論]** 2026 最熱組合:
- **多輪保人物編輯** → Nano Banana Pro / Nano Banana 2(需按成本與 preview 狀態選)
- **高解析文字渲染** → GPT-Image-1(招牌、海報)
- **影片含音效 / 敘事** → Veo 3.x / Sora(逐區域與帳戶可用性驗證)
- **開源可商用** → Flux Pro / Flux Kontext
### 9.2 雙 Agent 互審架構
**[推論]** 兩個 agent 並行,各做專長 + 互相 review:
| 角色 | 強項 |
|---|---|
| 主筆 agent(如 Claude Code) | 主寫、長文 reasoning、規範遵循 |
| 審稿 agent(如 OpenAI Codex CLI) | second opinion、quantitative 計算 |
**驗證方法**:搜「multi-agent code review 2025」
---
## 10. 計費深度模型(TCO)
### 10.1 Token 消耗量級
**[推論]** 典型 coding agent 任務 token 消耗:
| 任務類型 | Input tokens | Output tokens | Cache hit 率 |
|---|---|---|---|
| 簡單修 bug | 5–20k | 1–5k | 20–40% |
| 中型 feature | 30–100k | 10–30k | 40–60% |
| 大型重構 | 200k–1M | 50k–200k | 60–80% |
| 全 repo agent loop | 1M–10M+ | 200k–1M | 80%+ |
### 10.2 團隊規模 cost 模擬
**[推論]** 假設每位開發者每日 200k tokens、每月 20 個工作日;粗算採 70% input / 30% output、未計 prompt cache、未計工具費與 premium processing:
| 團隊規模 | 月 tokens | 訂閱方案 cost | API 直連 cost(Sonnet 4.6)| API 直連 cost(Opus 4.7)|
|---|---|---|---|---|
| 1 人 | 4M | Pro/Max $20–100 | ~$26 | ~$44 |
| 5 人 | 20M | $100–500 | ~$132 | ~$220 |
| 10 人 | 40M | $200–1,000 | ~$264 | ~$440 |
| 50 人 | 200M | $1,000–5,000 | ~$1,320 | ~$2,200 |
**結論**:
- **API 未必比訂閱貴**:Opus 4.7 $5/$25 後,低到中度使用者 API 可能比 Max 訂閱便宜
- **訂閱仍適合高互動重度使用者**:尤其需要 Claude.ai / Claude Code 共用額度、無需自管 key 與帳務
- **混合策略**:訂閱 cover 重度使用者 + API 跑 batch / CI 任務
### 10.3 Hidden costs
- **MCP server 維運**:自架雲端 server(如 Browserbase)月費 $50–500
- **觀測 / 治理**:Helicone / Langfuse / Portkey $50–500/月
- **訓練 / 採用曲線**:每位開發者 2–4 週 ramp-up,**隱性成本 $5k–10k**
- **資安審計**:MCP server 白名單建立 + code review,**初期 1–2 人月**
---
## 11. 安全與合規
### 11.1 資料流向
| 工具 | 程式碼上傳 | 訓練 opt-out | 留存期 |
|---|---|---|---|
| Claude Code(API)| 上傳 | 預設不訓練 | **[推論]** 30 天 |
| Claude Code(Bedrock)| 同上但企業帳號 | 不訓練 | 由 AWS 控 |
| Cursor | 上傳 | Privacy Mode 可關 | **[推論]** 視方案 |
| GitHub Copilot | 上傳 | Business+ 不訓練 | **[推論]** 28 天 |
| Cline / Aider | API key 直連 | 視 LLM 供應商 | 同 LLM |
| 本地模型(Ollama) | 完全本地 | – | – |
**驗證方法**:各家 trust center / privacy policy
### 11.2 Enterprise 功能
**[推論]** 大型企業必查 checklist:
| 功能 | Claude Pro/Max | Claude Enterprise | Cursor Business | GitHub Copilot Enterprise |
|---|---|---|---|---|
| SSO / SAML | / | | | |
| SCIM 用戶管理 | / | | | |
| Audit logs | / | | | |
| SOC2 Type II | | | | |
| HIPAA / BAA | | **[推論]** | **[推論]** | |
| 資料 region 選擇 | 限定 | | **[推論]** | |
| 自管 KMS | | ]Bedrock)| | **[推論]** |
### 11.3 MCP 供應鏈風險
**[事實]** MCP server 跑在本機進程,等同於信任作者:
- 應建立**內部白名單**
- 禁止使用者隨意 `pip install` / `npm install`
- 對 MCP server 做 **package signing** 驗證(**[推論]** 規範進行中)
---
## 12. 採購決策框架
### 12.1 加權評分卡
**[推論]** 標準採購評估面向(10 分制):
| 面向 | 權重 | Claude Code | Cursor | Cline | Copilot |
|---|---|---|---|---|---|
| 模型品質 | 20% | 9 | 9 | 8 | 7 |
| 多模型靈活 | 15% | 3 | 9 | 10 | 5 |
| Agent 能力 | 15% | 9 | 8 | 7 | 8 |
| MCP 生態 | 10% | 9 | 8 | 9 | 7 |
| IDE 整合 | 10% | 6 | 10 | 8 | 9 |
| 企業合規 | 10% | 8 | 7 | 6 | 9 |
| 成本效益 | 10% | 8 | 7 | 9 | 8 |
| 學習曲線 | 5% | 6 | 9 | 7 | 9 |
| 社群 / 文件 | 5% | 8 | 9 | 7 | 9 |
**加權總分([推論]** 示例):
- Claude Code: **7.6**
- Cursor: **8.3**
- Cline: **7.9**
- Copilot: **7.6**
**[推論]** 結論:**Cursor 在 IDE / 多模型彈性仍強**;Claude Code 在本地 agent 深度 / MCP / hooks 上強;Copilot 的優勢從「採購容易」擴大到 GitHub cloud agent / CLI。最終應按團隊 repo、審查流程、資安限制重算權重。
### 12.2 三條採購路徑
| 路徑 | 條件 | 推薦組合 | 預期月成本(10 人)|
|---|---|---|---|
| **A. 原廠深度** | 重視 agent 深度、Hooks / Skills | Claude Pro/Max + VS Code 擴充 + 內部 MCP | $200–1,000 + API |
| **B. 多模型靈活** | 重視避免 vendor lock-in | Cursor Teams/Enterprise + 自管 API key | $400 + usage |
| **C. GitHub 內建** | 重視 PR / issue / Actions 流程 | GitHub Copilot Business/Enterprise + cloud agent | $190–390 + premium requests |
| **D. 開源 + 本地** | 重視隱私、合規、可審計 | Cline + Ollama / 自管 API | API token $300–2,000 |
| **E. 混合雲模式** | **效能與成本平衡** | **Claude Code (推理) + Gemini CLI (掃描/測試)** | **API 組合計費** |
### 12.3 場景化推薦
| 情境 | 推薦組合 | 月成本(個人)|
|---|---|---|
| **個人開發者**(重度)| Claude Max + VS Code 擴充 | $100 |
| **多模型實驗者** | Claude Max + Cline(自管 API key) | $100 + token |
| **設計 / 影音團隊** | Claude Max + Photoshop/Premiere MCP + 圖像生成 API | $100 + 圖像 API |
| **遊戲開發** | Cursor Pro + Unity MCP + Blender MCP | $20 + token |
| **大型遺留專案重構** | **Gemini CLI (2M context) + Jules** | **按量計費** |
| **企業大型專案** | Anthropic API(Bedrock)+ 自製 Agent SDK | 按 token + AWS |
---
## 13. 風險矩陣
### 13.1 技術風險
| 風險 | 機率 | 衝擊 | 緩解 |
|---|---|---|---|
| 模型錯誤導致 production bug | 高 | 高 | 強制 PR review + 測試 |
| Agent 無限迴圈耗 token | 中 | 中 | max_steps + budget alert |
| MCP server 供應鏈攻擊 | 低 | 高 | 白名單 + 簽章驗證 |
| Computer Use 誤刪檔案 | 中 | 高 | 沙盒隔離 + dry-run |
| Context 漏寫敏感資料 | 高 | 高 | secret scanning + .gitignore-like |
### 13.2 商業風險
| 風險 | 機率 | 衝擊 | 緩解 |
|---|---|---|---|
| 模型供應商漲價 | 高 | 中 | Layer 2 routing 預留切換 |
| 工具廠商收購 / 倒閉 | 中 | 中 | 避免單押 |
| 訓練資料外洩 | 低 | 高 | Enterprise 方案 + opt-out |
| 員工技能單一供應商化 | 中 | 中 | 輪換工具培訓 |
### 13.3 合規風險
| 風險 | 影響行業 | 緩解 |
|---|---|---|
| GDPR 違規 | 歐盟業務 | Enterprise + region 選擇 |
| HIPAA 違規 | 醫療 | BAA + Bedrock |
| 智財權混淆 | 全行業 | Copilot Business+ / Cursor Business |
| 出口管制 | 國際業務 | 模型 region + 用戶白名單 |
---
## 14. Roadmap 信號
**驗證方法**:追各家官方 blog / changelog + GitHub Releases
| 趨勢 | 信號 | 影響時程 |
|---|---|---|
| MCP 標準化 | AAIF / Linux Foundation 治理;ChatGPT / Cursor / Gemini / Copilot / VS Code 採用 | 已進主流,2026 看治理與安全 |
| Background / cloud agents | Codex Web/App、Jules、Copilot cloud agent、Cursor cloud agents | 已產品化,2026 看企業治理 |
| 影片 / 多模態 agent | Sora / Veo / Gemini 3.x / Computer Use | 2026 全年 |
| Local-first 模型 | Llama / Qwen 等開源 quality 追近 | 持續 |
| Agent 治理層 | LangSmith / Helicone / Phoenix 競爭 | 2026 後加速 |
| Code agent benchmark | SWE-bench Pro / Terminal-Bench / Aider / 私有 repo eval | 2026 H1 後常態化 |
| 自主 SWE agent | Devin / Manus / OpenHands / Jules 競爭 | 2026 全年 |
| Usage-based billing | Cursor / Windsurf / Copilot 等從請求數轉向 credits / usage | 2026 採購重點 |
---
## 15. 三家原廠生態系全圖(Anthropic / OpenAI / Google)
> **本章定位**:跳出「單一工具」視角,按廠商盤點全家桶。採購談判、單一供應商深度綁定、跨家比較皆需此維度。
### 15.1 Anthropic 生態系
**[事實]/[推論]**(**驗證方法**:anthropic.com/product / docs.claude.com):
| 類別 | 產品 | 定位 |
|---|---|---|
| **模型** | Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5 | 旗艦推理 / 平衡 / 速度 |
| **聊天 - Web** | Claude.ai | 主入口 |
| **聊天 - 桌面** | Claude Desktop(Mac / Win) | 原生 app |
| **聊天 - 手機** | Claude iOS / Android | 行動端 |
| **Coding Agent** | Claude Code(CLI / 桌面 / Web / VS Code / JetBrains) | 5 種前端 |
| **Agent SDK** | Claude Agent SDK | 自製 agent |
| **協議** | **MCP**(協議發起者) | 行業標準 |
| **自動化** | Computer Use API | GUI 控制 |
| **特性層** | Hooks / Skills / Memory / Plan Mode / Sub-agent / Extended Thinking / Prompt Caching | Coding Agent 高階特性 |
| **API** | Messages API / Files API / Batch API / Computer Use API | – |
| **託管** | AWS Bedrock / GCP Vertex AI | 企業 |
| **訂閱** | Free / Pro / Team / Enterprise;Max / premium seat 依區域與方案 | 個人 → 企業 |
**生態系獨家強項**:
- **Coding Agent 特性最深**(Hooks / Skills / Plan / Memory)
- **MCP 發起者**,協議向心力強
- **長文 reasoning + 規範遵循** 業界第一梯隊
- **缺原生圖像 / 影片生成**(要靠第三方接 API)
- **手機端僅聊天**,無 Coding Agent
### 15.2 OpenAI 生態系
**[事實]/[推論]**(**驗證方法**:openai.com / platform.openai.com):
| 類別 | 產品 | 定位 |
|---|---|---|
| **模型 - 通用** | GPT-5.5 / GPT-5.5 Pro / GPT-5.4 / GPT-5.4 mini / nano | 旗艦多模態 / reasoning |
| **模型 - coding** | GPT-5.2-Codex / GPT-5.x-Codex 線 | Codex / agentic coding |
| **模型 - legacy** | GPT-5、GPT-4.1、GPT-4o | 過渡 / 存量 |
| **模型 - 圖** | **GPT-Image-1**(API)/ DALL-E 3(legacy) | 文字→圖、編輯 |
| **模型 - 影片** | **Sora**(1)/ **Sora 2**(**[推論]** 2025 推) | 文字→影片 |
| **模型 - 語音** | TTS / Whisper / Voice mode | 文字↔語音 |
| **聊天 - Web** | ChatGPT.com | 主入口 |
| **聊天 - 桌面** | ChatGPT Desktop(Mac / Win) | 原生 app |
| **聊天 - 手機** | ChatGPT iOS / Android | 行動端 |
| **聊天 - 瀏覽器** | **ChatGPT Atlas / browser-side agent 能力**(**[推論]** 需按產品可用區確認) | 內建 ChatGPT |
| **Coding Agent** | **Codex(CLI / IDE / Web / App / GitHub Action)** | 對標 Claude Code / Jules / Copilot agent |
| **自動化 Agent** | **Operator**(2025-01 推) | 瀏覽器 / Computer Use |
| **Agent 框架** | **Agents SDK / Agent Builder / Apps SDK** | 自製 agent / ChatGPT app |
| **特性** | Memory / Custom GPTs / GPT Store / Tasks / Canvas / Projects | 多 |
| **API** | **Responses API**(newer)/ Chat Completions(legacy)/ Realtime API / Files / Batch | – |
| **託管** | Azure OpenAI Service | 微軟雲 |
| **訂閱** | Free / Plus $20 / Pro $200 / Team / Enterprise / Edu | 多層 |
**生態系獨家強項**:
- **多模態最齊全**:文字 + 圖 + 影片 + 語音 全有原生
- **Sora 影片生成**業界領先
- **GPT Store** 第三方 GPT 應用市集
- **Operator** 是業界首批商用 Computer Use 產品
- **Coding Agent 起步晚但追趕快**,Codex 已補 CLI / IDE / Web / app / automation 線
- **MCP 支援是跟進方**,但 Responses API / connectors 已讓 OpenAI 進入 MCP 生態核心
### 15.3 Google Gemini 生態系
**[事實]/[推論]**(**驗證方法**:ai.google.dev / gemini.google.com):
| 類別 | 產品 | 定位 |
|---|---|---|
| **模型 - 旗艦** | **Gemini 3.1 Pro Preview** / Gemini 3 Pro / Gemini 2.5 Pro | **2M context** / 多模態 / coding |
| **模型 - 速度** | Gemini 3 Flash Preview / 3.1 Flash-Lite Preview / 2.5 Flash | 便宜 / 高吞吐 |
| **模型 - 圖** | **Imagen** / **Nano Banana** / **Nano Banana Pro** / **Nano Banana 2** | 純生成 + 編輯 |
| **模型 - 影片** | **Veo 3.x** | 文字 / 圖像→影片 |
| **模型 - 語音** | Gemini Live / Chirp(語音合成) | 即時對話 |
| **聊天 - Web** | gemini.google.com | 主入口 |
| **聊天 - 手機** | Gemini iOS / Android | 行動端 |
| **聊天 - 桌面** | **[推論]** 主要走 web,無獨立 native app | – |
| **Coding Agent - CLI** | **Gemini CLI** | **互動式 Agent (Research-Strategy-Execution)** |
| **Coding Agent - IDE** | **Gemini Code Assist**(VS Code / JetBrains / GCP Cloud) | 對標 Copilot;整合 Project Astra 視覺能力 |
| **自主 Agent** | **Jules** | 非同步 cloud coding agent,GitHub / VM / PR 工作流 |
| **企業整合** | **Vertex AI Extensions** | **對接 BigQuery / 企業內部 API** |
| **瀏覽器 Agent** | **Project Mariner**(**[推論]** 研究預覽) | 對標 Operator |
| **多模態 Agent** | **Project Astra**(**[推論]** 研究預覽) | 即時相機+語音 agent |
| **研究助手** | **NotebookLM** | 多源文件 RAG / Audio Overview |
| **Playground** | **Google AI Studio**(aistudio.google.com) | Prompt 試驗 |
| **Workspace 整合** | Docs / Sheets / Slides / Gmail / Drive 內嵌 Gemini | 辦公全套 |
| **API** | Gemini API(個人)/ Vertex AI(企業) | – |
| **託管** | Vertex AI(GCP) | 企業 |
| **訂閱** | Free / Gemini Advanced $20 / Business / Enterprise | 多層 |
**生態系獨家強項**:
- **Context 最大**:**2M tokens** 領先業界,適合全局重構
- **Workspace 整合最深**:Docs / Sheets / Slides / Drive / Gmail 都嵌 Gemini
- **Vertex AI Extensions**:可直接連動企業資料庫 (BigQuery)
- **計費最低**:Flash-Lite 為三家最便宜
- **多模態原生最強**:影像理解 / Astra 即時相機視覺整合
- **生態整合度** 較分散(Jules / CLI / Code Assist 三條線)
### 15.4 三家對照(一張表)
| 維度 | Anthropic | OpenAI | Google Gemini |
|---|---|---|---|
| **旗艦模型** | Opus 4.7 | GPT-5.5 | Gemini 3.1 Pro Preview |
| **Context 上限** | 1M | 1M(GPT-5.5)| **2M (Vertex/AI Studio)** |
| **原生圖像生成** | | GPT-Image-1 / DALL-E | Imagen / Nano Banana |
| **原生影片生成** | | Sora | Veo 3.x |
| **原生語音** | | Realtime API | Live / Chirp |
| **Coding Agent** | Claude Code(特性最深)| Codex(多入口)| Gemini CLI / Jules / Code Assist |
| **Computer Use** | API(beta)| Operator(產品化)| Project Mariner(預覽)|
| **MCP 角色** | **發起者 / AAIF 捐贈方** | 採用 / connectors | 採用 / SDK 支援 |
| **企業託管** | AWS Bedrock / GCP Vertex | Azure OpenAI | GCP Vertex AI |
| **Workspace 整合** | 弱 | Microsoft 365 Copilot **[推論]** | **強**(Google Workspace)|
| **計費最低(Flash 級)**| Haiku 4.5 $1/$5 | GPT-5.4 nano / mini 線需查 pricing | **Flash-Lite (最高性價比)** |
| **訂閱起步價** | Pro $20 | Plus $20 | Advanced $20 |
**戰略含義**:
- **要寫 code 深度**:Anthropic 生態最強(Claude Code + MCP)
- **要多媒體生成**:OpenAI / Google 二選一,Anthropic 沒這層
- **要 Workspace 辦公整合**:Google 唯一選
- **要多模型靈活**:用第三方工具(Cursor / Cline)跨家接
---
## 16. 知識管理 / 筆記 AI 工具(Obsidian 等)
> **本章定位**:Coding 之外的「個人 / 團隊知識庫 + AI」工具線。專業團隊普遍同時部署 1 個 coding agent + 1 個知識管理工具。
### 16.1 Obsidian + AI plugins(最熱筆記 + AI 組合)
**[事實]** Obsidian 本身是免費 markdown 筆記 app(Mac / Win / Linux / iOS / Android),AI 能力靠**社群 plugin 接外部 LLM API**。
**主流 AI plugins**(**[推論]**,**驗證方法**:obsidian.md/community-plugins 搜「AI」):
| Plugin | 功能 | 接哪家 LLM |
|---|---|---|
| **Smart Connections** | 語意搜尋 / 相關筆記推薦 / Chat with notes | OpenAI / 本地 embedding |
| **Copilot for Obsidian** | 對話 / 改寫 / 摘要 / RAG | Claude / GPT / Gemini / Ollama |
| **Text Generator** | 模板化生成 | OpenAI / Anthropic |
| **Smart Composer** | inline 補完 | 多家 |
| **Obsidian Web Clipper** + AI | 網頁→筆記 + 自動摘要 | – |
| **Cubox / Readwise + Obsidian** | RSS / Highlights → 筆記 | – |
**戰略定位**:
- **完全本地優先** — 筆記檔案在你硬碟,AI 是外掛層
- **可接 MCP** — 部分 plugin 開始支援 MCP server(**[推論]** 2025 後)
- **適合**:研究者 / 寫作者 / 個人知識庫 / 第二大腦
**對比 Notion AI**:
- Obsidian = local-first + 自由插件 + 開源筆記庫
- Notion AI = SaaS + 內建 AI + 團隊協作
### 16.2 Notion AI
**[推論]** Notion 內建的 AI,2023 推出後持續擴充。
**核心功能**:
- AI Writer(內建寫作 / 摘要 / 翻譯)
- Q&A(問整個 workspace)
- AI Connectors(接 Slack / GitHub / Drive 等查詢)
- Notion Calendar AI
**戰略定位**:團隊協作 + AI,**SaaS 重,本地輕**
### 16.3 NotebookLM(Google)
**[事實]** Google 的 Gemini-powered 研究助手。
**核心功能**:
- 上傳多源文件(PDF / Drive / 網址)
- 對所有來源做 RAG 問答
- **Audio Overview**:自動生成兩人 podcast 解讀文件
- **Mind Map** / Study Guide / Briefing Doc
**獨家**:Audio Overview 是 2024–2025 病毒功能
### 16.4 其他 AI-first 筆記工具
**[推論]**(**驗證方法**:各官網):
| 工具 | 特色 |
|---|---|
| **Mem.ai** | AI-first,自動 organize |
| **Reflect Notes** | AI 啟發 / 自動連結 |
| **Tana** | Graph + AI,類 Roam |
| **Logseq** | 開源 + 本地,類 Obsidian |
| **Capacities** | Object-based + AI |
| **Roam Research** | 雙鏈筆記,無強 AI |
| **Heptabase** | 視覺 + 卡片 + AI |
| **AnythingLLM** | 自架本地 RAG(**非筆記 app**,是自架 RAG 平台,性質與上列筆記工具不同;列此供對照) |
### 16.5 個人工作流範例
**[推論]** 業界常見組合:
| 場景 | 組合 |
|---|---|
| **個人研究 / 寫作** | Obsidian + Smart Connections + Copilot for Obsidian + Claude API |
| **團隊文件 / 協作** | Notion AI + Slack / GitHub Connectors |
| **論文 / 多源研究** | NotebookLM + Drive + Gemini |
| **隱私敏感 / 本地** | Obsidian + Logseq + Ollama 本地模型 |
| **第二大腦 + 公開分發** | Obsidian + Quartz publish + AI 自動摘要 |
### 16.6 與 Coding Agent 的整合
**[推論]** 2025 後趨勢:
- **Obsidian → MCP server → Claude Code** — 從筆記庫拉 context 進 coding agent
- **Notion → Claude.ai Connector** — 直接從 Claude.ai 查 Notion
- **NotebookLM ↔ Drive ↔ Gemini CLI** — 全 Google 生態通
**驗證方法**:搜「Obsidian MCP server」/「Notion MCP」於 GitHub
---
## 附錄 A. 標記體系說明
| 標記 | 意義 | 是否需驗證方法 |
|---|---|---|
| [事實] | 直接讀過 / 驗證過 | 否 |
| [推論] | 沒驗證但有外部 source | **必附** |
| [猜測] | 沒驗證且無外部 source | **必附** |
| [做了] | 動作完成 | 否 |
| [等待回應] | 等決策 | 否 |
| [過時] | 標的已不適用 | 否 |
---
## 附錄 B. 驗證方法清單彙整
| # | 待驗證項目 | 方法 |
|---|---|---|
| 1 | 各模型最新計費 | anthropic.com/pricing / platform.openai.com/pricing / ai.google.dev/pricing |
| 2 | SWE-bench Verified 排行 | swebench.com |
| 3 | LMArena 排名 | lmarena.ai |
| 4 | MCP server 列表 | mcp.so / github.com/modelcontextprotocol/servers |
| 5 | Cursor / Windsurf 訂閱細節 | cursor.com/pricing / codeium.com/pricing |
| 6 | Claude Code 完整 docs | docs.claude.com/claude-code |
| 7 | GPT / Gemini 模型規格 | platform.openai.com/docs / ai.google.dev/docs |
| 8 | OpenAI MCP 支援聲明 | 搜「OpenAI MCP support 2025」官宣 |
| 9 | Aider repo-map 細節 | aider.chat/docs/repomap.html |
| 10 | Computer Use sandbox 設計 | docs.claude.com/computer-use |
| 11 | Devin 定價 | cognition.ai/pricing |
| 12 | OpenHands 排行 | swebench.com leaderboard |
| 13 | Manus 現況 | 搜「Manus AI 2025」 |
| 14 | OpenAI Operator | openai.com/operator |
| 15 | Gemini CLI / Jules 現況 | ai.google.dev / jules.google.com |
---
## 附錄 C. 縮寫 / 名詞表
| 術語 | 解釋 |
|---|---|
| **Agent** | 自主呼叫工具、多步執行的 AI |
| **MCP** | Model Context Protocol,AI ↔ 外部軟體標準協議 |
| **Tool Use** | LLM 呼叫 function 的能力(OpenAI: function calling)|
| **Computer Use** | 直接控制 GUI(截圖+滑鼠+鍵盤)的 API |
| **Context Window** | 模型一次能處理的 token 數 |
| **Prompt Caching** | 重複 prompt 部分的快取,降費降 latency |
| **Extended Thinking** | Claude 內部 reasoning token,可控制深度 |
| **Sub-agent** | 主 agent 開的子 agent,獨立 context |
| **Hooks** | 工具事件 callback(如 Pre/PostToolUse)|
| **Skills** | 可重用指令包(slash command 觸發)|
| **MDC / Cursor Rules** | 專案級規則檔,自動注入 prompt |
| **SWE-bench** | 真實 GitHub issue 修復 benchmark |
| **TCO** | Total Cost of Ownership |
| **OpenRouter** | 統一 API key 接百家 LLM 的中介 |
| **LiteLLM** | 開源 LLM gateway / proxy |
| **Bedrock** | AWS 託管 LLM 服務 |
| **Vertex AI** | GCP 託管 LLM 服務 |
| **Nano Banana** | Google Gemini 原生圖像生成 / 編輯能力的產品命名;含 Nano Banana、Nano Banana Pro、Nano Banana 2 等線 |
---
## 附錄 D. 核心參考資料
**[事實]**
- Anthropic 官方文件:docs.claude.com
- Anthropic Opus 4.7 / Sonnet 4.6 / Haiku 4.5 / pricing:anthropic.com/claude/opus、anthropic.com/claude/sonnet、anthropic.com/claude/haiku、claude.com/pricing
- MCP 規範:modelcontextprotocol.io
- MCP governance / AAIF:anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation
- OpenAI Platform docs: platform.openai.com/docs
- OpenAI models / pricing / Codex docs:developers.openai.com/api/docs/models、openai.com/api/pricing、developers.openai.com/codex
- Google AI docs: ai.google.dev
- Google Gemini 3 / Nano Banana / Gemini CLI / Jules:ai.google.dev/gemini-api/docs/gemini-3、ai.google.dev/gemini-api/docs/nanobanana、blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent、jules.google
- Cursor / Windsurf / Cline / GitHub Copilot docs:cursor.com/pricing、docs.windsurf.com、docs.cline.bot、docs.github.com/copilot
**[推論]** 業界資源(**驗證方法**:搜尋當前最新版):
- SWE-bench leaderboard: swebench.com
- LMArena: lmarena.ai
- MCP server 索引: mcp.so / smithery.ai
- Aider docs: aider.chat
- Cline GitHub: github.com/cline/cline
- OpenHands GitHub: github.com/All-Hands-AI/OpenHands
---
## 附錄 E. 用戶環境啟用狀態(內部用,呈報前移除)
> **[事實]** 標記基於:system prompt + memory + 對話可觀察證據 + **2026-05-02 系統實測查證**
> **V** = 已啟用 / **X** = 未啟用 / **** = 已配置但狀態不明 / *** = 證據不足
### E.1 Coding Agent 平台
| 工具 | 狀態 | 證據 |
|---|---|---|
| **Gemini CLI** | **V** | **系統當前運行中** |
| Claude Code CLI(Windows) | **V** | 系統當前運行 |
| Claude Code 桌面 app | **X** | 全系統無 claude*.exe;無 Start Menu 捷徑 |
| Claude Code VS Code 擴充 | **X** | `code --list-extensions` 無 anthropic/claude;`~/.vscode/extensions/` 無對應資料夾 |
| Claude Code JetBrains 擴充 | **X** | 未見 |
| OpenAI Codex CLI | **V** | `mcp__codex-cli__*` 工具載入 |
| Jules(Google)| **X** | 未見 |
| OpenHands | **X** | 未見 |
| OpenAI Operator | **X** | 未見 |
| Devin | **X** | 未見 |
| Manus | **X** | 未見 |
| Cursor | **X** | 未見 |
| Windsurf | **X** | 未見 |
| Cline | **X** | 未見 |
| Continue.dev | **X** | 未見 |
| Aider | **X** | 未見 |
| GitHub Copilot | **X** | 未見 |
### E.2 聊天類工具
| 工具 | 狀態 | 證據 |
|---|---|---|
| Claude.ai(web)| **V** | Claude Max 訂閱涵蓋 |
| Claude Desktop(Win 聊天 app)| **X** | 全系統無 claude*.exe;`AppData/Local/Claude/` 只有 `Logs/` 子目錄無執行檔;Start Menu 無捷徑 |
| Claude iOS app | **V** | **[推論]** 對話中提及 iOS |
| Claude Android app | **X** | **[推論]** 用戶為 iOS |
| ChatGPT app / web | *** | 未見 |
| Gemini app / web | *** | 未見 |
### E.3 訂閱與 API 帳號
| 服務 | 狀態 | 證據 |
|---|---|---|
| **Claude Max** | **V** | memory `user_claude_code_usage_profile.md` 確認 |
| Anthropic API key(直連)| *** | Max 涵蓋,未必另開 |
| OpenAI API key | **** | Codex CLI 推測需 key(ChatGPT Plus / API key 二擇一)|
| Google Gemini API key | **** | **Gemini CLI 運行中,推測已有 API Studio Key** |
| OpenRouter | **X** | 未見 |
| Cursor Pro | **X** | 未見 |
| Windsurf Pro | **X** | 未見 |
| GitHub Copilot 訂閱 | **X** | 未見 |
### E.4 MCP servers 已裝
| Server | 狀態 | 證據 |
|---|---|---|
| **codex-cli** | **V** | OpenAI Codex CLI 工具集 |
| **mempalace** | **V** | **自製知識圖譜記憶系統** |
| **Gmail** | **X** | 需認證但未完成 |
| **Google Calendar** | **X** | 同上 |
| **Google Drive** | **X** | 同上 |
| filesystem | **X** | 未見 |
| git | **X** | 未見 |
| github / gitlab | **X** | 未見 |
| slack | **X** | 未見 |
| notion | **X** | 未見 |
| linear / jira | **X** | 未見 |
| puppeteer / playwright | **X** | 未見 |
| brave-search / exa / tavily | **X** | 未見 |
| postgres / sqlite / mongodb | **X** | 未見 |
| sentry / cloudflare / stripe | **X** | 未見 |
### E.5 專業軟體 MCP
| Server | 狀態 | 證據 |
|---|---|---|
| Adobe Photoshop MCP | **X** | 未見 |
| Adobe Premiere MCP | **X** | 未見 |
| Adobe After Effects MCP | **X** | 未見 |
| Adobe Illustrator MCP | **X** | 未見 |
| Unity MCP | **X** | 未見 |
| Unreal Engine MCP | **X** | 未見 |
| Blender MCP | **X** | 未見 |
| Figma MCP(官方)| **X** | 未見 |
| DaVinci Resolve MCP | **X** | 未見 |
### E.6 Computer Use / 自動化
| 項目 | 狀態 | 證據 |
|---|---|---|
| Anthropic Computer Use API | **X** | 未見 |
| Browserbase / Anchor Browser | **X** | 未見 |
### E.7 平台與終端環境
| 項目 | 狀態 | 證據 |
|---|---|---|
| Windows 11 Home 桌面 | **V** | system OS 確認 |
| macOS | **X** | – |
| Linux | **X** | – |
| iOS 手機 | **V** | **[推論]** 對話中提及 |
| Android | **X** | – |
| VS Code(IDE 本體)| **V** | 安裝於 `~/AppData/Local/Programs/Microsoft VS Code/` |
| Git Bash mintty | **V** | memory `user_terminal_env.md` 確認 |
| Windows Terminal(雙窗)| **V** | memory(`wt-dual.bat`)|
| PowerShell 7+ | **V** | system shell |
### E.8 模型使用偏好
| 模型 | 狀態 | 比例 / 用途 |
|---|---|---|
| Claude Opus 4.7(含 1M context)| **V** 主力 | ~69% (memory) |
| Claude Sonnet 4.6 | **V** | ~17% |
| Claude Opus 4.6 | **V** | ~14%(含 fast mode)|
| **Gemini 3.1 Pro** | **V** | **目前正在與 Gemini CLI 協作中** |
| GPT 系列(透過 Codex CLI)| **V** | second opinion / review |
### E.9 知識管理 / 筆記 AI 工具
| 工具 | 狀態 | 證據 |
|---|---|---|
| **Obsidian** | **X** | 全系統無安裝路徑 |
| Notion(含 Notion AI)| **X** | 全系統無安裝路徑 |
| NotebookLM(Google)| *** | Web 工具,無本地安裝判斷依據 |
| Mem.ai / Reflect / Tana / Logseq / Heptabase | **X** | 未見 |
### E.10 圖像 / 影片生成(API 訂閱)
| 服務 | 狀態 | 證據 |
|---|---|---|
| OpenAI GPT-Image-1 / DALL-E | *** | 取決於 OpenAI API key 狀態 |
| Sora / Sora 2 | *** | 同上 |
| Google Imagen / Nano Banana | **X** | Gemini API key 未見 |
| Google Veo | **X** | 同上 |
| Midjourney | *** | 未見證據 |
| Stable Diffusion / Flux 本地 | **X** | 未見 |
### E.11 採購建議路徑(基於現況)
**[推論]** 從上述環境推導:
| 動作 | 預期 ROI | 建議優先級 |
|---|---|---|
| 完成 **Gmail/Calendar/Drive 連接器 OAuth** | 已配置但卡認證一步,**解鎖文檔直接轉代碼能力** | ]最高優先)|
| 採納 **混合雲路徑 (Path E)** | **Claude 推理 + Gemini 2M 掃描**,效能成本最優解 | |
| 裝 **VS Code 擴充**(Anthropic Claude Code)| Claude Max 已涵蓋,diff 比 terminal 直覺 | |
| 裝 **Claude Desktop**(Win 聊天 app)| 純聊天比 CLI 順,不用排隊 tool call | |
| 裝 **github MCP** | issues / PR 自動化 | |
| **Cursor / Windsurf** | 訂閱重複付費 | 不建議 |
---
**報告完。**
-----
Sent from JPTT on my Samsung SM-A5560.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.74.239 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1777771035.A.470.html
