在 VS Code 使用 GPT-5 Codex 並建立 Agent 化工作流

前言

2025 年 9 月 15 日，OpenAI 發布了 GPT-5 Codex，此模型是基於 GPT-5 架構並針對程式開發任務進行優化的專用版本。此次更新被視為 Codex 模型的一次重大升級，其核心能力從程式碼輔助產生，擴展至具備自主規劃、執行與測試能力的 AI 驅動開發框架。

以下是 OpenAI 新發布的 AI 程式設計模型 GPT-5 Codex 的重點摘要與內容分析。

氛圍程式設計

傳統上，當開發者需要大語言模型的幫助時，流程往往是在 IDE 中撰寫程式碼，遇到問題時，再將程式碼片段複製到 GPT-5 等模型的網頁介面中進行詢問，取得解答後，再將建議的程式碼貼回 IDE 進行編譯與測試。這個過程充滿了上下文切換的摩擦成本。

先前曾提到《使用 GitHub Copilot 的代理模式以提升撰寫程式的效率與開發體驗》，說明了如何將 AI 程式輔助工具整合至 IDE 中。其特性在於開發者能直接在 IDE 環境內，透過對話或指令詢問 AI 如何修正或產生程式碼，並授與 AI 編輯權限，由 AI 直接修改後，開發者只要再進行核查。這種模式被稱為 Vibe coding，是目前與未來主流的 AI 協作開發方式。

GPT-5 Codex 提出的生態系工具正是此模式的延伸與深化。

市場競爭格局與工具比較

GPT-5 Codex 的推出，使其直接進入了競爭激烈的 AI 程式開發工具市場。其主要對標的產品如下表所示，包括 Anthropic 的 Claude Code、微軟的 GitHub Copilot、Cursor IDE 等：

工具	價格（核心計價）	正式發布時間
GPT-5 Codex	Plus: USD 20/月；Pro: USD 200/月	2025-09-15
GitHub Copilot (Microsoft)	個人 Pro：約 USD 10/月；Business 約 USD 19/使用者/月。可額外購買 Premium Request。	2022-06-21
Anthropic — Claude Code	Pro：約 USD 17/月（年繳 USD 200）；Max（高階）約 USD 100/人/月。另有 Team/Enterprise 套餐。	2025-05-22
Cursor	Basic: USD 0；Pro 約 USD 20/月；Teams 約 USD 40/使用者/月；Ultra 為 USD 200/月高用量方案。另有 Bugbot 套件。	2023-03-14
Qodo Gen (Qodo)	Developer: USD 0（有限額）；Teams 約 USD 19–30/使用者/月；Enterprise 為客製報價。	2024-03-22
Google — Jules	Free tier: USD 0（每日任務上限 15、並發任務上限 3）； Pro（含 Google AI Pro 訂閱）：USD 19.99/月； Ultra（含 Google AI Ultra）：USD 124.99/月。	2025-08-06

在 VS Code 中安裝並使用 Codex

除了 VS Code，Codex 也支援 Cursor、Windsurf 或是其他 VS Code 相容編輯器。

目前官方說明到 Codex VS Code 擴充功能在 macOS 與 Linux 提供；而在 Windows 支援仍屬實驗性，目前在 Windows 上最佳體驗為透過 Windows Subsystem for Linux (WSL) 使用。

首先到官方頁下載：Codex – OpenAI’s coding agent

Codex 擴充於 VS Code 市集頁面

下載後，點選 VS Code 左方的 Codex 按鈕（OpenAI 的圖示），會出現 Codex 得頁面，點擊 Sign in with ChatGPT 跳出登入選項，我們照著登入即可。

Codex 登入選項（VS Code）

跳轉到網頁，會說明需要授權相關權限。

Codex 網頁授權提示

授權後，回到 VS Code 中，已經可以正常且開始使用。這邊與 Github Copilot 基本使用上是一致的。

Codex 主介面

Codex 相關設定

核准模式（Approval modes）

模式選擇

Chat 模式（只聊天）
- 能力：僅限對話、程式碼解說、建議、不會自動修改檔案或執行命令。
- 風險：最低（不會改動專案）、適合教學、規劃或安全敏感情境。
- 使用情境：想先討論設計或取得建議、不希望自動變更程式碼。
Agent（預設）
- 能力：可讀取檔案、在 working directory 自動編輯與執行命令；若需「working directory 以外」或「網路存取」，會請使用者逐次核准。
- 風險：中等 — 在專案目錄內的自動操作可提高效率，但仍需注意不經核准的外部操作會被阻擋。
- 使用情境：日常開發、自動修 bug、重構檔案、執行測試指令，且願意在風險點逐步批准。
Agent (Full Access)
- 能力：可完全自動讀寫檔案、執行命令並存取網路（無需每次核准）。
- 風險：最高 — 有資料外洩或誤執行敏感命令的潛在風險。
- 使用情境：高度信任環境（例如 sandbox、CI runner、或對象為非敏感專案），需最大自動化。

實務建議（權衡）
開發初期或處理未知/敏感專案：使用 Chat 或 Agent（預設），並保留逐步核准。
在 CI 或封閉自動化環境：若經風險評估，可考慮 Agent (Full Access) 並加上監控與審計（log）。
必要時限制網路或外部工具存取，並定期檢查 Codex 變更紀錄與 commit diff。

Codex 提供的 Model 差異

模型選擇

GPT-5
- 角色：通用大型模型，適合廣泛語境下的程式碼與語言任務。
- 優勢：通用性高、能處理多樣任務。
- 欠缺：若需針對 agentic coding（自動修改、執行）最佳化的行為，可能不如專門優化模型。
GPT-5 Codex（建議用於 Codex）
- 角色：為 Codex 中針對程式碼編輯、執行與 agentic 操作做優化的版本。
- 優勢：在程式碼理解、產生、變更建議與執行序列的可靠度與一貫性上通常更佳；推薦用於需要自動化修改與執行的場景。
- 欠缺：可能在某些非程式碼語言任務上與 default 差異不大；可能略較耗時（視 reasoning 設定）。

切換模型的使用場景建議
以 GPT-5 Codex 作為首選，當工作以自動修改、執行測試、或複雜重構為主。
以 GPT-5 作為備選，若只是做高層設計討論或自然語言類任務，且偏好回應速度。

Reasoning Effort（推理努力）

Low（低）：回應速度最快，但深度較淺。適合簡單修改、快速建議或大量短交互。
Medium（中）：平衡速度與深度。一般開發建議的常用設定。
High（高）：對較複雜問題或要自動產生多步驟執行序（例如：跨多檔案重構、複雜修補）的情境更可靠，但回應時間較長。

建議：日常使用 Medium；需執行複雜自動化任務時切到 High；大量短交互或編輯回饋時選 Low 以提速。

實務設定與最佳實踐

IDE 與平台：macOS / Linux 為最佳體驗；Windows 使用 WSL 或視為實驗性。
認證：優先使用 ChatGPT 帳號登入以取得配套使用額度；需用 API key 時確保金鑰與環境變數安全存放。
權限管理：預設使用 Agent（需核准外部動作），只在受控環境啟用 Full Access。
模型選擇：以 GPT-5 Codex 為首選（coding agent），在需要快與簡短建議時切回 GPT-5。
Reasoning：Medium → High（複雜任務），Low（快速互動）。
審查流程：即便開啟自動修改，仍保留 commit diff / PR 審查與測試流程。
日誌與回溯：啟用並保存 Codex 的操作記錄（commands、檔案修改、執行輸出）以利稽核。

為 Codex 代理撰寫提示

要讓 Codex 發揮最大效能，下達清晰具體的指令是關鍵。

如果沒辦法下達具體指標，也可以先透過其他 LLM 產生具體的 PROMPT，再交由 Codex 進行分析、處理。

另外，明確指出程式碼與限制範圍也很重要。例如，使用「@」符號可以決定輸入檔案，讓 Codex 直接針對提供的檔案進行分析。

也可以同時附上驗證步驟，助於它確認工作正確性。將複雜的大任務拆解成數個小步驟，能提升處理效能與檢視效率。在除錯時，直接貼上詳細的錯誤日誌，Codex 也能協助分析並找出根本原因。

除了具體的任務指令，還能進一步客製化 Codex 的工作方式。明確要求它遵循特定流程、使用或避開某些工具，或依照指定範本產生訊息。一個重要的技巧是，指示 Codex 將特定檔案（如 AGENTS.md）視為包含特殊規則的設定檔，藉此引導其執行策略。此外，嘗試開放式的問題，也能讓它協助進行程式碼清理、腦力激盪或撰寫文件等創造性工作。

在 Codex 中使用 AGENTS.md

前一節提到，透過 AGENTS.md 檔案引導 AI 代理是個重要的技巧。這個概念的興起，正是為了應對像 GPT-5 Codex 這樣具備高度自主性的代理工具所帶來的挑戰與機會。

AGENTS.md 可以被理解為「專為 AI 代理設計的 README.md」。當 README.md 是寫給人類開發者看的專案指南時，AGENTS.md 則是提供給 Codex 這類工具的機器可讀操作手冊 (Machine-Readable Operations Manual)。它將專案的隱性知識（Implicit Knowledge）——例如如何設定環境、執行測試、程式碼風格——轉化為 AI 可直接遵循的明確指令。

這對於 GPT-5 Codex 的代理模式尤其關鍵。當開發者下達一個高階指令，例如「重構使用者登入模組並確保測試通過」，Codex 不再只是猜測，而是會查閱 AGENTS.md 來執行以下任務：

專案設定 (Project Setup)：知道要用 pnpm install 安裝依賴。
開發規範 (Development Guidelines)：確保程式碼遵循 Next.js 14+ 框架、啟用 TypeScript Strict Mode，並使用 Tailwind CSS 進行樣式設計，而非傳統 CSS。
建置與測試 (Build & Test)：在修改後執行 pnpm lint 與 pnpm test 來驗證程式碼品質與功能正確性。
提交拉取請求 (Pull Request)：遵循 Conventional Commits 規範來產生提交訊息。

以下是一個符合上述情境的 AGENTS.md 範例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# AGENTS.md

## 專案設定 (Project Setup)

-   安裝依賴: `pnpm install`
-   啟動開發伺服器: `pnpm dev`

---
## 建置與測試 (Build & Test)

-   生產環境建置: `pnpm build`
-   執行單位測試: `pnpm test`
-   程式碼風格檢查: `pnpm lint`

## 開發規範 (Development Guidelines)

-   框架版本: Next.js 14+ / React 18+
-   Node.js 版本: v20.x (請遵循 `.nvmrc` 檔案設定)
-   樣式:
    -   必須使用 Tailwind CSS 進行樣式設計。
    -   禁止在專案中撰寫傳統 CSS 檔案 (`.css`, `.scss`) 或使用 CSS-in-JS。
    -   共用元件應放置於 `/components` 目錄。
-   語法:
    -   必須啟用 TypeScript 的 `Strict Mode`。
    -   使用 `ESLint` 與 `Prettier` 進行程式碼格式化，遵循專案內的設定檔。

## 提交拉取請求 (Pull Request)

-   標題格式: 遵循 Conventional Commits 規範 (例如: `feat: 新增按鈕元件`)。
-   提交前檢查: 提交前務必在本機執行 `pnpm lint` 與 `pnpm test` 並確保所有檢查通過。

Codex 隱私說明

商務用戶保護
預設情況下，OpenAI 不會使用商務用戶（包含 ChatGPT 商務版、ChatGPT 企業版及 API）的輸入或輸出資料來改進模型。
一般用戶設定
一般用戶的對話內容可能會用於改進模型。
若不希望資料被用於訓練，請前往 ChatGPT → 設定中關閉為所有人改善模型。

如何關閉 ChatGPT 資料訓練

結論

GPT-5 Codex 的發布，標誌著 AI 程式設計工具從「輔助生成」正式邁向「代理驅動開發」的典範轉移。其核心價值不僅是程式碼產出品質，更在於其自主規劃與執行任務的框架能力。透過可配置的權限模式與 AGENTS.md 這類機器可讀的指令文件，Codex 將開發流程中需要人工介入的步驟轉化為可自動執行的工作流。

從商業模式與市場競爭來看，Codex 最大的吸引力在於整合了現有的 ChatGPT 訂閱體系，讓已付費的用戶無需額外訂閱 GitHub Copilot。其初期使用限制，對比其他成熟產品也相對寬鬆（Plus: 30~150/5 小時；Pro, Business: 300-1,500/5 小時）。

就我個人體驗與開發流程整合度而言，市場上更成熟的 GitHub Copilot 在便利性上是我更推崇的。未來市場的焦點，將在於 OpenAI 如何迭代 Codex 的使用者體驗、縮小與競品的便利性差距，並發揮其獨特的代理框架優勢。開發者社群將持續關注其後續的調整與功能擴展，期待它為自動化開發帶來更多可能性。