前言
2025 年 9 月 15 日,OpenAI 發布了 GPT-5 Codex,此模型是基於 GPT-5 架構並針對程式開發任務進行優化的專用版本。此次更新被視為 Codex 模型的一次重大升級,其核心能力從程式碼輔助產生,擴展至具備自主規劃、執行與測試能力的 AI 驅動開發框架。
以下是 OpenAI 新發布的 AI 程式設計模型 GPT-5 Codex 的重點摘要與內容分析。
從複製貼上到 Vibe Coding:開發模式的演進
傳統上,當開發者需要大語言模型的幫助時,流程往往是在 IDE 中撰寫程式碼,遇到問題時,再將程式碼片段複製到 GPT-5 等模型的網頁介面中進行詢問,取得解答後,再將建議的程式碼貼回 IDE 進行編譯與測試。這個過程充滿了上下文切換的摩擦成本。
先前曾提到《使用 GitHub Copilot 的代理模式以提升撰寫程式的效率與開發體驗》,說明了如何將 AI 程式輔助工具整合至 IDE 中。其特性在於開發者能直接在 IDE 環境內,透過對話或指令詢問 AI 如何修正或產生程式碼,並授與 AI 編輯權限,由 AI 直接修改後,開發者再進行核查。這種模式被稱為 Vibe coding,是目前與未來主流的 AI 協作開發方式。
GPT-5 Codex 提出的生態系工具正是此模式的延伸與深化。
市場競爭格局與工具比較
GPT-5 Codex 的推出,使其直接進入了競爭激烈的 AI 程式開發工具市場。其主要對標的產品如下表所示,包括 Anthropic 的 Claude Code、微軟的 GitHub Copilot、Cursor IDE 等:
工具 | 價格(核心計價) | 正式發布時間 |
---|---|---|
GPT-5 Codex | Plus: USD 20/月;Pro: USD 200/月 | 2025-09-15 |
GitHub Copilot (Microsoft) | 個人 Pro:約 USD 10/月;Business 約 USD 19/使用者/月。可額外購買 Premium Request。 | 2022-06-21 |
Anthropic — Claude Code | Pro:約 USD 17/月(年繳 USD 200);Max(高階)約 USD 100/人/月。另有 Team/Enterprise 套餐。 | 2025-05-22 |
Cursor | Basic: USD 0;Pro 約 USD 20/月;Teams 約 USD 40/使用者/月;Ultra 為 USD 200/月高用量方案。另有 Bugbot 套件。 | 2023-03-14 |
Qodo Gen (Qodo) | Developer: USD 0(有限額);Teams 約 USD 19–30/使用者/月;Enterprise 為客製報價。 | 2024-03-22 |
Google — Jules | Free tier: USD 0(每日任務上限 15、並發任務上限 3); Pro(含 Google AI Pro 訂閱):USD 19.99/月; Ultra(含 Google AI Ultra):USD 124.99/月。 | 2025-08-06 |
在 VS Code 中安裝並使用 Codex
除了 VS Code,Codex 也支援 Cursor、Windsurf 或是其他 VS Code 相容編輯器。
目前官方說明到 Codex VS Code 擴充功能在 macOS 與 Linux 提供;而在 Windows 支援仍屬實驗性,目前在 Windows 上最佳體驗為透過 Windows Subsystem for Linux (WSL) 使用。
首先到官方頁下載:Codex – OpenAI’s coding agent
下載後,點選 VS Code 左方的 Codex 按鈕(OpenAI 的圖示),會出現 Codex 得頁面,點擊 Sign in with ChatGPT 跳出登入選項,我們照著登入即可。
跳轉到網頁,會說明需要授權相關權限。
授權後,回到 VS Code 中,已經可以正常且開始使用。這邊與 Github Copilot 基本使用上是一致的。
Codex 相關設定
核准模式(Approval modes)
Chat 模式(只聊天)
- 能力:僅限對話、程式碼解說、建議、不會自動修改檔案或執行命令。
- 風險:最低(不會改動專案)、適合教學、規劃或安全敏感情境。
- 使用情境:想先討論設計或取得建議、不希望自動變更程式碼。
Agent(預設)
- 能力:可讀取檔案、在 working directory 自動編輯與執行命令;若需「working directory 以外」或「網路存取」,會請使用者逐次核准。
- 風險:中等 — 在專案目錄內的自動操作可提高效率,但仍需注意不經核准的外部操作會被阻擋。
- 使用情境:日常開發、自動修 bug、重構檔案、執行測試指令,且願意在風險點逐步批准。
Agent (Full Access)
- 能力:可完全自動讀寫檔案、執行命令並存取網路(無需每次核准)。
- 風險:最高 — 有資料外洩或誤執行敏感命令的潛在風險。
- 使用情境:高度信任環境(例如 sandbox、CI runner、或對象為非敏感專案),需最大自動化。
實務建議(權衡)
- 開發初期或處理未知/敏感專案:使用 Chat 或 Agent(預設),並保留逐步核准。
- 在 CI 或封閉自動化環境:若經風險評估,可考慮 Agent (Full Access) 並加上監控與審計(log)。
- 必要時限制網路或外部工具存取,並定期檢查 Codex 變更紀錄與 commit diff。
Codex 提供的 Model 差異
GPT-5
- 角色:通用大型模型,適合廣泛語境下的程式碼與語言任務。
- 優勢:通用性高、能處理多樣任務。
- 欠缺:若需針對 agentic coding(自動修改、執行)最佳化的行為,可能不如專門優化模型。
GPT-5 Codex(建議用於 Codex)
- 角色:為 Codex 中針對程式碼編輯、執行與 agentic 操作做優化的版本。
- 優勢:在程式碼理解、產生、變更建議與執行序列的可靠度與一貫性上通常更佳;推薦用於需要自動化修改與執行的場景。
- 欠缺:可能在某些非程式碼語言任務上與 default 差異不大;可能略較耗時(視 reasoning 設定)。
切換模型的使用場景建議
- 以 GPT-5 Codex 作為首選,當工作以自動修改、執行測試、或複雜重構為主。
- 以 GPT-5 作為備選,若只是做高層設計討論或自然語言類任務,且偏好回應速度。
Reasoning Effort(推理努力)
- Low(低):回應速度最快,但深度較淺。適合簡單修改、快速建議或大量短交互。
- Medium(中):平衡速度與深度。一般開發建議的常用設定。
- High(高):對較複雜問題或要自動產生多步驟執行序(例如:跨多檔案重構、複雜修補)的情境更可靠,但回應時間較長。
建議:日常使用 Medium;需執行複雜自動化任務時切到 High;大量短交互或編輯回饋時選 Low 以提速。
實務設定與最佳實踐
- IDE 與平台:macOS / Linux 為最佳體驗;Windows 使用 WSL 或視為實驗性。
- 認證:優先使用 ChatGPT 帳號登入以取得配套使用額度;需用 API key 時確保金鑰與環境變數安全存放。
- 權限管理:預設使用 Agent(需核准外部動作),只在受控環境啟用 Full Access。
- 模型選擇:以 GPT-5 Codex 為首選(coding agent),在需要快與簡短建議時切回 GPT-5。
- Reasoning:Medium → High(複雜任務),Low(快速互動)。
- 審查流程:即便開啟自動修改,仍保留 commit diff / PR 審查與測試流程。
- 日誌與回溯:啟用並保存 Codex 的操作記錄(commands、檔案修改、執行輸出)以利稽核。
為 Codex 代理撰寫提示
要讓 Codex 發揮最大效能,下達清晰具體的指令是關鍵。
如果沒辦法下達具體指標,也可以先透過其他 LLM 產生具體的 PROMPT,再交由 Codex 進行分析、處理。
另外,明確指出程式碼與限制範圍也很重要。例如,使用「@」符號可以決定輸入檔案,讓 Codex 直接針對提供的檔案進行分析。
也可以同時附上驗證步驟,助於它確認工作正確性。將複雜的大任務拆解成數個小步驟,能提升處理效能與檢視效率。在除錯時,直接貼上詳細的錯誤日誌,Codex 也能協助分析並找出根本原因。
除了具體的任務指令,還能進一步客製化 Codex 的工作方式。明確要求它遵循特定流程、使用或避開某些工具,或依照指定範本產生訊息。一個重要的技巧是,指示 Codex 將特定檔案(如 AGENTS.md
)視為包含特殊規則的設定檔,藉此引導其執行策略。此外,嘗試開放式的問題,也能讓它協助進行程式碼清理、腦力激盪或撰寫文件等創造性工作。
在 Codex 中使用 AGENTS.md
前一節提到,透過 AGENTS.md
檔案引導 AI 代理是個重要的技巧。這個概念的興起,正是為了應對像 GPT-5 Codex 這樣具備高度自主性的代理工具所帶來的挑戰與機會。
AGENTS.md 可以被理解為 「專為 AI 代理設計的 README.md」。當 README.md 是寫給人類開發者看的專案指南時,AGENTS.md 則是提供給 Codex 這類工具的 機器可讀操作手冊 (Machine-Readable Operations Manual)。它將專案的隱性知識(Implicit Knowledge)——例如如何設定環境、執行測試、程式碼風格——轉化為 AI 可直接遵循的明確指令。
這對於 GPT-5 Codex 的代理模式尤其關鍵。當開發者下達一個高階指令,例如「重構使用者登入模組並確保測試通過」,Codex 不再只是猜測,而是會查閱 AGENTS.md 來執行以下任務:
- 專案設定 (Project Setup):知道要用 pnpm install 安裝依賴。
- 開發規範 (Development Guidelines):確保程式碼遵循 Next.js 14+ 框架、啟用 TypeScript Strict Mode,並使用 Tailwind CSS 進行樣式設計,而非傳統 CSS。
- 建置與測試 (Build & Test):在修改後執行 pnpm lint 與 pnpm test 來驗證程式碼品質與功能正確性。
- 提交拉取請求 (Pull Request):遵循 Conventional Commits 規範來產生提交訊息。
以下是一個符合上述情境的 AGENTS.md 範例:
|
|
Codex 隱私說明
商務用戶保護
預設情況下,OpenAI 不會使用商務用戶(包含 ChatGPT 商務版、ChatGPT 企業版 及 API)的輸入或輸出資料來改進模型。
一般用戶設定
一般用戶的對話內容 可能會用於改進模型。
若不希望資料被用於訓練,請前往 ChatGPT → 設定中關閉 為所有人改善模型。
結論
GPT-5 Codex 的發布,標誌著 AI 程式設計工具從「輔助生成」正式邁向「代理驅動開發」的典範轉移。其核心價值不僅是程式碼產出品質,更在於其自主規劃與執行任務的框架能力。透過可配置的權限模式與 AGENTS.md
這類機器可讀的指令文件,Codex 將開發流程中需要人工介入的步驟轉化為可自動執行的工作流。
從商業模式與市場競爭來看,Codex 最大的吸引力在於整合了現有的 ChatGPT 訂閱體系,讓已付費的用戶無需額外訂閱 GitHub Copilot。其初期使用限制,對比其他成熟產品也相對寬鬆(Plus: 30~150/5 小時;Pro, Business: 300-1,500/5 小時)。
就我個人體驗與開發流程整合度而言,市場上更成熟的 GitHub Copilot 在便利性上是我更推崇的。未來市場的焦點,將在於 OpenAI 如何迭代 Codex 的使用者體驗、縮小與競品的便利性差距,並發揮其獨特的代理框架優勢。開發者社群將持續關注其後續的調整與功能擴展,期待它為自動化開發帶來更多可能性。