OpenAI 今天 (4/15) 凌晨發表最新的 GPT 4.1 模型,AI 開發工具 Windsurf 隨即宣布提供支援,並且針對所有使用者開放免費使用,使用者可以在介面中選擇使用最新的 GPT 4.1 模型進行開發輔助工作。
根據 Windsurf 最新的公告,在 4/14~4/21 這一週的時間中,所有人 (包含免費使用者) 都可以免費使用最新的 GPT 4.1 模型,享受目前 Open AI 開發能力最強的 AI 模型。
註冊 Windsurf 會員 (可以免費獲得 500 積分)
使用最新的 GPT 4.1 模型需要更新到最新版的 Windsurf,更新完成後就可以在 Cascade 對話框下方選取這個新模型。
新模型 GPT 4.1 重點特色
寫程式更上手:程式能力大進化
這次 GPT-4.1 在 SWE-bench Verified benchmark 上拿下了 54.6% 的分數,比前一代 GPT-4o 提升了整整 21.4%,甚至還超過 GPT-4.5 的成績。如果你平常會用 AI 幫你除錯、寫程式,這次的升級保證會讓你省下更多頭髮!
更會聽指令:指令理解力大幅提升
根據 Scale 的 MultiChallenge benchmark,GPT-4.1 的得分來到 38.3%,比 GPT-4o 提高了 10.5%。也就是說,它現在不只是聽得懂你的話,還能更準確地照做,減少你來回修改的次數。
看影片也能懂:長影片理解力創新高
在需要理解「無字幕影片」的 Video-MME benchmark 上,GPT-4.1 拿下了 72% 的高分,這在業界是目前的最佳成績,比 GPT-4o 還高出 6.7%。影像與語意整合能力大大升級。
輕量有力:GPT-4.1 Mini
GPT-4.1 Mini 是這次發布的「中杯尺寸」版本,雖然不是最強的,但勝在 速度快、成本低,而且表現還跟 GPT-4o 差不多。根據官方資料,Mini 版的 延遲時間減半,價格下降 83%,對於需要效能又想省預算的開發者來說,是一個超划算的選擇。
最迷你的幫手:GPT-4.1 Nano
如果你需要的是一個反應快速、超省資源的 AI 幫手,那 GPT-4.1 Nano 你一定要認識。這個小巧的模型,特別適合做一些簡單任務,例如 分類、補字、自動補全 等,不過別看它小,還是能在一些基準測試中展現不錯的實力:
- MMLU(多科目理解測試):80.1%
- GPQA(科學推理):50.3%
- Aider polyglot coding(多語系編碼):9.8%