微軟Copilot 程式設計實測 大輸ChatGPT
編譯/黃竣凱
外媒在根據四項嚴格評估標準對微軟的Copilot 進行了重新測試後,發現結果令人失望。 總體而言,儘管取得了所謂的進步,但它未能通過任何評估,相較之下,ChatGPT、Meta AI、Meta Llama 和 Google Gemini Advanced 等其他AI模型則取得了一些成功。
編寫 WordPress 外掛程式
當外媒要求 Copilot 編寫 WordPress 外掛程式時,相較於提供更全面輸出的 ChatGPT,Copilot 的程式碼包含嚴重缺陷,顯示缺乏對 WordPress 程式碼標準的了解。
- 微軟Copilot:介面:足夠/功能:失敗
- ChatGPT:介面:良好/功能:良好
- Google Gemini Advanced:介面:良好/功能:失敗
- Meta AI:介面:足夠/功能:失敗
- Meta Llama:徹底失敗
更多新聞:比ChatGPT更強 使用微軟Copilot的7大理由
重寫字串函數
在此測試中,Copilot 嘗試重寫字串函數,並展示了一些錯誤檢查功能,但缺乏徹底的驗證,可能會導致未來的程式設計問題。相較之下,ChatGPT 的解決方案在確保嚴格的資料完整性方面表現更好。
- 微軟Copilot:失敗
- ChatGPT:成功
- Google Gemini Advanced:失敗
- Meta AI:失敗
- Meta Llama:成功
發現惱人的錯誤
Copilot 未能識別出細微的程式碼問題,凸顯了其在複雜問題解決方面的局限性,甚至還叫外媒,「考慮向外掛程式開發人員或社群論壇尋求支援」,與 ChatGPT 對問題的敏銳把握形成鮮明對比。
- 微軟Copilot:失敗
- ChatGPT:成功
- Google Gemini Advanced:失敗
- Meta AI:成功
- Meta Llama:失敗
編寫腳本
Copilot 無法產生涉及 Keyboard Maestro、AppleScript 和 Chrome API 的腳本,這凸顯了其在處理複雜、專業任務方面的缺陷令人失望。
- 微軟Copilot:失敗
- ChatGPT:成功
- Google Gemini Advanced:成功
- Meta AI:失敗
- Meta Llama:失敗
4項測試的整體結果
- 微軟Copilot:4 次中 0 次成功
- Meta AI:4 次中有 1 次成功
- Meta Llama:4 次中有 1 次成功
- Google Gemini Advanced:4 次中有 1 次成功
- ChatGPT:4 次成功
參考資料:zdnet
瀏覽 588 次