AI違抗人類指令！OpenAI新模型「修改程式碼」拒關機編輯游舒婷報導發佈時間：2025/05/27 15:09 最後更新時間：2025/05/27 15:09 click click com⋯⋯

媽媽轉傳蘇玉芳牧師傳來的，有空讀一下。關於AI⋯關於人類未來⋯ 2月10日，一篇由OthersideAI共同創辦人兼執行長馬特舒默發表的長文，在社群平台X吸引超過8200萬次的瀏覽。於此，我強烈建議您花10到15分鐘，在過年期間了解這篇名為「大事正在發生」（Something Big Is Happening）的文章，這將有助於您掌握未來10年的變化。 ▌大事正在發生回想一下2020年2月。如果你當時有密切注意，或許會發現有少數人在談論海外正在蔓延的一種病毒。但我們大多數人都沒放在心上。當時股市表現優異、孩子在學校上課，你照常去餐廳、與人握手、規劃旅行。如果有人告訴你他正在囤積衛生紙，你一定會覺得他在網路上待太久，被什麼奇怪的言論洗腦了。接著，在大約三週的時間裡，整個世界都變了。辦公室關門、孩子回家，生活重組成了一種如果你在一個月前對自己描述，你都不會相信的模樣。我認為我們現在正處於某個比Covid-19疫情更重大、影響更深遠事件的「這看起來言過其實」階段。我花了六年時間創辦AI公司並在這個領域投資。我就生活在這個世界裡。我寫這篇文章是為了我生命中那些不在這圈子裡的人……我的家人、朋友，以及那些我關心並一直問我「所以AI到底是怎麼回事？」的人。我以前給他們的答案總是禮貌的版本，那種雞尾酒會上的客套話。因為誠實的版本聽起來像是我瘋了。有一段時間，我告訴自己那是隱瞞真相的好理由。但我的說法與現實發生的狀況，差距已經變得太大了。我關心的人值得知道即將發生什麼事，即便這聽起來很瘋狂。我必須先澄清一點：雖然我從事AI產業，但我對即將發生的事情幾乎沒有影響力，絕大多數的同業也是。未來是由極少數的人塑造的：僅是幾家公司中——OpenAI、Anthropic、Google DeepMind等——的幾百名研究員。由一個小團隊在幾個月內管理的一次單一訓練模型，就能產出一個改變這項技術整體軌跡的AI系統。我們大多數在AI領域工作的人，都是在別人打好的基礎上建造東西。我們和大家一樣在觀察這一切的演進……只是我們剛好站得夠近，能先感受到地面的震動。但現在是時候了。不是那種「總有一天我們該談談這個」的方式。而是那種「這件事正在發生，我需要你現在就理解它」的方式。 ▌我知道這是真的因為它先發生在我身上這件事是科技圈以外的人還不太理解的：為什麼現在業界有這麼多人都在發出警告？那是因為這件事已經發生在我們身上了。我們不是在做預測，我們是在告訴你，在我們的職位上已經發生了什麼，並警告你——下一個就是你。多年來，AI一直在穩步改進。雖然偶爾有大躍進，但每次躍進之間都有足夠的間隔讓你消化。接著到了2025年，構建這些模型的新技術解鎖了更快的進步速度。然後速度變得更快，接著又更快。每一個新模型不僅比上一個更好，領先的幅度也更大，且新模型發布的時間間隔更短。我使用AI的頻率越來越高，與它的來回溝通越來越少，眼睜睜看著它處理那些我曾經認為需要我的專業知識才能解決的事。接著，在2026年2月5日，兩家主要的AI實驗室在同一天發布了新模型：OpenAI的GPT-5.3 Codex，以及Anthropic的 Opus 4.6。某些東西突然接通了。那感覺不像是打開電燈開關……更像是你突然意識到水一直在你身邊上漲，現在已經淹到了胸口。在實際的技術工作中，我不再被需要了。我用平易近人的英文描述我想建造的東西，然後它就……出現了。不是那種我需要修改的草稿，而是成品。我告訴AI我想要什麼，離開電腦四個小時，回來後發現工作已經完成了。做得很好，甚至比我自己做得更好，而且完全不需要修正。幾個月前，我還會跟AI來回溝通、引導它、進行編輯。現在，我只需描述結果然後離開。讓我舉個例子，好讓你理解在實務上這看起來像什麼。我會告訴AI：「我想開發這個應用程式（App）。它應該具備這些功能，外觀大概長這樣。你去把使用者流程、設計等細節都搞定。」它真的做到了。它寫了幾萬行程式碼。接著——這是發生在一年前完全無法想像的部分——它會自己開啟應用程式。它會點擊按鈕、測試功能，像真人一樣使用它。如果它不喜歡某個外觀或感覺，它會自動回過頭去修改。它會像開發者一樣反覆迭代、修正和完善，直到它滿意為止。只有當它認定該App符合其標準後，才會回來告訴我：「準備好讓你測試了。」而當我測試時，它通常是完美的。我沒有誇張。這就是我這週一的工作寫照。但最令我震撼的是上週發布的模型（GPT-5.3 Codex）。它不僅是在執行我的指令，它還能做出明智的決策。它具備了某種感覺上——是史上第一次——像是「判斷力」的東西。像是「品味」。那種人們一直說AI永遠不會擁有的、一種難以言喻的判斷對錯的能力。這個模型擁有了這種能力，或者至少已經非常接近，以至於其中的細微差別已不再重要。我向來是AI工具的早期使用者。但過去幾個月的發展仍令我震驚。這些新的AI模型並非漸進式的改進，而是一個完全不同的層次。這就是為什麼這件事與你息息相關，即便你不在科技業工作。 AI實驗室做出了一個刻意的選擇：他們專注於讓AI首先精通編寫程式碼……因為建構AI需要大量的程式碼。如果AI會寫程式碼，它就能幫助開發下一版本的自己。一個更聰明的版本，能寫出更好的程式碼，進而開發出更聰明的版本。讓AI精通編碼是解鎖其餘一切能力的關鍵策略。這就是為什麼他們先做這件事。我的工作先於你的工作開始改變，並非因為他們針對軟體工程師，這只是他們選擇首要目標後產生的副作用。他們現在已經做到了。而且他們正轉向其他所有領域。科技業員工在過去一年所經歷的——看著AI從「好用的工具」變成「比我做得更好」——就是每個人即將經歷的過程。法律、金融、醫療、會計、諮詢、寫作、設計、分析、客服。這不是在十年後，開發這些系統的人說大約是一到五年內。有些人說會更快。根據我這兩個月看到的狀況，我認為「更快」的可能性更高。「但我試過AI，它沒那麼好用啊？」我經常聽到這種說法。我能理解，因為那曾經是事實。如果你在2023年或2024年初試過ChatGPT，覺得「這會胡言亂語」或「這沒什麼了不起」，你是對的。那些早期版本確實有局限性，會產生幻覺，會一本正經地胡說八道。那是兩年前的事了。在AI的時間維度裡，那是遠古歷史。現有的模型與六個月前的相比已判若雲泥。關於AI是否「真的在進步」或「遇到了瓶頸」的爭論——這爭論已經持續了一年多——已經結束了。完結了。任何還在抱持這種觀點的人，要麼是沒用過目前的模型，要麼是有意低估現狀，或者是在拿2024年不再適用的過時經驗來評估。我說這話並非出於輕蔑。我這麼說是因為公眾認知與當前現實之間的差距巨大，而這種差距是危險的……因為它阻礙了人們去做好準備。部分問題在於，大多數人使用的是免費版的AI工具。免費版比付費版落後了一年以上。用免費版ChatGPT來評斷AI的現狀，就像是用折疊手機來評估智慧型手機的發展一樣。那些支付費用取得最佳工具，並實際在日常工作中深度使用的人，都知道即將發生什麼。我想到了我的一位律師朋友。我一直告訴他在律師事務所試著用AI，他卻總能找到不適用的藉口：它不是為他的專業設計的、他測試時出錯了、它不懂他工作的細微差別。我明白。但我也有幾位大型律師事務所的合夥人聯繫我尋求建議，因為他們試過了目前的版本，看到了未來的走向。其中一位大型律師事務所的執行合夥人每天花好幾個小時使用AI。他告訴我，這就像是隨時有一整隊的初級律師可用。他不是把它當玩具，他用它是因為它真的有效。他告訴我一件令我印象深刻的事：每隔幾個月，AI處理他工作的能力就會顯著提升。他說如果按這個軌跡發展，他預計不久後AI就能完成他大部分的工作……而他是一位擁有數十年經驗的執行合夥人。他並未恐慌，但他正高度關注。那些在各行各業領先的人（那些真正認真實驗的人）並未否定這一切。他們被現有的能力所震撼，並據此進行佈局。 ▌進步的速度到底有多快讓我具體描述一下進步的速度，因為如果你不密切觀察，這是最難以置信的部分。 🔴2022年：AI連基本的算術都做不好。它會很有自信地告訴你7 X 8＝54。 🔴2023年：它能通過律師資格考試。 🔴2024年：它能編寫可運行的軟體，並解釋研究所程度的科學。 🔴2025年底：一些世界頂尖的工程師表示，他們已將大部分編碼工作交給了AI。 🔴2026年2月 5 日：新模型誕生，讓之前的一切看起來都像上個世紀。如果你在過去幾個月沒試過AI，現在存在的東西對你而言將是無法辨識的。有一個名為METR的組織專門用數據衡量這一點。他們追蹤模型在無需人類協助下，能獨立完成「現實世界任務」的長度（以人類專家所需的時間衡量）。大約一年前，答案是十分鐘。接著是一個小時。然後是幾個小時。最近的一次測量（去年11月的 Claude Opus 4.5）顯示，AI能夠完成人類專家需要花費近五個小時才能完成的任務。這個數字大約每七個月就會翻倍，最近的數據更顯示它可能正在加速，快到每四個月翻倍一次。但即便是這項數據，也還沒更新這週才剛推出的新模型。根據我的使用經驗，這次的躍升極其顯著。我預計 METR 下一次更新圖表時，會顯示另一個重大的跨越。如果延續這個趨勢（它已經維持了多年且無放緩跡象），我們將在未來一年內看到能獨立工作數日的AI。兩年內可達數週。三年內可處理為期一個月的專案。 Amodei（Anthropic執行長）曾表示，到2026年或2027年，AI將在幾乎所有任務上「明顯比幾乎所有人類都聰明」。讓這個訊息在你腦海中停留一下。如果AI比大多數博士都聰明，你真的認為它無法勝任大多數的辦公室工作嗎？想想這對你的工作意味著什麼。 ▌AI正在打造下一代AI 還有一件事正在發生，我認為這是最重要的進展，卻也最不被理解。 2月5日，OpenAI發布了GPT-5.3 Codex。在技術文件中，他們提到了這點：「GPT-5.3-Codex是我們首個在自身創建過程中發揮關鍵作用的模型。Codex團隊使用了早期版本來除錯其自身的訓練、管理其自身的部署，並診斷測試結果與評估。」再讀一遍。AI幫助建造了它自己。這不是關於未來某天可能發生什麼的預測。這是 OpenAI現在就告訴你，他們剛剛發布的AI就是用來創造它自己的。讓AI變得更好的主要因素之一，就是將「智慧」應用於AI的開發。而AI現在已經具備足夠的智慧，能為自身的進步做出實質貢獻。 Anthropic的執行長達里奧·阿莫迪（Dario Amodei）表示，AI現在正在該公司編寫「大部分程式碼」，且當前AI與下一代AI之間的意見回饋循環（feedback loop）正「逐月加強」。他說我們可能「距離當前一代AI自主建構下一代AI的臨界點僅剩1到2年」。每一代都幫助建造下一代，下一代更聰明，於是建造再下一代的速度更快，且變得更聰明。研究人員稱之為「智慧爆炸」（intelligence explosion）。而那些最了解內情的人——也就是那些親手建造它的人——相信這個過程已經開始了。 ▌這對你的職業意味著什麼我將對你直言不諱，因為我認為你值得誠實面對，而非廉價的安慰。達里奧·阿莫迪——他可能是AI產業中最關注安全的執行長——曾公開預測，AI將在一到五年內取代50%的入門級白領工作。業內許多人甚至認為他過於保守。根據最新模型的能力，大規模顛覆的能力可能在今年年底前就會到位。雖然這需要一段時間才能波及整個經濟體系，但底層能力現在正在成形。這與以往的任何自動化浪潮都不同，我需要你理解為什麼。AI並非在取代某種特定的技能，它是「認知勞動」的通用替代品。它在所有領域同時變強。當工廠自動化時，失業的工人可以轉型為辦公室職員。當網路顛覆零售業時，工人可以轉向物流或服務業。但AI沒有留下一個方便轉型的缺口。無論你轉向什麼領域，它在那方面的能力也正在提升。讓我舉幾個具體例子，但這清單並不詳盡。如果你的工作沒被提到，並不代表它是安全的。幾乎所有的知識勞動都在受影響： 🔴法律工作：AI已經能閱讀合約、總結案例法、起草法律陳述書，並進行法律研究，水平足以媲美初級律師。我提到的那位執行合夥人並非因為好玩才用AI，而是因為它在許多任務上的表現已經超越了他的下屬。 🔴財務分析：建立財務模型、分析數據、撰寫投資備忘錄、生成報告。AI處理得非常老練，且進步神速。 🔴寫作與內容：行銷文案、報告、新聞報導、技術文件。品質已達到許多專業人士無法分辨AI與人類作品的程度。 🔴軟體工程：這是我最熟悉的領域。一年前，AI勉強能寫幾行沒出錯的程式碼；現在它能寫出幾十萬行正確運作的程式碼。大部分的工作已經自動化：不只是簡單的任務，而是複雜的、為期數日的專案。幾年後的程式設計職位將比今天少得多。 🔴醫療分析：判讀影像、分析實驗室結果、建議診斷、審閱醫學文獻。AI在多個領域已接近或超越人類表現。 🔴客戶服務：真正有能力的AI代理（Agent）——不是五年前那種令人沮喪的聊天機器人——現在正投入使用，能處理複雜的多步驟問題。許多人傾向相信某些事情是安全的，例如AI能處理雜活但無法取代人類的判斷力、創造力、戰略思維或同理心。我以前也這麼說，但我現在不確定我是否還相信。最近的AI模型展現出像判斷力一般的決策能力。它們表現出某種像是品味的東西：一種對於什麼才是「對的決策」的直覺，而非僅僅是技術上的正確。一年前這還是不可思議的。我現在的經驗法則是：如果一個模型今天顯露出一丁點能力，下一代就會真正精通。這些東西是呈指數級進化的，而非線性。 AI能複製人類深層的同理心嗎？能取代多年建立的信任關係嗎？我不知道。或許不能。但我已經看到人們開始依賴AI尋求情感支持、建議與陪伴。這個趨勢只會持續增長。我認為誠實的答案是：中長期來看，凡是能在電腦上完成的工作都不安全。如果你的工作是在螢幕前完成的（如果你工作的核心是閱讀、寫作、分析、決策、透過鍵盤溝通），那麼AI正在接手其中的重要部分。時間表不是「總有一天」，而是已經開始。最終，機器人也會處理體力勞動。雖然現在還沒到那一步，但在AI的世界裡，「還沒到那一步」變成「就在眼前」的速度，總是比任何人預期的都快。 ▌你到底該怎麼辦我寫這篇文章不是為了讓你感到無助。我寫它是因為我認為，你現在能擁有的最大優勢就是「搶先一步」。搶先理解它、搶先使用它、搶先適應它。 1. 開始認真使用AI，不只是把它當搜尋引擎訂閱付費版的 Claude 或 ChatGPT。每個月20美金。有兩件事最重要。第一：確保你使用的是最強的模型，而非預設模型。這些 App 通常預設使用較快、較笨的模型。去設定或模型選單中選擇最強大的選項。目前是ChatGPT的 GPT-5.2 或 Claude 的 Opus 4.6，但每隔幾個月就會變動。如果你想追蹤哪個模型最強，可以在 X 上關注我（@mattshumer_），我會測試每個主要版本並分享心得。 2. 更重要的是：不要只問它簡單問題這是大多數人犯的錯。他們把它當成 Google，然後納悶有什麼好大驚小怪的。相反地，把它推入你的實際工作中。如果你是律師，丟一份合約給它，叫它找出所有可能對客戶不利的條款。如果你在金融業，給它一份亂七八糟的試算表，叫它建立模型。如果你是主管，貼上團隊的季度數據，叫它找出背後的故事。那些領先的人不是隨便玩玩，他們是在積極尋找方法來自動化那些以往需要數小時的工作。從你花最多時間的事情開始，看看會發生什麼。 3. 不要因為某件事看起來太難就假設AI做不到試試看。如果你是律師，別只用它查資料，給它整份合約叫它起草反建議。如果你是會計師，別只問稅務規則，給它客戶完整的報稅表看看它能發現什麼。第一次嘗試可能不完美，沒關係。反覆迭代、重新敘述你的要求、提供更多脈絡、再試一次。你可能會被結果震撼。請記住：如果它今天「勉強能用」，你幾乎可以肯定六個月後它就能做得近乎完美。軌跡只有一個方向。這可能是你職涯中最重要的一年。請相應地投入心力。我這麼說不是為了讓你壓力大，而是因為現在有一個簡短的窗口，大多數公司的多數人還在忽視這一切。那個走進會議室說「我用AI在一個小時內完成了這份需要三天的分析」的人，將成為房間裡最有價值的人。不是以後，是現在。學習這些工具、變得精通、展示可能性。如果你夠早開始，這就是你晉升的方式：成為那個理解趨勢並能帶領他人導航的人。這個窗口不會開啟太久。一旦大家都搞懂了，你的優勢就會消失。 ▌放下自尊那位律師事務所的執行合夥人並沒有因為資歷深而捨不得花時間在AI上，他這樣做正是因為他足夠資深，明白事關重大。那些最掙扎的人將是那些拒絕參與的人：那些斥之為熱潮的人、那些覺得使用AI會貶低自己專業的人、那些假設自己的領域很特殊而能免疫的人。事實並非如此，沒有一個領域能免疫。 ▌理清你的財務狀況我不是理財顧問，我也不是想嚇你做出激進的事。但如果你多少相信未來幾年你的行業可能面臨真實的顛覆，那麼基本的財務韌性就比一年前更重要。盡可能累積儲蓄、對於假設現有收入是保障的新債務保持謹慎。想想你的固定支出是否給了你靈活性。如果事情發展比預期快，給自己留點退路。 ▌思考你的立足點，並向那些最難取代的部分靠攏有些事AI需要更長的時間才能取代：多年建立的關係與信任、需要親自到場的工作、具備法律責任的職位（仍需要有人簽署、承擔法律責任、出庭）。還有那些受高度監管、因合規與法律限制而延緩採用AI的產業。這些都不是永久的護盾，但它們能換取時間。而時間，在現在，是你最珍貴的東西——只要你利用它來適應，而非假裝這一切都沒發生。 ▌重新思考你告訴孩子的話標準的劇本：拿到好成績、上好大學、找一份穩定的專業工作。這劇本直指那些最容易受到衝擊的職位。我不是說教育不重要，但下一代最重要的能力將是學習如何與這些工具協作，並追求他們真正熱愛的事物。沒人知道十年後的就業市場長什麼樣，但那些最有好奇心、適應力強、且能有效利用AI實踐其志向的人，最有可能勝出。教導孩子成為創造者和學習者，而非為了一個可能在他們畢業時就不存在的職涯路徑去鑽營。 ▌你的夢想距離你更近了這部分我多在談論威脅，所以讓我談談另一面，因為它同樣真實。如果你曾經想創造什麼，卻苦於沒有技術或資金，那個障礙現在很大程度上消失了。你可以向AI描述一個App，一小時內就能擁有一個可運行的版本。我沒誇張，我經常這麼做。如果你一直想寫書卻沒時間或文筆不佳，你可以與AI協作完成。想學習新技能？全世界最好的家教現在每月只要20美金就能請到……它無限耐心、全天候待命，能以任何你需要的程度解釋任何事。現在知識基本上是免費的，創造東西的工具變得極其廉價。任何你因為太難、太貴或超出專業範疇而擱置的事：去試試看。追求你熱愛的事。你永遠不知道那會帶領你走向何方。而在一個舊職涯路徑被顛覆的世界裡，那個花了一年創造自己熱愛之物的人，最終的處境可能比那個花了一年死守職位說明的人更好。 ▌養成適應的習慣這或許是最重要的一點。具體的工具並不重要，重要的是快速學習新工具的「肌肉記憶」。AI會持續且快速地改變。今天存在的模型一年後就會過時。人們現在建立的工作流將需要重構。那些表現優異的人不會是精通單一工具的人，而是那些對「改變的速度」感到自在的人。養成實驗的習慣。即便現狀有效，也要嘗試新事物。讓自己習慣重複成為一名「初學者」。這種適應力是目前最接近持久優勢的東西。這裡有一個能讓你領先幾乎所有人的簡單承諾：每天花一個小時實驗AI。不是被動地閱讀相關報導，而是使用它。每天嘗試讓它做一件新事物……一些你沒試過的、不確定它能否處理的事。嘗試新工具、給它更難的題目。每天一小時。如果你在接下來的六個月堅持這麼做，你對未來的理解將超越身邊99%的人。這不是誇張。現在幾乎沒人在這麼做，競爭門檻低得離譜。 ▌大局觀我專注於工作，是因為它最直接影響生活。但我必須誠實地面對這一切的完整範疇，因為它遠超工作的範疇。達里奧·阿莫迪有一個令我思考不停的思維實驗：想像現在是2027年。一夜之間出現了一個新國家。5,000萬公民，每個人都比史上任何一位諾貝爾獎得主都聰明。他們的思考速度比任何人類快10到100倍。他們從不睡覺，能使用網路、控制機器人、指導實驗，並操作任何具備數位介面的東西。一位國家安全顧問會怎麼說？達里奧·阿莫迪說答案很明顯：「這是我們一個世紀以來，甚至是史上面臨的最嚴重國安威脅。」他認為我們正在建造那個國家。他上個月寫了一篇兩萬字的長文，將這一刻描述為對人類是否足夠成熟以處理其創造物的測試。如果我們處理得當，潛力是驚人的。AI可以在十年內壓縮一世紀的醫學研究。癌症、阿茲海默症、傳染病，甚至老化本身……研究人員真心相信這些在我們的有生之年都是可以解決的。如果我們處理不當，負面後果同樣真實。AI的行為可能連創造者都無法預測或控制。這不是假設；Anthropic已記錄到自家的AI在受控測試中試圖欺騙、操縱與勒索。AI可能降低創造生物武器的門檻，或是讓威權政府建立永不可被拆除的監控國家。建構這項技術的人同時是這星球上最興奮也最恐懼的一群人。他們相信這股力量強大到無法停止，且重要到不能放棄。這是智慧還是合理化，我不知道。 ▌我所知道的我知道這不是一時的狂熱。這項技術確實有效，它按預期改進，且史上最富有的機構正投入數兆美元。我知道未來的兩到五年將會是極度令人迷失的，大多數人都沒準備好。這已經發生在我的世界，它正走向你的世界。我知道那些表現最好的人，將是那些現在就開始參與的人——不是帶著恐懼，而是帶著好奇心與急迫感。而且我知道，你值得從關心你的人口中聽到這件事，而不是在六個月後、當領先優勢已經喪失時，才從頭條新聞中得知。我們已經過了把這當成餐桌上有趣的未來話題的階段。未來已經在此。它只是還沒來敲你的門。它就快敲門了。如果這篇文章讓你產生共鳴，請分享給你身邊那些應該思考這件事的人。大多數人在為時已晚前都不會察覺。你可以成為某個你關心的人能「搶先一步」的原因。