2026年5月26日 星期二

軟體工程師不會被 AI 取代,但是角色和能力正在改變


這幾年 AI agent 把寫 code 這件事從工程師的核心動作,變成可以指派出去的步驟。寫 code 不會消失,但它從工程師最大的時間花費,退到日常輸入的一部分。當這件事發生,工程師的價值點會跟著移位。我想從技術、角色、context engineering、能力四個面向,講這個位移是怎麼發生的。


過去幾十年我們評斷一段 code 寫得好不好看三件事:效率、正確性、可讀性。這三件事的隱含主詞都是人,跑這段 code 的機器要快、邏輯要對、未來接手的同事要看得懂,團隊協作的成本決定了這些判準。但現在最先接手這段 code 的對象經常是 AI。它要讀懂你寫了什麼、知道你想做什麼、然後往下延伸或重寫。code 的好壞因此多了一條判準:你給 AI 的東西能不能讓它正確接手。


這條判準的重點落在 code 之外的那份文件。spec-driven 開發在這裡變得關鍵。一份寫得清楚、把意圖、邊界、預期行為講明白的規格,能讓 AI 產出對的程式碼。一份模糊的、靠團隊默契填空的規格,AI 接到只會猜,然後猜錯。過去工程師「會寫」這份文件是加分項,現在是必要條件。


連帶地,工程師個人的能力核心也在移動。過去比的是「你 coding 寫得多快、多好」,未來比的是「你能不能設計一套 agent harness 來指揮 AI 做事」。這裡講的是 builder 級的設計能力。Builder 級要面對的是:怎麼切任務讓 AI 不會搞混、怎麼設停損避免它跑偏、怎麼讓多個 AI agent 平行做事還能合得起來、怎麼把錯誤回饋餵回去讓下一輪做得更好。這套設計能力過去不存在,現在是工程師能不能拉開差距的關鍵。


角色端的變化則要看你原本走哪條路。技術型工程師那條路最大的特色是系統架構能力,這件事沒變。怎麼把一個複雜系統拆成可以維護、可以擴張、可以容錯的模塊,怎麼選資料庫、怎麼設計 API 邊界、怎麼讓服務之間溝通乾淨,這些事 AI 還做不到。它可以幫你實作其中某個組件,但不會替你決定整個系統長怎樣。技術型工程師的價值在這層判斷上,這條路在 AI 時代沒有變窄。


PM 型工程師那條路變化比較大。過去這個角色的位置是需求的聆聽者,聽客戶或產品 PM 講想要什麼,翻成技術可行的方案,再找方法去執行。重點在聽、翻譯、執行。未來這個角色要變成需求的討論者。客戶說的「需求」往往只是他自己對解法的猜測,工程師要從中還原他真正的「意圖」,也就是他想解的問題是什麼、為什麼這對他重要、不解會怎樣。理解了意圖之後,重點是找 solution(解決方案),也就是真正解掉客戶問題的路徑;method(執行方法)只是達成 solution 過程中的選項之一。這個位置實質上就是 Forward Deployed Engineer(FDE),帶著 AI 工具到客戶現場,邊問邊做邊調整,幫客戶把意圖落地。


除了 spec-driven 跟 agent harness,還有一層新的工程設計面向冒出來,叫 context engineering 架構。過去做軟體系統,我們設計的是資料怎麼流、服務怎麼切、狀態怎麼存。AI 進來之後,系統裡多了一個會「思考」但需要被餵 context 才能做對事的角色。問題是 context 從哪裡來?怎麼確保使用者在過程中產生的脈絡,他剛剛做了什麼、為什麼這樣做、他現在卡在哪,被正確保留下來,等到 AI 要做事的時候能讀懂?


這層架構過去不存在。它要決定的是:系統在哪些點記錄使用者的動機、在哪些點記錄他的決策、這些訊號怎麼儲存、AI 需要時怎麼撈出來。設計得好,AI 能聰明地接續使用者的脈絡,知道他真正想完成的事,給出對的回應。設計不好,AI 每次都從零開始猜,輸出讀得通但對不上使用者真正要的東西。


這件事跟 prompt engineering 不是同一層。Prompt engineering 是當下這次互動怎麼跟模型講話,context engineering 是整個系統怎麼把使用者的歷程留下來讓 AI 在任何時刻都能讀懂。


最後是能力面。這層其實在前面三件事裡已經出現過,但值得單獨拉出來講。


第一個是理解跟溝通能力被同時放大兩次。你要對人聽懂他真正想做什麼,這部分過去就重要,未來更重要,因為 AI 把翻譯成 code 的部分接走了,前面這段「聽懂並還原意圖」變成更核心的動作。你還要對機器,用 spec、prompt、context 把這個意圖翻成 AI 能正確執行的指令。兩端都得要強,才能讓需求真正被落地。


第二個是 AI 邊界的識別能力。AI 在它熟悉的範圍裡可以快速試很多方案,可以把可讀性、效能、邊界情況都顧到。但它無法替你判斷哪些事它做得到、哪些事它在編造你看不出來的東西。能準確說「這個交給 AI 做、這個千萬不能讓 AI 做」的工程師,產出品質會跟「丟給 AI 看結果如何」的工程師差非常多。


這兩件事過去都算 senior 工程師的隱性差異,現在是所有層級都要面對的明確分水嶺。


把這四件事擺在一起,方向就清楚了。技術評斷在變,角色職責在變,多了一層 context engineering 的設計面向,能力的比重也在重新分配。四件事都圍繞同一條軸線:能不能定義對的問題、能不能給 AI 對的 context、能不能判斷 AI 的邊界。寫 code 這件事還在,工程師也還在。只是工程師價值的中心,從產出 code 移到了這條軸線上。


AI 會取代軟體工程師嗎?最新數據顯示職缺反而增加

David Sacks 說當 AI 將寫程式變的成本異常便宜,工程師職缺反而變多了。從數據來看,的確他是對的,但只講了一半。


事情是這樣。前白宮 AI 與加密貨幣事務主管 David Sacks 上週日在 X 上發了一篇文,問了一個看起來反直覺的問題:AI coding agent 已經能自己開發功能、開 PR、跨專案 debug 了,為什麼軟體工程師的職缺不減反增?他自己給的答案是「AI 大幅降低了寫程式的成本,同時也造成現在要管理的程式碼比以往任何時候都還要多」,還引了一個數字,GitHub 上的 commit 年增 14 倍。這篇被 Hugging Face 執行長 Clément Delangue 轉發,被到處廣傳。


先說我認同的部分。Sacks 講的其實是經濟學上的 Jevons 悖論:當一個東西的使用效率變高、成本變低,總用量通常不會下降,反而會上升。1865 年 Jevons 觀察到蒸汽機燒煤效率變好之後,整個社會的煤消耗量不減反增,因為便宜讓更多原本不划算的用途變得划算。套到軟體上就是,寫一個功能從兩週變成三天,公司不會說「太好了,可以裁掉八成工程師」,而是把那些一直擱著、以前不值得做的東西全部撈出來做。


數字確實撐得起這個說法。GitHub 的 commit 從 2025 全年約 10 億,到 2026 預估會衝到 140 億,每週 2.75 億筆,這就是 Sacks 講的 14 倍。AI 開的 PR 半年內從每月 400 萬暴增到 1700 萬。美國勞工統計局(BLS)預估軟體開發者職位 2024 到 2034 會成長 15%,遠高於全職業平均的 3%,而且報告裡直接點名 AI 是需求推力。今年初軟體工程師的職缺也確實年增約 11%。所以「AI 讓程式碼總量爆炸、進而推升工程師需求」這個方向,是有實際數據支撐的,不只是猜測,也不只是口號。


問題在「工程師職缺變多」這句話,把一件真正需要注意的事情掩蓋掉了:增加的職缺,到底是哪一種工程師?


把同一批資料拆開看,會發現成長幾乎全部集中在資深和 AI 專長這一類需求。


入門職缺從 2022 的高點減少了大約 67%。史丹佛 AI Index 2026 的數字更直接,22 到 25 歲的軟體開發者就業人數,從 ChatGPT 出現後掉了將近 20%,而資深開發者的人數持續成長,衝擊完全集中在最資淺這一層。新鮮人現在只佔大型科技公司新進人數的 7%。換個角度看職缺結構,入門職缺佔比從 8.1% 滑到 7.4%,資深職缺佔比則從 38.8% 爬到 43.1%。一般軟體工程師的職缺量比 2020 年的基準還低了快一半,真正在成長的是 AI/ML 工程師,年增 59% 到 85%。所以總量是成長的,但工程師人力需求底部在減少、頂部在增長。


再來是第三件事,也是我覺得最該想清楚的:Sacks 拿來解釋職缺成長的那個機制,「要管理的程式碼變多了」,剛好就是把剛入門這條路堵死的同一股力量。當每個人都用 AI 一天產出三倍的程式碼,瓶頸就從「寫」搬到了「審查、整合、確認這東西在正式環境會不會出問題」。而審查和架構判斷是資深工作。AI 接手的那些寫 template 程式碼、修小 bug、補測試的工作,正好都是過去新人用來練功、慢慢變成資深的那條路。GitClear 的資料也顯示,AI 產生的程式碼每個 PR 平均有 10.83 個問題,人寫的是 6.45 個,寫出來的量更大,要人檢查的地方也變得更多。


這就帶出一個五到七年後可能會浮現的問題。資深工程師都是先做過資淺的活才變資深的。如果現在這條入門的路被 AI 大幅壓縮,等到要補這些資深人力缺口的時候,能夠往上補的人,已經因為這幾年入門被收窄而變少了。需求在增長,但能滿足需求的供給,不一定跟得上。


所以 Sacks 沒講錯,AI 確實在把整個軟體業的餅做大。我只是覺得,當一個說法讓人鬆一口氣的時候,特別值得看它把什麼東西藏在底下。對已經在業界、能用 AI 把自己變成三倍產出的人,這是最好的時代;對剛畢業、還在找第一份工作的人,同一份數據就變成另一個故事。而這兩件事是同時都成立的。


來源:

David Sacks 原始論點與 14 倍 commit 數據:https://www.benzinga.com/markets/tech/26/05/52765410/former-wh-advisor-pushes-back-on-job-loss-fears-says-ai-has-dramatically-lowered-the-cost-of-writing-co

GitHub commit/AI PR 量與 GitClear 品質數據:https://byteiota.com/github-ai-agents-275m-commits-are-breaking-the-platform/

軟體開發者就業預估 +15%:美國勞工統計局 BLS Occupational Outlook https://www.bls.gov/ooh/computer-and-information-technology/software-developers.htm

22–25 歲開發者就業 -20%:史丹佛 HAI AI Index 2026 https://hai.stanford.edu/ai-index

職缺結構(入門 8.1%→7.4%、資深 38.8%→43.1%、IT/CS 年增 14.2%):ZipRecruiter 資料(WSJ 報導),轉引自 https://www.metaintro.com/blog/tech-jobs-rebound-2026-it-cs-postings-up-entry-level-shrinks

入門職缺 -67%、新鮮人佔比、一般 SWE 與 AI/ML 職缺消長:jobsbyculture 2026 職缺分析 https://jobsbyculture.com/blog/junior-developer-crisis-2026


2026年5月23日 星期六

微軟取消使用 Claude Code


微軟給員工試用 Claude Code 六個月,經過這段時間後,工程師大多選了 Claude Code;但是,微軟卻決定把它砍了。大多數報導抓的角度是公司政治和商業套利,但我認為這則消息最重要的訊號不是那裡,而是在成本。


真正的重點是 token 計費的成本已經讓公司撐不住。Hedgie(@HedgieMarkets)點出微軟砍掉 Claude Code 的原因是 token-based billing 讓成本變得無法承受——連一家擁有近乎無限雲端資源的公司都撐不住。而且這不是個案。Uber CTO Praveen Neppalli Naga 證實,Uber 在四個月內就燒光了整個 2026 年的 AI 預算,原因正是 Claude Code 的採用率從 32% 一路衝到 84%(一個 5,000 名工程師的組織),每名工程師每月 API 成本落在 500 到 2,000 美元之間,Uber 自己的說法是「回到白板重新規劃」。


所以可以清楚看見:工具越好用、採用率就會衝得越快,但是 token 帳單也會衝得越快。微軟和 Uber 是同一個現象的兩個資料點,agentic coding 的「按 token 計費」模式正在撞上企業預算的天花板。


回到事件本身。2026-05-14,The Verge 的 Tom Warren 獨家報導: 微軟 Experiences + Devices 部門副總 Rajesh Jha 發了一封內部 memo,「6/30 前將砍掉大部分 Claude Code 授權,全員改用自家 GitHub Copilot CLI」。E+D 這個部門負責的是 Windows、M365、Outlook、Teams、Surface 這些產品線,影響幾千名員工。脈絡要回到 2025-12:當時微軟針對 E+D 部門同時開放 Claude Code 跟 Copilot CLI 讓員工試用,Jha memo 自己說目的是「在真正的工程流程裡 benchmark 兩個工具,搞清楚哪個比較適合我們的團隊」。六個月後結果出來,The Verge、Windows Central、TechRadar、The Decoder 各家報導跟 Tom Warren 的內部來源都指向同一件事,員工大多偏好 Claude Code 勝過 Copilot CLI。


官方說法是要統一使用的工具鏈,「我們對自家工具才可以有完整控制,可以直接跟 GitHub 一起調整成符合微軟自己的 repo、流程、安全要求」。這個說法成立,但放回成本這條主線會看得更深。微軟改用自家 Copilot CLI 不只是品牌一致性——掌握 harness 就是掌握 token 燒錢的速度。Claude Code 是 Anthropic 控制的產品,token 怎麼燒、燒多少,微軟管不到;換成自家 harness,微軟才能優化 token 用量、把成本壓回可控範圍,而且後端模型仍然可以選 Claude。


不過,對 Anthropic 其實沒差。被砍掉的是按 token 計費的產品/訂閱層,也就是成本撐不住的那一層。模型 API 那層沒變:員工換到 Copilot CLI 之後仍然可以選 Claude 當後端模型,M365 裡的 Claude 整合照常運作,2025-11 簽的 Foundry deal 也照常。成本問題是產品層的問題,不是模型層的問題,這正是它對 Anthropic 沒差的原因。被換掉的是 Anthropic 的產品介面,不是模型本身。


這跟「Anthropic 被微軟切割」是兩件事。媒體標題很容易寫成 Anthropic 被微軟踢出去,但實際發生的事情是微軟挑了 Claude 模型仍然要繼續用、但 Anthropic 的產品介面換成自家的。這個區分對理解模型廠跟平台廠的關係很重要:模型可以是商品,產品介面才是平台廠想自己掌握的層。


對企業 AI 工具規劃,這件事蠻值得注意的:當你內部最受歡迎的 AI 工具是按 token 計費,「好用」和「養得起」是兩件事。微軟和 Uber 已經先撞上這道牆,每名工程師每月燒掉上千美元 token 的成本壓力遲早會得被處理。現在用得開心的工具,明年的預算還養不養得起是另一回事。


來源:

- Hedgie(@HedgieMarkets): https://x.com/HedgieMarkets/status/2057531661785628841

- Uber 四個月燒光 2026 AI 預算 — Briefs: https://www.briefs.co/news/uber-torches-entire-2026-ai-budget-on-claude-code-in-four-months/

- Tom Warren X scoop: https://x.com/tomwarren/status/2055000505923871219

- Microsoft cancels Claude Code licenses — Windows Central: https://www.windowscentral.com/microsoft/microsoft-cancels-claude-code-licenses-shifting-developers-to-github-copilot-cli-a-move-likely-driven-by-financial-motives

- Microsoft pulls Claude Code licenses — The Decoder: https://the-decoder.com/microsoft-pulls-claude-code-licenses-and-pushes-developers-back-toward-its-own-ai-tool/

- Microsoft Resells Anthropic's Tech at a 65% Premium. It Just Canceled the Free Version — Major Matters: https://majormatters.co/p/microsoft-claude-code-walkback-cowork-resale

- Microsoft may discontinue Claude Code internally — TechRadar: https://www.techradar.com/pro/microsoft-may-discontinue-claude-code-internally-as-it-looks-to-push-users-towards-github-copilot


Google I/O 2026

2026/5/19 Google I/O 2026 盛大登場,從我的角度來看,這次 Google I/O 2026 的真正主角不是 Gemini Omni 那段影片,是 Antigravity 2.0 完全取代 Gemini CLI


每年 I/O 結束我都會問一個問題:這場 keynote 之後,開發者明天的工作流程會不會變。今年 5/19 ~ 5/20 在 Shoreline Amphitheatre 那場,答案是會,而且變動的幅度比過去幾年都大。


大多數人很容易被 Gemini Omni 那段影片生成 demo 搶走目光。Demis Hassabis 把它定位成「從任何輸入創建任何內容」,單一架構原生處理 video、audio、image、text,跨模態 reasoning 之後產出單一輸出。可以用對話編輯影片,角色、物理性質、先前的編輯在多輪對話中保持一致;對重力、流體、運動的理解明顯改善;使用者可以建自己的 avatar 拍片,建立時要錄一段念數字以防 deepfake。首發 Omni Flash 一次最多生 10 秒影片,每個輸出內嵌 SynthID 浮水印加 C2PA Content Credentials,從 Gemini app、YouTube Shorts、AI 創作工作室 Flow 進入。


這段 demo 適合上新聞,但對大多數工程師的日常沒有直接影響。會改變開發者明天工作流程的另一條線,是 Google Antigravity 2.0。


Antigravity 過去是附在 IDE 內的 agent 插件。這次升級成獨立 desktop app 加完整生態系,分成四塊:Antigravity Desktop 是圍繞 agent orchestration 設計的獨立 app,不是傳統 IDE;Antigravity CLI 完全取代 Gemini CLI,原本的 Agent Skills、Hooks、Subagents 都保留,Extensions 改名 Antigravity plugins;Antigravity SDK 開放程式化存取,跑的是 Google 內部產品用的同一套 agent harness;Managed Agents 透過 Gemini API 與 AI Studio 提供,跑在 Google 託管的環境上。Enterprise 那條線整合進 Gemini Enterprise Agent Platform。


技術層面看,新工具支援動態 subagents 平行 workflow、scheduled tasks 背景自動化、多輪 session 狀態保存、原生語音指令。


產品層面看,Google 公開選擇跟進 Claude 和 Codex:未來開發者跟 LLM 互動的單位從「我問一句、它答一句」改成 agent harness 跑一段,把多個子任務分派下去,自己處理中間的失敗、重試、狀態。


而這次,底層模型也跟著換。新發表的 Gemini 3.5 Flash 是「最新模型家族第一款,結合 frontier intelligence 與 action」,主打便宜加為 agent workflow 設計,成本大約是同等前沿模型的 1/2 到 1/3。這個價格是 Antigravity 2.0 能跑得起來的前提,agent 工作流的特性是會反覆呼叫模型,模型成本不壓下來,整個 platform 就只能服務小眾。


還有幾個比較不顯眼的工具也一起發布。Code Mender 是自動找漏洞並修補的安全工具,目前邀請外部專家測試中。Google AI Studio 加上原生 Android 支援、Workspace 整合、行動 app。Gemini API 新增 Interactions API。這幾個消息放在一起,隱約可以看到 Google 在補的是「從模型到生產系統」中間的那一段,也就是測試、安全、整合、行動端。這段過去是 Vercel、LangChain、Cursor 這些公司在做的事,Google 現在自己來。


消費者端的更新則有自己的節奏。Gemini Spark 是一般用途 AI agent,定位 24/7 personal agent,「在你指示下執行動作」。Daily Brief 是 Gemini app 每日簡報。Universal Cart 是跨網站智能購物車,agentic commerce 的基礎建設。搜尋結果加入 Search Information Agents 主動整理。Android XR 智慧眼鏡確定秋季正式推出,具備導航、訊息、拍照、Gemini live demo。Android Halo 把 agent 智能整合進狀態欄。Google Pics 是 Google Workspace 的新設計工具。SynthID 加 C2PA 的 AI 生成內容識別則擴展到更多場景,確保內容的安全。


訂閱方案部分則多了一階。新增 Google AI Ultra 月費 $100 USD,給 dev、creator、power user。


把這些放在一起看,2026 的 Google I/O 跟 2025 之前最大的差別是產品定位。過去 Google 講 AI,講的是 Gemini 變強了,更好的 benchmark、更長的 context window、更多模態。今年講的則是 AI agent,是在你指示下執行動作,是跑一段、做完一件事、回報結果。從 Omni 的多模態原生產出,到 3.5 Flash 為 agent workflow 設計的成本結構,到 Antigravity 2.0 全棧取代 Gemini CLI,到 Spark、Universal Cart、智慧眼鏡這些消費者入口,整套東西指向同一個產品形態。


來源:

- Google I/O 2026 官方 collection: https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-collection/

- I/O 2026 developer highlights: https://developers.googleblog.com/all-the-news-from-the-google-io-2026-developer-keynote/

- Gemini Omni 詳細介紹: https://techcrunch.com/2026/05/19/googles-gemini-omni-turns-images-audio-and-text-into-video-and-thats-just-the-start/

- Antigravity 2.0 詳細介紹: https://www.marktechpost.com/2026/05/19/google-launches-antigravity-2-0-at-i-o-2026-a-standalone-agent-first-platform-with-cli-sdk-managed-execution-and-enterprise-support/


2026年5月21日 星期四

NVIDIA H200 為何無法出貨中國?真正原因不是美國禁令

美國批准每家中國大廠買 75,000 顆 H200,總額度可達 75 萬顆,一顆都沒出貨。


事情經過大致是這樣。美國商務部今年放行了大約十家中國公司買 Nvidia 的 H200,名單包含阿里巴巴、騰訊、字節跳動、京東,連聯想和鴻海這些經銷商也拿到許可,每家上限七萬五千顆。額度全用滿的話理論上是七十五萬顆的量,這是 2023 年底美國收緊管制以來,開給中國最大的一筆。但根據路透 2026-05-14 的報導,截至五月中,沒有任何一顆 H200 真的送到中國買家手上。


擋下來的是北京自己。中國政府要國內廠商先暫停 H200 訂單,把資源留給國產晶片。美國商務部長 Howard Lutnick 在參議院聽證會上直接說,中國中央政府還沒讓這些公司買,因為要把投資集中在自己的產業上。國務院同期發布了兩項供應鏈安全規定,要求企業全面排查對外國技術的依賴。


我覺得這個轉折才是這件事真正的訊號。過去幾年的劇本是美國管制、中國想盡辦法買,Nvidia 為了保住中國市場一路做出 H800、H20,每次都是一個剛好合規的降規版本,H200 也是這條線上的產物。Nvidia 整套商業策略是建立在「中國一定還是會想買」這個假設上的。當北京主動把一個合規產品擋在門外,這個假設整個垮掉。靠再做一個降規版本、靠政策層面再談一輪,都救不了這個結構性問題。


讓中國敢這樣做的底氣,是國產替代真的開始跑起來了。DeepSeek 公開說最新模型針對華為的 Ascend 晶片做了優化,這件事的意義很實際。實驗室裡跑得起來不代表能上量產,一個前沿模型廠願意把工程資源花在 Ascend 上面優化,等於告訴市場 Ascend 已經能在真實生產環境跑起來,而不只是 demo 等級的概念驗證。騰訊也宣布加大國產 GPU 的資本支出。


另一邊還有「Trump tax」這個變數。這次的安排是 Nvidia 要把 H200 對中銷售營收的 25% 給美方,而且晶片要先過境美國本土才能繼續往中國走。北京擔心晶片在過境期間被動過手腳,這個顧慮在中央政府的層級被當作真實的安全風險處理。三件事疊在一起:合規產品被擋、Ascend 軟體生態起步、過境環節有顧慮,方向就很清楚了。


對台廠這條供應鏈,影響已經發生。Nvidia 在 2026 年三月把台積電原本配給 H200 的產能轉去做下一代的 Vera Rubin(Financial Times 引述兩名知情人士的報導),因為它不想再卡在美中之間的灰色地帶,寧可把產能放到市場前景清楚的產品上。鴻海和聯想雖然拿到 H200 的經銷許可,但訂單出不了貨,許可現在等於只是一張紙。中國市場一度佔 Nvidia 營收超過兩成,現在剩下約 5%,黃仁勳自己說,Nvidia 在中國 AI 加速器的市佔已經實質歸零。


華為這邊的時程表是 Ascend 950PR 在 2026 年第一季、960 在 2027、970 在 2028,HBM 也開始用自研的 HiBL 1.0 跟 HiZQ 2.0。脫鉤要走多快,要看接下來一兩年華為的量產良率跟軟體生態能不能撐住規模化部署,這個我還沒有定論,要看實際部署數據。


有一件事已經可以確定。當一邊把對方最想要的東西批准賣給你,另一邊選擇不要,雙方都認定,未來自己要用的算力得長在自己家裡。


來源:

The Next Web, US clears H200 sales to 10 Chinese firms, but not a single chip has shipped (2026-05-14): https://thenextweb.com/news/nvidia-h200-china-licences-huang-beijing-trip

Business Standard / Reuters, US clears Nvidia H200 chip sales to Chinese firms, deliveries yet to begin (2026-05-14): https://www.business-standard.com/world-news/us-clears-nvidia-h200-chip-sales-to-chinese-firms-deliveries-yet-to-begin-126051401840_1.html

Asia Times, Nvidia halts H200 production as China backs Huawei AI chips (2026-03-10): https://asiatimes.com/2026/03/nvidia-halts-h200-production-as-china-backs-huawei-ai-chips/

Yahoo Finance, Trump Clears Nvidia H200 Sales To Alibaba, Tencent And 8 Others, But Beijing Halts Deliveries (2026-05-16): https://finance.yahoo.com/sectors/technology/articles/trump-clears-nvidia-h200-sales-193006781.html


Claude、ChatGPT 都很好用,但別把大腦一起外包出去


Addy Osmani 寫了一篇「不要把學習外包出去」。

Addy Osmani 目前是 Google Cloud AI 的 Director,主導 Gemini、Vertex AI、ADK 等 AI 開發者工具的體驗,自己也是 AI 輔助開發的重度使用者。在這之前他在 Google Chrome 待了快十四年,DevTools、Lighthouse、Core Web Vitals 這些工具都是他帶過的,前端工程師應該都不陌生。他也寫過幾本 O'Reilly 的書,《Learning JavaScript Design Patterns》、《Leading Effective Engineering Teams》、《Image Optimization》都是業內熟悉的教材。

他這個月寫了一篇文章叫 Don't Outsource the Learning,引了兩份研究我覺得值得記下來。

第一份是 Anthropic 自己做的。他們把工程師分成兩組去解 Python library 的任務,一組可以用 AI,一組純手動。結果兩組完成速度一樣,但後測理解題的分數差距非常明顯:AI 組 50%、手動組 67%。

這份研究最有意思的地方是 AI 組內的細部分析結果。同樣是用 AI,把 AI 當作「問概念的對象」的人,後測分數高於 65%;直接 copy-paste 生成程式碼的人,後測分數低於 40%。同一個工具、同一段時間、產出速度也接近,但學到的東西差非常多。決定結果的不是工具,是你如何使用工具。

第二份是 MIT 那篇 Your Brain on ChatGPT。他們用 EEG 量受試者寫文章時的大腦連結度,發現 AI 介入越多,腦部連結越弱。寫完文章後,83% 用 LLM 的受試者連自己剛剛產出的文章中的任何一句話都背不出來。研究者把這個現象叫做 cognitive debt,意思是現在省下的思考成本,之後會用批判思考的能力補回來。

兩份研究的方法跟切角不同,但結論相同。把產出外包給 AI 沒問題,把思考也一起外包就不行了。

Addy 自己說他過去一年用 AI 完成的東西,比前面五年加起來還多,所以他不是反 AI 的人。他文章裡舉了五個就算 AI 再強,工程師還是需要懂底層的場景:debug 失敗的時候、AI 出現幻覺需要被抓出來的時候、framework 升版或要做安全審查的時候、遇到非標準問題的時候、還有勞動市場本身正在變化(他引的數據是 2022 年至今初階工程師就業數字掉了 20%)。前四個是技術理由,最後一個是現實。

Addy 論述裡我覺得最該被引用的是這句:The tool didn't determine the outcome. The posture did. 工具沒有決定結果,使用方式決定了結果。

我自己在用 Claude Code 跟 Codex 的時候有個習慣:每隔一段時間就刻意關掉 AI 寫一段功能。理由很簡單,我想看看離開 AI 的時候,自己懂得還剩多少。如果發現某個東西已經不會自己寫了,那就超過使用的範圍了,要回頭把基礎補起來。Addy 在文章裡也提到類似的做法,他建議偶爾把 AI 生成的程式碼從頭重寫一次,或在請 AI 寫之前先自己提出假設、再讓 AI 回答。

這篇文章我想推薦給兩種人。一種是還在猶豫要不要用 AI 寫 code 的工程師,這篇能讓你知道用了之後該怎麼用才不會把自己用廢。另一種是已經重度依賴 AI 的人,可以拿這兩份研究當鏡子照一下自己現在的工作模式。

MIT 研究 Your Brain on ChatGPT:https://arxiv.org/abs/2506.08872

2026年5月18日 星期一

Claude、Cursor 都能解 LeetCode 後,工程師該學什麼?

Yann LeCun 全球著名的電腦科學家,被譽為「深度學習教父」與「卷積神經網路(CNN)之父」。他是 2018 年電腦科學最高榮譽圖靈獎(Turing Award)的得主。他最近回答了一個問題:為什麼法國的 Fields 獎得主數量在歐洲第一,但在 IMO(國際數學奧林匹亞)的表現很差,而匈牙利、羅馬尼亞、保加利亞這些 IMO 強國連一個 Fields 獎都沒拿過?他的回答是這樣:他認識的 2022 年 Fields 獎得主 Hugo Duminil-Copin 親口告訴他,自己從來沒比過數學競賽,而且非常不擅長這類比賽。創新的數學研究需要的是創造力、直覺、極高強度的專注,以及長時間的思考,有些問題要想好幾年。IMO 測的是快速解題能力,而這件事 AI 現在也做得到。研究者真正重要的工作不是回答問題,是提出正確的問題。


把這段話接到 vgod 多年前寫的那個系列文。vgod 是資訊奧林匹亞獎牌得主,台大保送、MIT 資工博士,程式能力強到「幾乎什麼解決方案都實作得出來」,但職涯前幾年升遷受挫。後來他理解到,自己一直把精力放在錯的地方,產出多但選錯題目,再怎麼努力也升不上去。原句是「不重要的事,就算做兩倍也不會變比較重要」。


這個對比是在說:不論是 Fields 獎還是 Staff+ engineer,真正能持續往上走的人,差異不是解題速度,是選題能力。這件事不是 AI 時代的新發現,是 AI 時代讓這個問題變成更重要。


過去十幾年,軟體業招人的主流方式是 LeetCode 面試,四五十分鐘解兩三題演算法。這套面試篩出來的是「IMO 型」候選人,特徵是快速 pattern match、套熟悉模板、限時內給答案。在 AI 編程工具普及之前,這套還勉強合理,因為「快速解題」跟「能寫 production code」有一定相關性。但這個相關性在 2025 年之後就斷了。Claude Code、Cursor、Codex 跑個一兩小時就能解完整個 LeetCode hard 的題目,速度和正確率也都贏過絕大部分工程師。而市場上仍然繼續用 LeetCode 篩人,但篩出來的能力跟資深職涯所需要的能力,卻剛好是兩個不同的維度。


具體分歧是這樣:LeetCode 型工程師面對「實作這個 spec」會做得又快又好;面對「這個產品功能該不該做?哪個版本能省 80% 工又涵蓋 90% 場景?要不要先做 A 或 B?」這類題目,卻往往答不出來,或是很難給一個精準的判斷。不過,Staff+ 工程師的工作有很大比重是後者。而當把 AI 接進來之後,可以發現「實作這個 spec」的成本掉到接近零,組織還需要工程師存在的理由就完全在「問對問題」這一塊。Andrew Chen 近期寫過一篇 token scarcity,講的是同一件事的另一面:當實作變便宜,瓶頸搬到「要把 token 花在哪一個問題上」。


這對招募、升遷、職涯規劃都會有具體影響。招募端:LeetCode 不會立刻消失,但 senior 缺的篩選邏輯要往「過去解過什麼模糊問題、怎麼定義範圍」這類題目傾斜,Amazon 的 Staff engineer 面試那套「給你一個模糊的商業需求,請設計系統」其實一直就是在測試這個。升遷端:寫程式多的人不再會自然升上去,要看他開始的專案有沒有解到對的問題、他取消的專案是不是該被取消。職涯規劃端:寫 code 多的時段不再是線性累積經驗,要刻意騰出時間培養 problem framing 的習慣,主動跑去做 user interview、看競品、定義成功指標。


回到 Duminil-Copin 那段話。他說數學研究「有時這種思考甚至會延續好幾年」,這在軟體業聽起來奢侈。但其實 資深工程師花一個月寫提案、推一個季度才讓組織決策轉向、用兩年讓某個架構決定的價值浮現,這跟「思考延續好幾年」是同一件事的工程版本。會做這件事的人原本就比較少,接下來這個技能的價值會更大。


AI 沒有讓「會問問題的人」變成新的稀缺資源,他們本來就稀缺。AI 只是讓這件事更容易被看到。


Sources:

- ExplainThis 軟體工程白話聊原文:https://www.facebook.com/explainthis.io/posts/pfbid0bHPiN5xR8J8PL9EjWfV6KJjteiNALVUKwD9q3iNbUbTVpPRPc3bMtxmFS34aHDbdl

- Hugo Duminil-Copin 2022 Fields Medal(CNRS 官方新聞):https://www.cnrs.fr/en/press/hugo-duminil-copin-french-mathematician-and-permanent-professor-ihes-has-been-awarded-fields

- Yann LeCun on LLMs passing IMO(Times of India, 2026-02):https://timesofindia.indiatimes.com/technology/tech-news/godfather-of-ai-yann-lecun-says-yes-llms-may-be-passing-maths-olympiads-and-bar-exams-but-they-will-still-fail-in-/amp_articleshow/128614667.cms