過去自動化多衝擊製造業與基層文書,這次倒過來。Brookings 研究員 Molly Kinder 花三年研究生成式 AI 對工作的影響,認為法律、金融、顧問、軟體這些「筆電階級」會最先受衝擊。用她的話說,能把工作關在小房間、配一台電腦就能完成的人,遲早會有麻煩。
她在近期引發討論的〈Messy Middle〉一文主張,AI 不會是「全毀」也不會「立刻豐饒」,而是一段可能長達數十年的「混亂中段」:多數工作存活,但損失集中在高薪職位。她反對對此發放 UBI,認為會拖垮勞動市場,改提由企業出資的白領學徒基金、薪資保險,以及知識工作的產業政策。6 月 9 日她離開 Brookings,要另立組織把研究變成解方。
Apple 最新的 AI 功能因法規限制無法在中國上線,留下一塊空缺。華為的 HarmonyOS 一向想擺脫對外國作業系統的依賴,這次乾脆把更大的賭注,押在「為 AI agent 設計的作業系統」這個方向上。
6 月 12 日華為向開發者釋出 HarmonyOS 7 beta,主打 agent-friendly 架構:串接逾 2000 個專用 AI agent、宣稱複雜任務成功率 90%,能依健康資料與行事曆自動產生個人化計畫,並跨裝置管理檔案,效能較對手快 30% 到 40%。時間點正對上 Apple 數天前發表的 iOS 27,鎖定它在中國市場的在地 AI 替代位置;正式版預計今年稍晚隨新旗艦機推出。
AI 的進展遠快過政策。Dario Amodei 指出,AI 在四年內從勉強能寫程式,到幾乎能處理多數認知任務,但政策流程通常落後技術一到兩年,中間留下他認為危險的落差,從網路攻擊、生物風險到權力過度集中都可能來不及應對。
6 月 10 日他發表長文〈Policy on the AI Exponential〉,提出橫跨五大領域的對策:監管上要求超過算力門檻的前沿模型接受網路、生物與失控風險的第三方測試,並讓政府有權擋下不安全的部署;經濟上建立勞動衝擊的量測、薪資保險與長期所得支持;地緣上由民主國家聯盟共享半導體、對威權國家設限。Anthropic 同步推出兩份立法提案,並提供資金支持。
👤@tenobrus:提案的具體程度遠勝 OpenAI 近期的文章,內容大致認同且非常值得一讀,但擔心 Anthropic 沒有足夠的監管影響力推動這些主張落實。
👤@jconorgrogan:質疑這套提案實為監管俘虜,等於以安全為名,打造只有最大業者能生存、由企業與國家共管算力與部署的格局。
Fable 是 Anthropic 把資安特化模型 Mythos 對外開放的版本,內建防護原是為了擋惡意程式開發與生物武器,通過 Cyber Verification Program 的專業人士才能享有較寬鬆的限制。
6 月 10 日多名資安研究員抱怨這套防護過嚴,連讀資安部落格、寫安全程式、做 code review 這類無害任務都被擋。IBM X-Force 的 Valentina Palmiotti 說它會拒絕任何沾到一點資安邊的請求;Tolmo AI 的 Matt Suiche 指防護像是用關鍵字判斷,一碰到資安語彙就把模型降級回 Claude Opus 4.8。Anthropic 未即時回應置評。
👤@alexjplaskett:目前 Fable 因為過度敏感的拒絕分類器幾乎無法使用,連與資安無關的任務也被擋,看不出有什麼理由捨 Opus 而用它。
👤@teknium:誇張的是 Fable 連生命科學領域也被全面封鎖,就算繞過分類器,效果也被閹割,等於把治病這條路也關掉了。
主流大型語言模型大多用自回歸方式逐字生成文字,一次只吐一個 token,速度會隨序列變長而受限,本地端或互動式的應用常因此卡在延遲上。擴散模型是另一條路線,過去多用在影像生成;Google 的 Gemma 系列則一向主打能在本地端跑的開源小模型。
6 月 10 日 Google 發表實驗性開源模型 DiffusionGemma,改用文字擴散一次平行生成整塊文字。它是基於 Gemma 4 的 26B MoE,推論時只啟用 3.8B 參數,量化後可塞進 18GB VRAM;在 NVIDIA H100 上每秒超過 1000 個 token、RTX 5090 上超過 700 個,比自回歸快約四倍。模型採 Apache 2.0 授權、權重放上 Hugging Face,支援 vLLM、Transformers、MLX 與 llama.cpp。代價是輸出品質低於標準 Gemma 4,主打本地、互動式的速度場景。
👤@vllm_project(vLLM 團隊):恭喜 DeepMind,這是 vLLM 首個原生支援的擴散語言模型,單張 H200、FP8、batch size 1 下可達每秒 1200+ token。
👤@_philschmid:DiffusionGemma 速度上看每秒 1000+ token,基於 Gemma 4 的 26B MoE、推論時 3.8B 參數,量化後 18GB VRAM 內可跑,採 Apache 2.0 授權。