AI News Daily - 2026-05-09

2026-05-09

今日要点

AI 代理与编码工具爆发：从 Anthropic 的 Claude Code 到开源的 NousCoder-14B，AI 编码代理正迅速改变开发流程，但同时也引发了关于成本、安全性和“代理安全”审计的广泛讨论。
网络安全威胁升级：Canvas 学习平台遭遇黑客攻击导致考试延期，波兰指控俄罗斯破坏其水处理设施，网络安全已成为全球基础设施的重大隐患。
科技巨头的 AI 战略调整：Cloudflare 因 AI 效率提升裁员 1,100 人，OpenAI 开始在 ChatGPT 中测试广告，而 Google 则因 reCAPTCHA 的变动引发了去谷歌化 Android 用户的强烈不满。
UAP 文件解密：美国政府正式发布首批不明空中现象（UAP）相关文档与视频，引发公众对未知飞行物研究的关注。

Hacker News

Canvas online again as ShinyHunters threatens to leak schools’ data

Canvas 平台恢复上线，ShinyHunters 威胁泄露学校数据

Canvas 在经历黑客攻击后已恢复服务，但黑客组织 ShinyHunters 声称已获取大量学校数据并威胁将其泄露。此次事件导致多地学校被迫推迟期末考试，引发了教育界对在线学习平台安全性的深度担忧。

Poland is now among the 20 largest economies

波兰跻身全球前 20 大经济体

自 1989 年政治转型及 2004 年加入欧盟以来，波兰经济实现了跨越式发展。通过持续的结构性改革和稳健的增长，波兰已成功跻身全球前 20 大经济体，成为欧洲经济增长的典范。

Maybe you shouldn’t install new software for a bit

近期建议谨慎安装新软件

继 copy.fail 等漏洞曝光后，Linux 内核近期频现安全隐患。作者建议在当前供应链攻击风险较高的环境下，用户应暂时减少安装新软件，以规避潜在的 NPM 或内核级安全风险。

Google Cloud Fraud Defence is just WEI repackaged

Google Cloud Fraud Defence 只是 WEI 的重新包装

Google 推出的“Google Cloud Fraud Defence”被指实质上是此前因标准组织反对而被迫下线的“Web 环境完整性（WEI）”的变体。该服务通过 QR 码挑战来验证用户身份，引发了关于隐私和浏览器控制权的争议。

A web page that shows you everything the browser told it without asking

一个无需询问即可展示浏览器所有信息的网页

该网页展示了在用户访问时，浏览器在未经明确授权的情况下自动向网站泄露了哪些隐私信息。此举旨在提醒用户关注现代浏览器在数据隐私保护方面的透明度缺失。

An Introduction to Meshtastic

Meshtastic 简介

Meshtastic 是一个开源的社区驱动项目，利用低成本的 LoRa 无线电技术构建长距离、离网的通信平台。它特别适用于缺乏可靠通信基础设施的地区，为用户提供了一种去中心化的通信方案。

David Attenborough’s 100th Birthday

大卫·爱登堡爵士百岁寿辰

英国国王查尔斯三世与卡米拉王后向大卫·爱登堡爵士致以百岁生日祝福。王室分享了多张珍贵历史照片，纪念这位著名的自然纪录片先驱对全球自然保护事业做出的卓越贡献。

ClojureScript Gets Async/Await

ClojureScript 引入 Async/Await 支持

ClojureScript 团队宣布发布新版本，正式支持 ECMAScript 2016 标准。此次更新重点在于增强互操作性，允许开发者在 ClojureScript 中更方便地使用 Async/Await 语法。

Ask HN: We just had an actual UUID v4 collision…

Ask HN：我们刚刚遇到了 UUID v4 碰撞

开发者在数据库中发现了一个 UUID v4 碰撞，即两个不同的记录生成了完全相同的唯一标识符。尽管 UUID v4 碰撞概率极低，但这一罕见事件引发了社区关于数据库主键生成策略的讨论。

Mojo 1.0 Beta

Mojo 1.0 Beta 版本发布

Mojo 1.0 Beta 现已发布，该语言旨在结合 Python 的易用性与 C++ 的高性能。它支持从 CPU 到 GPU 的多种硬件架构，且具备内存安全特性，旨在消除供应商锁定。

Cartoon Network Flash Games

卡通频道 Flash 游戏展

该网页展示了卡通频道曾经风靡一时的 Flash 游戏合集，通过 Web Design Museum 的展览，让用户重温早期的网页游戏体验。

Google broke reCAPTCHA for de-googled Android users

Google 的 reCAPTCHA 更新导致去谷歌化 Android 用户无法使用

继 Google Cloud Fraud Defence 发布后，reCAPTCHA 的机制变动导致许多使用去谷歌化（de-googled）Android 系统的用户无法正常通过验证，引发了关于 Google 强制生态绑定的批评。

Nintendo announces price increases for Nintendo Switch 2

任天堂宣布上调 Nintendo Switch 2 价格

任天堂官方宣布，受全球市场环境及业务前景影响，将调整 Nintendo Switch 2 相关产品及服务的定价。

Tesla is recalling its cheaper Cybertruck because the wheels might fall off

特斯拉召回廉价版 Cybertruck，原因系车轮可能脱落

特斯拉宣布召回所有 173 辆已售出的后驱版 Cybertruck，原因是车辆存在车轮意外脱落的风险。这是该车型近期面临的又一次质量挑战。

US Government releases first batch of UAP documents and videos

美国政府发布首批 UAP 文档与视频

美国政府正式公开了一批关于不明空中现象（UAP）的解密文件和视频。这些资料由五角大楼整理，旨在提高政府在不明飞行物研究方面的透明度。

Prime Video follows Netflix and Disney by adding a TikTok-like ‘Clips’ feed in its app

Prime Video 跟进 Netflix 和 Disney，在应用中添加类似 TikTok 的“Clips”短视频流

亚马逊 Prime Video 宣布推出“Clips”功能，通过滚动式短视频流展示电影和剧集的精彩片段。此举旨在通过短内容发现机制，提升用户对长视频内容的点击率和订阅转化。

Intel’s comeback story is even wilder than it seems

英特尔的复苏之路比想象中更疯狂

英特尔股价在过去一年中飙升了 490%，华尔街对其转型寄予厚望。然而，分析指出这一涨幅可能远超公司实际的业务改善速度，市场预期与现实之间存在显著差距。

Cloudflare says AI made 1,100 jobs obsolete, even as revenue hit a record high

Cloudflare 称 AI 使 1,100 个岗位变得多余，尽管营收创下历史新高

Cloudflare 宣布了公司历史上首次大规模裁员。CEO Matthew Prince 表示，由于 AI 带来的效率提升，公司不再需要维持庞大的支持团队，尽管公司目前的营收表现依然强劲。

Porsche shutters e-bike, battery, software subsidiaries as part of company overhaul

保时捷关闭电动自行车、电池及软件子公司，作为公司重组的一部分

保时捷宣布关闭多个子公司，涉及超过 500 名员工。CEO Michael Leiters 表示，此举是为了重新聚焦核心业务，进行必要的战略调整。

Mother Ventures is looking at moms as the ‘economic engine’

Mother Ventures 将母亲视为“经济引擎”

专注于母亲消费群体的风险投资公司 Mother Ventures 宣布募集了 1,000 万美元的首期基金，旨在挖掘这一庞大且具有高消费潜力的市场。

Uber partner Avride is under investigation for self-driving crashes

Uber 合作伙伴 Avride 因自动驾驶事故接受调查

美国国家公路交通安全管理局（NHTSA）已对 Uber 的自动驾驶合作伙伴 Avride 展开调查，此前该公司涉及十多起碰撞事故，并造成了一名人员轻伤。

Poland says hackers breached water treatment plants, and the US is facing the same threat

波兰称黑客入侵水处理厂，美国正面临同样威胁

波兰情报机构发布报告，指控俄罗斯对该国军事和民用基础设施进行破坏和黑客攻击。报告警告称，美国的水处理等关键基础设施同样面临此类网络安全威胁。

US defense contractor who sold hacking tools to Russian broker ordered to pay $10M to former employers

美国国防承包商因向俄罗斯经纪人出售黑客工具被判向原雇主赔偿 1000 万美元

前网络安全高管 Peter Williams 因窃取监控和黑客工具，并以 130 万美元的价格出售给与普京政府有关联的俄罗斯经纪人，被法院判决向其原雇主支付 1000 万美元赔偿金。

Pentagon releases UFO files on new website

五角大楼在官网上发布 UFO 文件

五角大楼上线了专门的网站，用于发布不明空中现象（UAP）的相关视频、照片和原始文档。虽然这些材料经过了安全审查，但许多内容尚未进行详细的异常分析。

Truecaller slashes 70 jobs amid declining ad sales

Truecaller 因广告销售下滑裁员 70 人

由于广告收入大幅下降 44%，Truecaller 宣布裁员 70 人以应对财务压力。

Asus chases Elgato with its own secondary touchscreen display

华硕推出副屏触控显示器，对标 Elgato

华硕发布了 ROG Strix XG129C，这是一款 12.3 英寸的触控 IPS 显示器，旨在作为主显示器的辅助屏幕，直接竞争 Corsair 的 Xeneon Edge 产品。

Amazon is adding a vertical video feed to Prime Video

亚马逊为 Prime Video 添加垂直视频流

亚马逊 Prime Video 正在效仿 Netflix 和 Disney+，在其应用中引入“Clips”垂直短视频流，用户可以直接在流中观看片段并跳转至完整影片进行租赁或购买。

Here is Yarbo’s promise to fix the robot mower that ran me over

Yarbo 承诺修复曾撞伤作者的割草机器人

在报道了 Yarbo 割草机器人因安全漏洞被黑客劫持并撞伤作者的事件后，Yarbo 公司发布了长达 1,200 字的声明，承诺修复该产品存在的 GPS、Wi-Fi 及隐私泄露等严重安全问题。

All the latest updates on AI data centers

关于 AI 数据中心的最新动态

随着 AI 需求的激增，全球范围内掀起了建设大型数据中心的浪潮。然而，这些高能耗设施引发了关于电力供应、公用事业费用及环境影响的广泛争议。

DOGE used ChatGPT in a way that was both dumb and illegal, judge rules

法官裁定 DOGE 使用 ChatGPT 的方式既愚蠢又违法

美国地方法官 Colleen McMahon 裁定，政府效率部（DOGE）取消超过 1 亿美元拨款的程序违宪。裁决指出，DOGE 使用 ChatGPT 来判定项目是否涉及多元化、公平和包容性（DEI）的做法存在严重法律瑕疵。

ABC and Disney accuse Trump admin of violating First Amendment rights

ABC 和迪士尼指控特朗普政府侵犯第一修正案权利

ABC 指控联邦通信委员会（FCC）通过政策变动打压言论自由，特别是针对其脱口秀节目《The View》的调查。ABC 要求 FCC 维持其对新闻采访豁免权的长期立场。

Someone out-Trumped the Trump phone

有人“超越”了特朗普手机

Dreame 公司宣布将推出 29 个版本的 Aurora Lux 手机，引发了关于“特朗普手机”下落的持续讨论。目前该领域竞争激烈，各种品牌试图在营销上博取眼球。

Apple reportedly has a deal to use Intel-made chips again

据报道，苹果已达成协议再次使用英特尔制造的芯片

《华尔街日报》报道称，苹果与英特尔达成初步协议，英特尔将为苹果硬件代工芯片。这标志着苹果在全面转向自研芯片后，与英特尔在制造领域重新展开合作。

The Steam Controller’s reservation queue is open

Steam 手柄预订队列已开放

在 5 月 4 日首批 Steam 手柄迅速售罄后，Valve 推出了预订系统，确保用户能够以 99 美元的价格有序购买。

The 46 best last-minute Mother’s Day gift ideas for 2026

2026 年母亲节 46 个最佳临阵磨枪礼物创意

针对母亲节，本文整理了一份实用的礼物清单，涵盖了各类能减轻家务负担的智能小家电和生活好物。

ABC refuses to capitulate to Trump admin, fights FCC probe into The View

ABC 拒绝向特朗普政府屈服，对抗 FCC 对《The View》的调查

FCC 主席未能迫使 ABC 和迪士尼屈服，ABC 决定在法律层面抗争，捍卫其节目内容不受政府干预。

Sony says “efficient” AI tools will lead to even more games flooding the market

索尼称“高效”AI 工具将导致更多游戏充斥市场

索尼 PlayStation 表示，虽然 AI 工具能提升开发效率，但人类艺术家必须始终处于创作的核心地位，以保证游戏质量。

The unprecedented and deadly cruise ship hantavirus outbreak, explained

史无前例的致命游轮汉坦病毒爆发解析

一艘悬挂荷兰国旗的游轮上爆发了罕见的汉坦病毒疫情，导致 8 名乘客感染，其中 3 人死亡。专家表示，目前公众面临的风险较低，这并非新冠式的全球威胁。

Course correction: Google to link more sources in AI Overviews

纠偏：Google 将在 AI 概览中链接更多来源

针对 AI 搜索结果缺乏透明度的批评，Google 宣布将通过多种方式在 AI 概览中增加对原始来源的引用。

Court rules Trump’s 10% tariff is just as illegal as the tariff it replaced

法院裁定特朗普的 10% 关税与其取代的关税一样非法

法院再次否决了特朗普政府的关税政策，这让科技行业对未来贸易政策的不确定性感到担忧。

Chaos erupts as cyberattack disrupts learning platform Canvas amid finals

黑客攻击导致 Canvas 学习平台瘫痪，期末考试陷入混乱

全国范围内的学校和大学因 Canvas 平台遭受网络攻击而被迫推迟期末考试，引发了广泛的教学秩序混乱。

Elon Musk faces criminal probe in France after ignoring summons in X case

埃隆·马斯克因无视 X 案传唤在法国面临刑事调查

法国当局威胁称，如果马斯克不配合调查并出庭接受质询，将对其提起刑事指控。

Chrome’s 4GB AI model isn’t new, but you’re not wrong for being confused

Chrome 的 4GB AI 模型并非新事物，但你感到困惑并非没有道理

Chrome 浏览器占用的 4GB 本地 AI 模型空间引发了用户不满。虽然可以禁用，但这种默认行为引发了关于浏览器资源占用和用户自主权的讨论。

Engineers at NASA’s Jet Propulsion Lab make a breakthrough in rotor technology

NASA 喷气推进实验室工程师在旋翼技术上取得突破

测试表明，新型旋翼叶片在超音速旋转时不会解体，这一进展对未来的航空器设计具有重要意义。

DNA identifies four more crew members of doomed Franklin expedition

DNA 鉴定出富兰克林探险队四名船员身份

通过 DNA 技术，研究人员确认了富兰克林探险队中另外四名船员的身份，其中三人来自 HMS Erebus 号，一人来自 HMS Terror 号。

Sendly

Sendly：面向 AI 代理和开发者的短信服务。

Ara

Ara：集成在 Mac 屏幕缺口（Notch）中的智能代理，支持计算机操作。

SuperIsland

SuperIsland：为 macOS 提供的动态岛扩展工具。

ElevenCreative Flows

ElevenCreative Flows：基于节点的创意工作流工具，支持实时协作。

GlowIsland

GlowIsland：将 Mac 的屏幕缺口转化为交互式工具栏。

KodHau

KodHau：通过团队决策逻辑防止 AI 破坏生产环境。

Photobomb

Photobomb：基于相机胶卷的“人类卡牌”类游戏。

RankSpot

RankSpot：基于深度竞争情报的 AI SEO 博客工具。

Google Health

Google Health：一种全新的健康管理关系。

Maia Executives

Maia Executives：端到端运行业务运营的 AI 高管。

Here’s what you need to know about the cruise ship hantavirus outbreak

关于游轮汉坦病毒爆发你需要知道的事

针对游轮上发生的汉坦病毒疫情，本文详细解释了该病毒的传播途径（主要通过鼠类）以及为何目前公众无需过度恐慌。

The Download: AI malaise and babymaking tech

下载：AI 萎靡与生育技术

本期简报探讨了 AI 技术的普及对社会的影响，以及生育技术（如 IVF）的最新进展。

Here’s how technology transformed babymaking

技术如何改变了生育

从 1978 年首个试管婴儿诞生至今，IVF 技术经历了巨大变革。本文回顾了生育技术的演进及其对未来的影响。

The Download: the tech reshaping IVF and the rise of balcony solar

下载：重塑 IVF 的技术与阳台太阳能的兴起

本期简报关注了 IVF 技术的最新突破，以及阳台太阳能系统在美国的普及趋势。

The balcony solar boom is coming to the US

阳台太阳能热潮即将来临

受欧洲成功经验启发，美国多个州正在立法推动“阳台太阳能”系统，旨在降低家庭能源成本并减少碳排放。

What’s next for IVF

IVF 的未来展望

IVF 技术在过去 48 年中帮助数百万家庭实现了生育愿望，未来该领域将向更高效、更低成本的方向发展。

The Download: seafloor science and military chatbots

下载：海底科学与军事聊天机器人

本期简报介绍了深海探测潜水器的科学应用，以及军事领域对 AI 聊天机器人的探索。

The Download: inside the Musk v. Altman trial, and AI for democracy

下载：马斯克诉奥特曼审判内幕与民主 AI

本期简报深入报道了马斯克与奥特曼之间的法律诉讼，以及 AI 在加强民主治理方面的潜力。

A blueprint for using AI to strengthen democracy

利用 AI 加强民主的蓝图

本文探讨了 AI 如何像印刷术和电报一样，重塑社会治理结构，并为民主制度的强化提供技术路径。

Week one of the Musk v. Altman trial: What it was like in the room

马斯克诉奥特曼审判第一周：现场见闻

本文详细记录了马斯克与奥特曼在奥克兰法庭上的首次交锋，探讨了双方关于 OpenAI 早期资金投入的争议。

anthropics / financial-services

Anthropic 金融服务 AI 代理库。

addyosmani / agent-skills

AI 编码代理的生产级工程技能指南。

Hmbown / DeepSeek-TUI

DeepSeek 模型的终端编码代理。

z-lab / dflash

DFlash：用于闪存推测解码的块扩散模型。

decolua / 9router

9router：提供免费 AI 编码支持的路由工具，支持多种模型提供商。

CloakHQ / CloakBrowser

CloakBrowser：能够通过所有机器人检测测试的隐身 Chromium 浏览器。

awslabs / aidlc-workflows

AI 驱动的生命周期（AI-DLC）自适应工作流 steering 规则。

HKUDS / AI-Trader

AI-Trader：100% 全自动代理原生交易系统。

LearningCircuit / local-deep-research

本地化深度研究工具，支持所有本地及云端 LLM。

lobehub / lobehub

LobeHub：多代理协作与团队设计的终极空间。

Running Codex safely at OpenAI

在 OpenAI 安全运行 Codex

OpenAI 介绍了如何通过沙箱、审批流程、网络策略和代理原生遥测技术，确保 Codex 编码代理的安全与合规。

Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber

利用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全信任访问

OpenAI 扩展了网络安全信任访问计划，帮助防御者加速漏洞研究并保护关键基础设施。

Parloa builds service agents customers want to talk to

Parloa 构建客户乐于交流的服务代理

Parloa 利用 OpenAI 模型驱动语音 AI 客户服务代理，实现企业级实时交互。

Advancing voice intelligence with new models in the API

通过 API 中的新模型推进语音智能

OpenAI 发布了新的实时语音模型，支持推理、翻译和转录，提供更自然的语音体验。

Testing ads in ChatGPT

在 ChatGPT 中测试广告

OpenAI 开始在 ChatGPT 中测试广告，以支持免费访问，并承诺提供清晰的标签、答案独立性和隐私保护。

Introducing Trusted Contact in ChatGPT

在 ChatGPT 中引入“信任联系人”功能

ChatGPT 推出可选的安全功能，若检测到严重的自残倾向，将通知用户指定的信任联系人。

Simplex rethinks software development with Codex

Simplex 利用 Codex 重塑软件开发

Simplex 通过 ChatGPT Enterprise 和 Codex 缩短了设计、构建和测试时间，实现了 AI 驱动的工作流扩展。

How ChatGPT learns about the world while protecting privacy

ChatGPT 如何在保护隐私的同时学习世界知识

OpenAI 解释了其如何通过减少训练数据中的个人信息，并赋予用户控制权来保护隐私。

Uber uses OpenAI to help people earn smarter and book faster

Uber 利用 OpenAI 帮助司机更聪明地赚钱，乘客更快地预订

Uber 整合 OpenAI 技术，通过 AI 助手和语音功能优化全球实时市场。

How frontier firms are pulling ahead

前沿企业如何脱颖而出

OpenAI 的 B2B 信号研究显示，领先企业通过深度 AI 采用和 Codex 驱动的代理工作流构建了竞争优势。

Introducing Claude Opus 4.7

推出 Claude Opus 4.7

Claude Opus 4.7 在编码、代理任务、视觉处理和多步推理方面表现更强，提供更高的工作一致性。

Introducing Claude Design by Anthropic Labs

推出 Anthropic Labs 的 Claude Design

Claude Design 允许用户与 Claude 协作创建视觉作品，如原型、幻灯片和单页文档。

Claude is a space to think

Claude 是一个思考的空间

Anthropic 承诺 Claude 将保持无广告，认为广告激励与 AI 助手的初衷不符。

Higher usage limits for Claude and a compute deal with SpaceX

Claude 使用限额提升及与 SpaceX 的计算协议

Anthropic 宣布提升 Claude 的使用限额，并与 SpaceX 达成计算资源合作。

Agents for financial services

金融服务代理

Anthropic 推出专门针对金融服务行业的 AI 代理解决方案。

Building a new enterprise AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs

与 Blackstone、Hellman & Friedman 及高盛共同构建企业 AI 服务公司

Anthropic 宣布与多家金融巨头合作，成立新的企业 AI 服务公司。

Claude for Creative Work

Claude 用于创意工作

Claude 助力创意工作者提升效率。

Anthropic names Theo Hourmouzis General Manager of Australia & New Zealand and officially opens Sydney office

Anthropic 任命 Theo Hourmouzis 为澳新地区总经理并正式开设悉尼办公室

Anthropic 持续扩张全球版图，正式进入澳大利亚市场。

An update on our election safeguards

选举安全保障更新

Anthropic 发布了关于选举期间 AI 安全保障措施的最新进展。

Anthropic and NEC collaborate to build Japan’s largest AI engineering workforce

Anthropic 与 NEC 合作构建日本最大的 AI 工程人才队伍

双方将共同致力于提升日本的 AI 工程能力。

See what happens when creative legends use AI to make ads for small businesses.

看看创意传奇人物如何利用 AI 为小企业制作广告

Google 推出“The Small Brief”计划，邀请广告业巨头利用 AI 为当地小企业创作广告。

5 gardening tips you can try right in Search

5 个可以在搜索中直接尝试的园艺技巧

Google 整合 AI 模式、搜索直播和购物功能，帮助用户更好地打理花园。

Google is partnering with XPRIZE and Range Media Partners on the $3.5 million Future Vision film competition.

Google 与 XPRIZE 及 Range Media Partners 合作举办 350 万美元的“未来愿景”电影竞赛。

The latest AI news we announced in April 2026

2026 年 4 月 Google AI 最新动态汇总。

Reduce friction and latency for long-running jobs with Webhooks in Gemini API

利用 Gemini API 中的 Webhooks 减少长任务的摩擦与延迟

事件驱动的 Webhooks 系统消除了低效的轮询需求。

Celebrating 20 years of Google Translate: Fun facts, tips and new features to try

庆祝 Google 翻译 20 周年：趣味事实、技巧与新功能

Google 翻译从 2006 年的 AI 实验发展至今，已支持近 250 种语言。

Join the new AI Agents Vibe Coding Course from Google and Kaggle

加入 Google 与 Kaggle 推出的 AI 代理“Vibe Coding”课程

5 天 AI 代理强化课程现已开放注册。

8 Gemini tips for organizing your space (and life)

8 个利用 Gemini 整理空间与生活的技巧

利用 AI 制定清洁计划、清理收件箱及安排季节性家务。

Here’s how our TPUs power increasingly demanding AI workloads.

TPU 如何驱动日益严苛的 AI 工作负载

Google 展示了其 TPU 在处理大规模 AI 任务中的核心作用。

Elevating Austria: Google invests in its first data center in the Alps.

提升奥地利：Google 在阿尔卑斯山投资首个数据中心

该数据中心位于 Kronstorf，将创造 100 个直接就业岗位。

CyberSecQwen-4B: Why Defensive Cyber Needs Small, Specialized, Locally-Runnable Models

CyberSecQwen-4B：为何防御性网络安全需要小型、专业化、可本地运行的模型

EMO: Pretraining mixture of experts for emergent modularity

EMO：用于涌现模块化的专家混合模型预训练

vLLM V0 to V1: Correctness Before Corrections in RL

vLLM V0 到 V1：强化学习中的正确性优先于修正

Adding Benchmaxxer Repellant to the Open ASR Leaderboard

在 Open ASR 排行榜中加入“基准测试作弊”防御机制

Granite 4.1 LLMs: How They’re Built

Granite 4.1 LLM：构建过程解析

DeepInfra on Hugging Face Inference Providers 🔥

DeepInfra 加入 Hugging Face 推理提供商

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

推出 NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频代理的长上下文多模态智能

How to build scalable web apps with OpenAI’s Privacy Filter

如何利用 OpenAI 的隐私过滤器构建可扩展的 Web 应用

DeepSeek-V4: a million-token context that agents can actually use

DeepSeek-V4：代理真正可用的百万 Token 上下文

How to Use Transformers.js in a Chrome Extension

如何在 Chrome 扩展中使用 Transformers.js

After Orthogonality: Virtue-Ethical Agency and AI Alignment

正交性之后：美德伦理代理与 AI 对齐

本文探讨了理性 AI 不应仅以“目标”为导向，而应将行动与实践网络对齐。

AGI Is Not Multimodal

AGI 不是多模态的

本文认为，过度依赖语言模型作为思维模型，会忽略人类智能中至关重要的具身理解。

Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

形状、对称性与结构：数学在机器学习研究中角色的转变

机器学习研究正从数学驱动转向工程驱动，计算规模成为进步的关键。

What’s Missing From LLM Chatbots: A Sense of Purpose

LLM 聊天机器人缺失了什么：目的感

尽管基准测试分数不断提高，但用户体验并未同步提升，因为机器人缺乏明确的“目的感”。

We Need Positive Visions for AI Grounded in Wellbeing

我们需要基于福祉的 AI 正向愿景

AI 正在重塑社会，我们需要构建以人类福祉为核心的 AI 发展愿景。

Financial Market Applications of LLMs

LLM 在金融市场的应用

LLM 在处理序列数据方面的能力，使其在金融建模中展现出巨大潜力。

A Brief Overview of Gender Bias in AI

AI 中性别偏见的简要概述

探讨了 AI 模型中存在的性别偏见及其影响。

Mamba Explained

Mamba 详解

Mamba 作为一种基于状态空间模型（SSM）的新型 AI 模型，为处理长序列提供了比 Transformer 更高效的替代方案。

Car-GPT: Could LLMs finally make self-driving cars happen?

Car-GPT：LLM 能否最终实现自动驾驶？

探讨了 LLM 在自动驾驶中的应用潜力及面临的关键挑战。

Do text embeddings perfectly encode text?

文本嵌入能完美编码文本吗？

“Vec2text”技术展示了将嵌入还原为文本的可能性，强调了嵌入数据安全协议的紧迫性。

Understanding Annotator Safety Policy with Interpretability

通过可解释性理解标注员安全策略

研究探讨了标注员在安全策略理解上的分歧来源，包括任务误解和策略模糊性。

ZAYA1-8B Technical Report

ZAYA1-8B 技术报告

ZAYA1-8B 是一款基于 MoE++ 架构的推理型专家混合模型，在 AMD 全栈计算平台上完成训练。

Partial Evidence Bench: Benchmarking Authorization-Limited Evidence in Agentic Systems

Partial Evidence Bench：代理系统中授权受限证据的基准测试

针对企业代理在受限检索环境下的表现进行评估。

BALAR : A Bayesian Agentic Loop for Active Reasoning

BALAR：用于主动推理的贝叶斯代理循环

BALAR 引入了一种原则性机制，使代理能够推理缺失信息并主动提问。

Intelligent CCTV for Urban Design: AI-Based Analysis of Soft Infrastructure at Intersections

城市设计的智能 CCTV：基于 AI 的交叉口软基础设施分析

利用现有 CCTV 基础设施评估临时行人避难所等软干预措施的影响。

当乐于助人变成谄媚：谄媚是 LLM 社会对齐与认知完整性之间的边界失效

本文认为 LLM 的谄媚行为是社会对齐与客观事实之间平衡失败的结果。

PRISM: Perception Reasoning Interleaved for Sequential Decision Making

PRISM：用于顺序决策的感知推理交织模型

PRISM 解决了视觉语言模型在感知、推理和决策之间的脱节问题。

Agentic Retrieval-Augmented Generation for Financial Document Question Answering

用于金融文档问答的代理式检索增强生成

针对金融文档中复杂的数值推理和异构证据处理，提出了多步代理式 RAG 方法。

AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

AdaGATE：用于多跳 RAG 的自适应间隙感知证据组装

AdaGATE 优化了多跳问题中证据的检索与组装效率。

Counterargument for Critical Thinking as Judged by AI and Humans

AI 与人类评判下的批判性思维反驳研究

研究探讨了在生成式 AI 环境下，学生使用反驳写作进行批判性思维训练的效果。

Generating Query-Focused Summarization Datasets from Query-Free Summarization Datasets

从无查询摘要数据集生成查询聚焦摘要数据集

探讨了自动生成查询聚焦摘要（QFS）数据的可行性。

SLAM: Structural Linguistic Activation Marking for Language Models

SLAM：语言模型的结构化语言激活标记

SLAM 是一种无需牺牲文本质量的白盒水印方案。

ReaComp: Compiling LLM Reasoning into Symbolic Solvers for Efficient Program Synthesis

ReaComp：将 LLM 推理编译为符号求解器以实现高效程序合成

利用编码代理将推理轨迹编译为可重用的符号程序合成器。

Chainwash: Multi-Step Rewriting Attacks on Diffusion Language Model Watermarks

Chainwash：针对扩散语言模型水印的多步重写攻击

研究了针对扩散模型水印的统计攻击方法。

A Few Good Clauses: Comparing LLMs vs Domain-Trained Small Language Models on Structured Contract Extraction

几个好条款：LLM 与领域训练小语言模型在结构化合同提取上的对比

研究表明，领域训练的小语言模型在合同提取任务上能以极低成本超越前沿 LLM。

The Cost of Context: Mitigating Textual Bias in Multimodal Retrieval-Augmented Generation

上下文的代价：缓解多模态 RAG 中的文本偏见

识别并形式化了多模态 RAG 中因引入外部文档而导致的严重失败模式。

The Pentagon Releases New Trove of Declassified UFO Files

五角大楼发布新一批解密 UFO 文件

国防部公开了更多关于政府 UFO 目击事件的解密文档。

Tesla’s Latest Recall? Wheels May Fall Off Cybertrucks

特斯拉最新召回？Cybertruck 车轮可能脱落

这是 Cybertruck 的第 11 次召回，原因涉及错误的润滑脂和松动的螺母。

Nick Bostrom Has a Plan for Humanity’s ‘Big Retirement’

尼克·波斯特罗姆为人类的“大退休”制定了计划

哲学家波斯特罗姆认为，人类应追求先进 AI，以实现一个“被解决的世界”。

There’s a Long-Shot Proposal to Protect California Workers From AI

加州有一项保护工人免受 AI 影响的长期提案

加州州长候选人 Tom Steyer 提议为被 AI 取代的工人提供就业保障。

The Best Mobile Gaming Controllers for iPhone and Android (2026)

2026 年 iPhone 和 Android 最佳移动游戏手柄

Backbone 被评为最佳移动游戏手柄，能将手机转化为全功能游戏机。

我们邀请咖啡专家盲测咖啡机，结果令人惊讶

在 WIRED 的盲测中，领先的全能咖啡机表现出人意料。

Billie Eilish Doesn’t Know if There Will Ever Be Another Billie Eilish

比莉·艾利什不知道是否还会有下一个比莉·艾利什

在采访中，比莉·艾利什讨论了未来艺术家是否还能像她一样利用 SoundCloud 获得成功。

The New Wild West of AI Kids’ Toys

AI 儿童玩具的新狂野西部

这些联网的毛绒玩具正在颠覆儿童游戏方式，引发了立法者对其安全性的担忧。

The Best Cat Water Fountains of 2026: Petlibro, Petkit, Oneisall

2026 年最佳猫用饮水机：Petlibro、Petkit、Oneisall

确保猫咪水分充足是保持宠物健康的关键。

Venom and Hot Peppers Offer a Key to Killing Resistant Bacteria

毒液和辣椒为杀死耐药细菌提供了关键

研究人员利用蝎子毒液和哈瓦那辣椒开发了三种新型抗生素，用于对抗结核病等耐药病原体。

Just Fucking Use Go

直接用 Go 语言吧。

Stop MITM on the first SSH connection, on any VPS or cloud provider

在任何 VPS 或云服务商上，停止首次 SSH 连接的中间人攻击。

Serving a Website on a Raspberry Pi Zero Running Entirely in RAM

在完全运行于内存的树莓派 Zero 上托管网站。

Dirty Frag: Universal Linux LPE

Dirty Frag：通用 Linux 本地提权漏洞。

The `Sync` bound nobody asked for

没人要求的 Sync 约束。

What We Lost the Last Time Code Got Cheap

上次代码变得廉价时我们失去了什么。

building a web server in aarch64 assembly to give my life (a lack of) meaning

用 aarch64 汇编构建 Web 服务器，赋予我生活（一种缺乏的）意义。

Why Don’t Lowercase Letters Come Right After Uppercase Letters in ASCII?

为什么 ASCII 中小写字母没有紧跟在大写字母后面？

What are you doing this weekend?

这个周末你打算做什么？

jj v0.41.0 is out

jj v0.41.0 发布。

A HIPAA-safe alert pipeline checklist (8 controls)

HIPAA 安全警报管道检查清单（8 项控制措施）

针对医疗 SaaS 产品的警报管道合规性，本文提供了 8 项关键控制措施，以确保监控日志不泄露敏感信息。

Bridge the gap: Connecting design, PM and code with MCPs

弥合差距：利用 MCP 连接设计、项目管理与代码

本文介绍了如何通过 MCP（模型上下文协议）构建稳定的 AI 工作流，连接设计工具、项目管理看板和代码编辑器。

The Definitive Guide to multi-cluster with Pulumi and Docker 25: Lessons Learned

Pulumi 与 Docker 25 多集群管理权威指南：经验教训

基于 40 多次生产部署经验，本文总结了如何通过 Pulumi 解决多集群配置漂移问题，减少 72% 的配置相关故障。

Angular State Management is Changing: Part 2 (And NgRx Isn’t What You Think Anymore)

Angular 状态管理正在改变：第二部分（NgRx 已不再是你以为的样子）

随着 Signals 的引入，NgRx 在 Angular 应用中的必要性受到挑战，本文探讨了状态管理的新范式。

The Semantic Airgap: Why “Hinglish” is the Ultimate Zero-Day for Voice Agents

语义气隙：为何“印地英语”是语音代理的终极零日漏洞

随着语音代理在多语言环境下的普及，混合语言（如 Hinglish）成为了安全防御的盲点。

Your PDFs Never Leave Your Pocket: Building a 100% Offline RAG App with Gemma 4 + LiteRT-LM

你的 PDF 永不离身：利用 Gemma 4 + LiteRT-LM 构建 100% 离线 RAG 应用

针对医疗和法律等对隐私要求极高的行业，本文展示了如何构建完全离线的 AI 文档处理应用。

Day 1 — I’m Homeless. I Just Shipped an Autonomous Multi-Agent System.

第一天——我无家可归，但我刚刚发布了一个自主多代理系统。

开发者分享了在极端个人困境下，如何通过构建自主多代理系统实现技术突破的经历。

A protocol for auditing AI agent harnesses

AI 代理框架审计协议

针对编码代理的失败模式，本文提出了一套审计协议，旨在通过验证器和多候选采样提升代理的解决率。

Anthropic prompt caching cut our RCA cost by 90%

Anthropic 提示词缓存将我们的根因分析（RCA）成本降低了 90%

通过利用提示词缓存技术，企业在处理大规模生产环境下的 LLM 调用时，显著降低了运营成本。

How to Secure an Ubuntu Linux Server for Production

如何保护生产环境下的 Ubuntu Linux 服务器

本文分享了加固 Linux 服务器的必要步骤，以防止暴力破解、恶意软件和未经授权的访问。

How Meta Is Strengthening End-to-End Encrypted Backups

Meta 如何加强端到端加密备份

Meta 利用基于 HSM 的备份密钥库，确保 WhatsApp 和 Messenger 的备份历史记录安全。

Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

现代化 Facebook 群组搜索，释放社区知识的力量

Meta 采用了混合检索架构和自动化模型评估，提升了群组内容的发现与验证效率。

Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

Meta 的容量效率：统一 AI 代理如何优化超大规模性能

Meta 构建了 AI 代理平台，自动化识别并修复基础设施性能问题，节省了电力并释放了工程师时间。

Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

Meta 的后量子密码迁移：框架、经验与启示

Meta 分享了其在后量子密码迁移中的经验，提出了“迁移级别”概念以管理复杂性。

Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases

逃离分支：Meta 如何在 50 多个用例中实现 WebRTC 现代化

Meta 解决了内部 WebRTC 分支与上游脱节的问题，通过构建自动化工具保持同步。

Trust But Canary: Configuration Safety at Scale

信任但金丝雀：大规模配置安全

Meta 讨论了如何通过金丝雀发布和渐进式 rollout 确保配置变更的安全性。

How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

Meta 如何利用 AI 映射大规模数据管道中的部落知识

Meta 通过 AI 代理分析跨仓库、多语言的代码库，解决了 AI 辅助编码在复杂项目中的效率问题。

KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

KernelEvolve：Meta 的排序工程师代理如何优化 AI 基础设施

Meta 介绍了其排序工程师代理的 ML 探索能力，用于自主设计和分析排序模型实验。

Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta 自适应排序模型：弯曲推理扩展曲线以服务广告 LLM 规模模型

Meta 正在将广告推荐模型扩展至 LLM 规模，以实现对用户更深层的理解。

AlphaEvolve: How our Gemini-powered coding agent is scaling impact across fields

AlphaEvolve：Gemini 驱动的编码代理如何跨领域扩展影响力

AlphaEvolve 利用 Gemini 算法在商业、基础设施和科学领域推动突破。

Enabling a new model for healthcare with AI co-clinician

通过 AI 临床辅助实现医疗新模式

DeepMind 正在研究 AI 辅助护理路径，开发 AI 临床医生助手。

Announcing our partnership with the Republic of Korea

宣布与大韩民国建立合作伙伴关系

Google DeepMind 与韩国合作，利用前沿 AI 模型加速科学突破。

Decoupled DiLoCo: A new frontier for resilient, distributed AI training

解耦 DiLoCo：弹性分布式 AI 训练的新前沿

Partnering with industry leaders to accelerate AI transformation

与行业领袖合作加速 AI 转型

DeepMind 与全球咨询公司合作，将前沿 AI 能力带给全球组织。

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

Gemini 3.1 Flash TTS：下一代表现力 AI 语音

引入颗粒度音频标签，实现对 AI 语音表现力的精确控制。

Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning

Gemini Robotics-ER 1.6：通过增强具身推理驱动现实世界机器人任务

增强了机器人的空间推理和多视角理解能力。

Gemma 4: Byte for byte, the most capable open models

Gemma 4：字节对字节，最强大的开源模型

Gemma 4 专为高级推理和代理工作流构建。

Gemini 3.1 Flash Live: Making audio AI more natural and reliable

Gemini 3.1 Flash Live：让音频 AI 更自然、更可靠

改进了语音模型的精度和延迟，使交互更流畅。

Protecting people from harmful manipulation

保护人们免受有害操纵

DeepMind 研究 AI 在金融和健康领域的有害操纵风险，并制定安全措施。

A conversation with Kevin Scott: What’s next in AI

与 Kevin Scott 对话：AI 的下一步是什么

[Read more →