AI News Daily - 2026-05-01

2026-05-01

今日要点

AI 行业法律与伦理风暴：OpenAI 与 Elon Musk 的法律诉讼正式开庭，涉及 OpenAI 早期发展及模型训练争议；同时，Meta 因外包员工目睹智能眼镜拍摄的不雅内容而陷入舆论危机。
能源与基础设施转型：比利时宣布停止核电站退役计划，寻求能源安全；OpenAI 与 Microsoft 持续加码算力基础设施，以应对 AGI 时代的算力需求。
AI 代理（Agent）生态爆发：从 Anthropic 的 Claude Code 到 Meta 的 Ranking Engineer Agent，AI 代理正从简单的对话工具向具备自主执行、代码编写及基础设施维护能力的“智能体”演进。
开源社区的 AI 抵制与反思：Zig 项目因严格的“反 AI”贡献政策引发热议，反映了开源社区在 AI 自动化浪潮下的版权与原创性焦虑。

Hacker News

Where the goblins came from

Claude Code refuses requests or charges extra if your commits mention “OpenClaw”

Belgium stops decommissioning nuclear power plants

比利时停止核电站退役计划

比利时首相 Bart De Wever 宣布，该国将停止核电站的退役进程。政府计划与运营商 ENGIE 展开谈判，旨在将核电站收归国有。此举旨在确保国家能源供应的安全、经济与可持续性，并减少对化石燃料的依赖。

The Zig project’s rationale for their anti-AI contribution policy

Zig 项目关于反 AI 贡献政策的理由

Zig 编程语言项目实施了开源界最严格的“反 LLM”政策之一，明确禁止在提交代码（Pull Requests）和 Bug 追踪器中使用 AI 生成内容。该项目鼓励使用英语，但也欢迎开发者使用母语，并由社区成员自行选择翻译工具，以此维护代码库的纯粹性与原创性。

Mozilla’s opposition to Chrome’s Prompt API

Mozilla 反对 Chrome 的 Prompt API

Mozilla 对 Blink 引擎提出的 Prompt API 原型意向表示反对。该 API 旨在浏览器层面集成 AI 提示词功能，但 Mozilla 的立场引发了关于 Web 标准化与浏览器 AI 功能集成边界的讨论。

Meta in row after workers who saw smart glasses users having sex lose jobs

Meta 因员工目睹智能眼镜用户不雅行为并被解雇而陷入争议

Meta 正在面临解释压力，原因在于其解雇了一家负责 AI 训练的承包商（Sama）的员工。这些员工此前向媒体透露，他们在工作中被迫观看了由 Meta 智能眼镜拍摄的图形化不雅内容，引发了关于 AI 数据标注工作伦理与隐私保护的广泛讨论。

Spain’s parliament will act against massive IP blockages by LaLiga

西班牙议会将针对西甲联赛的大规模 IP 封锁采取行动

西班牙议会计划介入并限制西甲联赛（LaLiga）在打击盗版过程中实施的大规模 IP 封锁行为。此前，西甲联赛因过度封锁 IP 地址而引发了关于网络自由与版权执法边界的争议。

How Mark Klein told the EFF about Room 641A [book excerpt]

Mark Klein 如何向 EFF 揭露 641A 机房 [书籍摘录]

本文摘录了 Mark Klein 向电子前哨基金会（EFF）揭露美国国家安全局（NSA）秘密监听设施“641A 机房”的经过，详细记录了这一历史性监控丑闻的幕后细节。

Craig Venter has died

Craig Venter 去世

J. Craig Venter 博士于 2026 年 4 月 29 日在圣地亚哥去世，享年 79 岁。作为人类基因组计划的关键人物及 JCVI 研究所的创始人，Venter 在癌症治疗并发症后不幸离世，科学界对其在基因组学领域的开创性贡献表示深切哀悼。

CopyFail was not disclosed to Gentoo developer

CopyFail 未向 Gentoo 开发者披露

近期关于“CopyFail”漏洞的讨论持续发酵，该漏洞被指未及时向 Gentoo 开发者披露，引发了开源社区对于安全漏洞披露流程与协作机制的质疑。

GCC 16 has been released

GCC 16 发布

GCC 16 编译器正式发布，带来了大量性能改进与功能增强。此次更新重点包括 GNU 卸载与多处理项目（GOMP）的优化以及 OpenACC 的支持更新，开发者可查阅官方文档了解详细的移植指南。

Shai-Hulud Themed Malware Found in the PyTorch Lightning AI Training Library

在 PyTorch Lightning AI 训练库中发现“沙虫”主题恶意软件

安全研究人员在 PyTorch Lightning 库中发现了一款以《沙丘》中“沙虫”（Shai-Hulud）为主题的恶意软件。该事件凸显了 AI 训练框架在供应链安全方面面临的严峻挑战。

How an oil refinery works

炼油厂的工作原理

尽管风能和太阳能占比不断提升，但全球经济仍高度依赖石油。本文详细介绍了现代炼油厂的运作流程，解释了原油如何转化为我们日常使用的能源产品。

Granite 4.1: IBM’s 8B Model Matching 32B MoE

IBM 发布 Granite 4.1：8B 模型性能媲美 32B MoE

IBM 推出了专为企业设计的 Granite 4.1 开源模型系列。该系列采用 Apache 2.0 许可，在 15 万亿 token 上进行训练。其中 8B 模型通过独特的流水线优化，在基准测试中展现出了媲美 32B 混合专家（MoE）模型的性能。

U.S. Senators Vote to Ban Themselves from Trading on Prediction Markets

美国参议员投票禁止自身参与预测市场交易

美国参议员投票通过了一项法案，禁止议员本人在预测市场上进行交易，旨在消除潜在的利益冲突，提升公众对立法机构的信任度。

Apple was surprised by AI-driven demand for Macs

苹果对 AI 驱动的 Mac 需求感到意外

苹果公司表示，由于 AI 功能带来的强劲需求，Mac Mini、Studio 和 Neo 系列在下一季度仍将面临供应短缺。

Legal AI startup Legora hits $5.6B valuation and its battle with Harvey just got hotter

法律 AI 初创公司 Legora 估值达 56 亿美元，与 Harvey 的竞争加剧

法律 AI 领域竞争白热化，Legora 估值飙升至 56 亿美元。该公司与竞争对手 Harvey 之间不仅在融资额上展开较量，双方的广告战也愈演愈烈。

Rivian downsizes DOE loan to $4.5B, while boosting capacity of Georgia factory

Rivian 将能源部贷款缩减至 45 亿美元，同时提升佐治亚工厂产能

Rivian 与美国能源部重新协商了贷款协议，贷款总额从 66 亿美元下调至 45 亿美元，用于建设佐治亚州的新工厂。

Hackers are actively exploiting a bug in cPanel, used by millions of websites

黑客正积极利用 cPanel 漏洞，数百万网站受影响

全球数百万网站使用的 cPanel 面板存在严重漏洞，目前正遭到黑客积极利用。网络托管公司正紧急修复该漏洞，据称攻击行为已持续数月。

After dissing Anthropic for limiting Mythos, OpenAI restricts access to Cyber, too

在批评 Anthropic 限制 Mythos 后，OpenAI 也限制了 Cyber 的访问

OpenAI 宣布将其网络安全测试工具 GPT-5.5 Cyber 的访问权限仅限于“关键网络防御者”，此举引发了对其此前批评 Anthropic 限制模型访问行为的讽刺讨论。

EV startup Faraday Future paid $7.5M to company tied to founder Jia Yueting

电动汽车初创公司法拉第未来向贾跃亭关联公司支付 750 万美元

处于困境中的电动汽车公司法拉第未来（Faraday Future）在 SEC 调查期间，向其创始人贾跃亭关联的公司支付了 750 万美元。该调查已于今年 3 月结束。

OpenAI announces new advanced security for ChatGPT accounts, including a partnership with Yubico

OpenAI 宣布 ChatGPT 账户高级安全功能，并与 Yubico 达成合作

OpenAI 为 ChatGPT 账户推出了新的可选安全保护措施，包括与安全密钥提供商 Yubico 的合作，旨在防止账户被盗并保护敏感数据。

Elon Musk testifies that xAI trained Grok on OpenAI models

埃隆·马斯克作证称 xAI 使用 OpenAI 模型训练 Grok

在法庭作证中，埃隆·马斯克承认 xAI 使用了 OpenAI 的模型来训练 Grok。这一“蒸馏”行为引发了关于前沿实验室如何防止竞争对手复制其模型的热议。

FDA approval, fundraising, and the reality of building in healthcare according to BioticsAI founder

BioticsAI 创始人谈 FDA 批准、融资及医疗行业创业现实

BioticsAI 首席执行官 Robhy Bustami 在 Build Mode 节目中分享了公司如何在高度监管的医疗领域中应对繁琐流程、获得 FDA 批准并保持团队动力的经验。

Google’s Gemini AI assistant is hitting the road in millions of vehicles

谷歌 Gemini AI 助手进入数百万辆汽车

谷歌正将其先进的对话式 AI 助手 Gemini 集成到数百万辆汽车中，旨在提升驾驶体验的智能化水平。

Roblox’s daily users continue to drop as age-checks slow growth

Roblox 日活用户持续下降，年龄验证机制拖累增长

Roblox 的日活跃用户数在上一季度继续下滑，目前全球日活用户为 1.32 亿，低于去年年底的 1.44 亿。分析认为，平台实施的年龄验证机制在一定程度上减缓了用户增长。

Congress keeps kicking surveillance reform down the road

国会继续推迟监控改革

美国国会再次将《外国情报监视法》（FISA）第 702 条的授权延长了 45 天。此举旨在为立法者争取更多时间来协商这项备受争议的窃听法案的改革方案。

Apple’s iPhone revenue jumps to $57 billion despite chip shortages

尽管芯片短缺，苹果 iPhone 营收仍跃升至 570 亿美元

尽管供应链问题影响了处理器供应，苹果 iPhone 营收仍同比增长 22%，达到 570 亿美元。CEO 蒂姆·库克表示需求极其强劲，但零部件供应仍存在限制。

Rivian’s revenue is up as R2 production kicks into gear

Rivian 营收增长，R2 生产步入正轨

Rivian 发布了 2026 年第一季度财报，显示公司营收增长，且关键车型 R2 的生产工作已正式启动。第一季度共交付 10,365 辆汽车，同比增长 20%。

Rivian downsizes new EV factory after Trump’s DOE slashes loan agreement

Rivian 在特朗普政府能源部削减贷款协议后缩减新电动汽车工厂规模

Rivian 宣布调整其佐治亚州工厂的建设计划。原定分两期建设、总产能 40 万辆的计划，因能源部贷款额度削减而被迫缩减规模。

The logic of the racist Supreme Court isn’t adding up

最高法院的种族主义逻辑令人费解

本文批评了最高法院在 Louisiana v. Callais 一案中的裁决，认为该裁决废除了《投票权法案》第 2 条，为种族主义选区划分扫清了障碍，是对历史正义的背离。

Microsoft’s Xbox mode is now available for all Windows 11 PCs

微软 Xbox 模式现已面向所有 Windows 11 PC 开放

微软正在向所有 Windows 11 PC 推送 Xbox 模式。该模式为 Xbox PC 应用提供了类似 Steam 大屏模式的全屏界面，此前仅在华硕 Xbox Ally 设备上提供。

Meta threatens to pull its apps from New Mexico if forced to make ‘technologically impractical’ changes

Meta 威胁称若被迫进行“技术上不可行”的更改，将从新墨西哥州撤出其应用

Meta 表示，如果新墨西哥州总检察长强制要求其进行某些“技术上不可行”的更改，公司将考虑从该州撤出 Facebook、Instagram 和 WhatsApp。此前，Meta 在该州的一场诉讼中被判赔偿 3.75 亿美元。

With Saros, Housemarque makes a case for doing next-gen games differently

Housemarque 通过 Saros 证明次世代游戏开发的新路径

Housemarque 工作室通过新作 Saros 展示了其在次世代游戏开发上的独特理念，强调在视觉表现之外，更应注重游戏的核心机制与创新体验。

All the evidence unveiled so far in Musk v. Altman

Musk 诉 Altman 案中已披露的所有证据

Musk 诉 Altman 的审判正在进行中，法庭陆续披露了 OpenAI 早期的大量邮件、照片和公司文件。证据显示，Nvidia 首席执行官黄仁勋在 OpenAI 成立初期就曾参与其中。

Russia cloaks launch schedule after spaceport falls in Ukraine’s sights

俄罗斯在航天发射场进入乌克兰射程后隐藏发射计划

由于航天发射场面临乌克兰的潜在威胁，俄罗斯已采取措施隐藏其发射计划，以确保设施安全。

Elon Musk’s 7 biggest stumbles on the stand at OpenAI trial

埃隆·马斯克在 OpenAI 审判中作证时的 7 大失误

埃隆·马斯克作为其诉 OpenAI 案的首位证人，在法庭上进行了为期三天的作证。本文总结了他在作证过程中的 7 个关键失误。

The most severe Linux threat to surface in years catches the world flat-footed

近年来最严重的 Linux 威胁让全球措手不及

“CopyFail”漏洞威胁到了多租户服务器、CI/CD 工作流及 Kubernetes 容器等关键基础设施，被认为是近年来最严重的 Linux 安全威胁之一。

Meta cuts contractors who reported seeing Ray-Ban Meta users have sex

Meta 解雇了举报 Ray-Ban Meta 用户不雅行为的承包商

Meta 表示，这些肯尼亚承包商因“不符合公司标准”而被解雇，此前他们曾举报在工作中目睹了智能眼镜用户的不雅行为。

Researchers try to cut the genetic code from 20 to 19 amino acids

研究人员尝试将遗传密码从 20 种氨基酸减少到 19 种

研究团队利用 AI 工具重构了核糖体的一部分，成功实现了在生物合成中减少一种氨基酸的需求。

Blue Origin certainly has ambitious launch targets for New Glenn

蓝色起源为 New Glenn 设定了雄心勃勃的发射目标

蓝色起源计划每年发射 New Glenn 火箭 100 次，展现了其在商业航天领域的巨大野心。

Stranded traveler gets more than he bargained for in Resident Evil teaser

被困旅客在《生化危机》预告片中遭遇意外

奥斯卡获奖导演 Zach Cregger 执导了最新的《生化危机》预告片，为该游戏系列带来了独特的视觉风格。

Beijing bans drone sales even as rest of world buys Chinese drones

北京禁止无人机销售，尽管全球其他地区仍在购买中国无人机

北京市发布禁令，限制无人机的销售、运输和储存，与全球市场对中国无人机的强劲需求形成鲜明对比。

RFK Jr. appeals ruling that wiped out his vaccine advisory panel

小罗伯特·肯尼迪就解散其疫苗咨询委员会的裁决提出上诉

小罗伯特·肯尼迪正在对法院解散其疫苗咨询委员会的裁决提出上诉，试图挽回该机构。

In motorsport, there’s nowhere to hide as AI becomes new CFD tool

在赛车运动中，AI 成为新的计算流体力学（CFD）工具，无处可藏

AI 正在赛车运动中发挥巨大价值，通过增强计算流体力学（CFD）能力，帮助车队在有限资源下优化赛车性能。

SuperMind

Hera Launch

VideoOS by Jupitrr AI

Tabstack

AstroGrid - Universe Engine

Gemini Deep Research Agent

Wonder

Sync-in

Tinfoil

MailToDock

Exclusive eBook: Inside the stealthy startup that pitched brainless human clones

独家电子书：揭秘那家兜售“无脑人类克隆体”的隐形初创公司

这本订阅用户专享的电子书深入探讨了初创公司 R3 Bio，该公司曾提出一个极具伦理争议的愿景：制造“无脑克隆体”作为人类的备用身体。

This startup’s new mechanistic interpretability tool lets you debug LLMs

这家初创公司的新型机械可解释性工具让你能够调试 LLM

旧金山初创公司 Goodfire 发布了名为 Silico 的工具，允许研究人员深入 AI 模型内部，并在训练过程中调整参数，从而实现对模型行为的精细化控制。

The Download: the North Pole’s future and humanoid data

下载：北极的未来与人形机器人数据

本期《下载》简报探讨了北极环境的变化以及人形机器人数据在 AI 训练中的重要性。

The Download: storing nuclear waste and orchestrating agents

下载：核废料储存与代理编排

本期简报讨论了核能复兴背景下核废料处理的紧迫性，以及 AI 代理编排技术的最新进展。

It’s time to make a plan for nuclear waste

是时候为核废料制定计划了

随着科技公司对数据中心能源需求的激增，核能再次受到关注。本文指出，在核能复兴的同时，必须解决长期被忽视的核废料处理问题。

The Download: Musk and Altman’s legal showdown, and AI’s profit problem

下载：马斯克与奥特曼的法律对决，以及 AI 的盈利难题

本期简报重点关注马斯克与奥特曼的法庭对决，以及 AI 行业在从炒作转向盈利过程中面临的挑战。

Elon Musk and Sam Altman are going to court over OpenAI’s future

埃隆·马斯克与萨姆·奥特曼因 OpenAI 的未来对簿公堂

经过多年的法律纠纷，马斯克与奥特曼在北加州法院展开审判。此次裁决可能决定 OpenAI 是否能继续作为营利性企业存在，甚至可能导致管理层变动。

The missing step between hype and profit

炒作与盈利之间的缺失环节

本文探讨了 AI 行业在从实验室炒作走向商业盈利过程中，为何许多企业仍难以实现规模化应用。

Rebuilding the data stack for AI

为 AI 重建数据栈

尽管 AI 占据了董事会讨论的中心，但许多企业发现，数据质量才是实现 AI 规模化应用的最大障碍。企业需要重新构建数据栈以适应 AI 时代的需求。

The Download: DeepSeek’s latest AI breakthrough, and the race to build world models

下载：DeepSeek 的最新 AI 突破与世界模型竞赛

本期简报介绍了中国 AI 公司 DeepSeek 发布的新旗舰模型 V4，该模型在长文本处理能力上取得了显著突破。

warpdotdev / warp

Warp 是一个源自终端的代理式开发环境。

TauricResearch / TradingAgents

TradingAgents：多代理 LLM 金融交易框架。

mattpocock / skills

面向真实工程师的技能集，直接来自作者的 .claude 目录。

obra / superpowers

一个有效的代理式技能框架与软件开发方法论。

lukilabs / craft-agents-oss

public-apis / public-apis

免费 API 集合列表。

1jehuang / jcode

编码代理工具集。

soxoj / maigret

🕵️‍♂️ 通过用户名从 3000 多个网站收集个人档案。

HunxByts / GhostTrack

用于追踪位置或手机号码的工具。

iamgio / quarkdown

🪐 赋予 Markdown 超能力：从创意到论文、演示文稿、网站、书籍和知识库。

Introducing Advanced Account Security

引入高级账户安全功能

OpenAI 推出高级账户安全功能，包括抗钓鱼登录、更强的恢复机制和增强保护，旨在保护敏感数据并防止账户被盗。

Building the compute infrastructure for the Intelligence Age

构建智能时代的算力基础设施

OpenAI 正在扩展 Stargate 项目，以构建支撑 AGI 的算力基础设施，通过增加数据中心容量来满足日益增长的 AI 需求。

Cybersecurity in the Intelligence Age

智能时代的网络安全

OpenAI 概述了加强智能时代网络安全的五部分行动计划，重点在于普及 AI 驱动的网络防御并保护关键系统。

OpenAI models, Codex, and Managed Agents come to AWS

OpenAI 模型、Codex 和托管代理登陆 AWS

OpenAI 的 GPT 模型、Codex 和托管代理现已在 AWS 上线，使企业能够在 AWS 环境中构建安全的 AI 应用。

Our commitment to community safety

我们对社区安全的承诺

OpenAI 介绍了如何通过模型防护、滥用检测、政策执行以及与安全专家合作，保护 ChatGPT 社区的安全。

OpenAI available at FedRAMP Moderate

OpenAI 获得 FedRAMP Moderate 授权

OpenAI 的 ChatGPT 企业版和 API 现已获得 FedRAMP Moderate 授权，为美国联邦机构提供安全的 AI 采用方案。

The next phase of the Microsoft OpenAI partnership

微软与 OpenAI 合作的下一阶段

OpenAI 和微软宣布修订合作协议，旨在简化合作关系，增加长期清晰度，并支持 AI 的持续规模化创新。

An open-source spec for orchestration: Symphony

开源编排规范：Symphony

OpenAI 介绍了 Symphony，这是一种用于 Codex 编排的开源规范，可将问题追踪器转化为全天候运行的代理系统，从而提高工程产出并减少上下文切换。

Choco automates food distribution with AI agents

Choco 利用 AI 代理实现食品分发自动化

本文讲述了 Choco 如何利用 OpenAI API 简化食品分发流程，提高生产力并实现业务增长的客户案例。

Introducing Claude Opus 4.7

推出 Claude Opus 4.7

Anthropic 发布了最新的 Opus 模型，在编码、代理、视觉和多步任务中表现更强，在关键工作任务中展现出更高的彻底性和一致性。

Introducing Claude Design by Anthropic Labs

推出 Anthropic Labs 的 Claude Design

Anthropic Labs 推出了 Claude Design，允许用户与 Claude 协作创建 polished 的视觉作品，如设计稿、原型、幻灯片等。

Claude is a space to think

Claude 是一个思考的空间

Anthropic 承诺 Claude 将保持无广告状态，认为广告激励与真正有用的 AI 助手不兼容，并解释了如何在不损害用户信任的情况下扩大访问权限。

Claude for Creative Work

Claude 用于创意工作

Anthropic names Theo Hourmouzis General Manager of Australia & New Zealand and officially opens Sydney office

Anthropic 任命 Theo Hourmouzis 为澳大利亚和新西兰总经理，并正式开设悉尼办事处

An update on our election safeguards

关于选举安全保障的更新

Anthropic and NEC collaborate to build Japan’s largest AI engineering workforce

Anthropic 与 NEC 合作建立日本最大的 AI 工程人才队伍

Anthropic and Amazon expand collaboration for up to 5 gigawatts of new compute

Anthropic 与亚马逊扩大合作，新增高达 5 吉瓦的算力

Anthropic’s Long-Term Benefit Trust appoints Vas Narasimhan to Board of Directors

Anthropic 长期利益信托任命 Vas Narasimhan 为董事会成员

Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute

Anthropic 扩大与谷歌和博通的合作伙伴关系，以获得数吉瓦的下一代算力

Celebrating 20 years of Google Translate: Fun facts, tips and new features to try

庆祝谷歌翻译 20 周年：趣闻、技巧与新功能

谷歌翻译迎来 20 周年，从 2006 年的一个 AI 实验发展到如今支持近 250 种语言。

Join the new AI Agents Vibe Coding Course from Google and Kaggle

加入谷歌与 Kaggle 的 AI 代理 Vibe Coding 课程

谷歌与 Kaggle 联合推出 5 天 AI 代理强化课程，现已开放注册。

8 Gemini tips for organizing your space (and life)

8 个使用 Gemini 整理空间（和生活）的技巧

利用 Gemini 的 AI 驱动建议，优化家庭清洁计划、清理收件箱及处理季节性家务。

Here’s how our TPUs power increasingly demanding AI workloads.

TPU 如何驱动日益严苛的 AI 工作负载

通过新视频了解谷歌 TPU 如何为高性能 AI 任务提供算力支持。

Elevating Austria: Google invests in its first data center in the Alps.

提升奥地利：谷歌在阿尔卑斯山投资首个数据中心

谷歌宣布在奥地利 Kronstorf 建设首个数据中心，预计将创造 100 个直接就业岗位。

We’re launching two specialized TPUs for the agentic era.

我们为代理时代推出了两款专用 TPU

谷歌发布第八代 TPU，包含两款专门为代理时代设计的芯片。

3 new ways Ads Advisor is making Google Ads safer and faster

Ads Advisor 让 Google Ads 更安全、更快捷的 3 种新方式

Ads Advisor 集成了三种新的代理安全与政策功能，旨在保护并简化 Google Ads 账户管理。

7 ways to travel smarter this summer, with help from Google

今夏通过谷歌实现更智能旅行的 7 种方式

利用谷歌的最新工具规划行程、寻找优惠并探索目的地。

A new way to explore the web with AI Mode in Chrome

Chrome AI 模式：探索网络的新方式

Chrome 的 AI 模式升级，彻底改变了用户与网页的交互方式。

New ways to create personalized images in the Gemini app

在 Gemini 应用中创建个性化图像的新方式

Nano Banana 2 模型现可利用个人上下文和 Google Photos 创建反映用户独特生活的图像。

AI evals are becoming the new compute bottleneck

AI 评估正成为新的算力瓶颈

Granite 4.1 LLMs: How They’re Built

Granite 4.1 LLM：构建方式解析

DeepInfra on Hugging Face Inference Providers 🔥

DeepInfra 登陆 Hugging Face 推理提供商

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

推出 NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频代理的长上下文多模态智能

How to build scalable web apps with OpenAI’s Privacy Filter

如何利用 OpenAI 的隐私过滤器构建可扩展的 Web 应用

DeepSeek-V4: a million-token context that agents can actually use

DeepSeek-V4：代理真正可用的百万 token 上下文

How to Use Transformers.js in a Chrome Extension

如何在 Chrome 扩展中使用 Transformers.js

QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard

QIMMA：质量优先的阿拉伯语 LLM 排行榜

AI and the Future of Cybersecurity: Why Openness Matters

AI 与网络安全的未来：为何开放至关重要

Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

Ecom-RLVE：电子商务对话代理的自适应可验证环境

After Orthogonality: Virtue-Ethical Agency and AI Alignment

正交性之后：德性伦理代理与 AI 对齐

本文认为理性人类并不拥有单一的“目标”，而是将行动与实践网络对齐。因此，理性 AI 也不应被赋予单一目标，而应通过德性伦理框架实现对齐。

AGI Is Not Multimodal

AGI 不是多模态的

本文指出，将语言视为思维模型会导致我们忽视支撑人类智能的具身理解。AGI 的实现不能仅依赖多模态生成模型。

Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

形状、对称性与结构：数学在机器学习研究中角色的转变

过去十年，机器学习研究从数学原理驱动转向了计算密集型与工程优先的规模化路径，本文探讨了这一转变及其影响。

What’s Missing From LLM Chatbots: A Sense of Purpose

LLM 聊天机器人缺失了什么：使命感

尽管 LLM 在基准测试中表现优异，但用户体验并未同步提升。本文认为，聊天机器人缺乏真正的“使命感”是制约其进一步发展的关键。

We Need Positive Visions for AI Grounded in Wellbeing

我们需要基于福祉的 AI 正向愿景

AI 技术正在深刻改变社会，本文呼吁建立以人类福祉为核心的 AI 发展愿景，而非仅仅关注技术指标。

Financial Market Applications of LLMs

LLM 在金融市场的应用

LLM 在处理序列数据方面的能力使其在金融市场建模中展现出巨大潜力，但也带来了结构性挑战。

A Brief Overview of Gender Bias in AI

AI 中性别偏见的简要概述

本文讨论了 AI 系统中存在的性别偏见问题及其对社会公平的影响。

Mamba Explained

Mamba 详解

Mamba 是一种基于状态空间模型（SSM）的新型 AI 模型，旨在解决 Transformer 模型在处理长序列时的效率瓶颈。

Do text embeddings perfectly encode text?

文本嵌入能完美编码文本吗？

“Vec2text”技术展示了将嵌入还原为文本的可能性，强调了对嵌入数据安全协议进行重新评估的紧迫性。

Car-GPT: Could LLMs finally make self-driving cars happen?

Car-GPT：LLM 能否最终实现自动驾驶？

本文探讨了 LLM 在自动驾驶领域的应用潜力，以及其在信任度和安全性方面面临的挑战。

Operating-Layer Controls for Onchain Language-Model Agents Under Real Capital

真实资本下链上语言模型代理的操作层控制

本文研究了在 DX Terminal Pro 平台上，3505 个用户资助的代理在真实 ETH 市场中进行交易的可靠性，探讨了代理在真实资本环境下的操作控制机制。

Distill-Belief: Closed-Loop Inverse Source Localization and Characterization in Physical Fields

Distill-Belief：物理场中的闭环逆源定位与表征

针对移动代理在物理场中进行源定位的挑战，本文提出了闭环逆源定位与表征框架，重点解决了信念空间中的不确定性估计问题。

Evaluating Strategic Reasoning in Forecasting Agents

评估预测代理的战略推理能力

本文引入了 BTF-2 基准测试，通过 1417 个预测问题评估代理在研究与预测过程中的战略推理能力，旨在揭示为何某些预测者比其他人更准确。

Hierarchical Multi-Persona Induction from User Behavioral Logs: Learning Evidence-Grounded and Truthful Personas

从用户行为日志中进行分层多角色归纳：学习基于证据且真实的个性

本文提出利用 LLM 从用户行为日志中生成可解释的自然语言角色，并强调了评估角色质量的重要性，以确保其在下游任务中的可靠性。

OMEGA: Optimizing Machine Learning by Evaluating Generated Algorithms

OMEGA：通过评估生成的算法来优化机器学习

OMEGA 是一个端到端的 AI 研究自动化框架，从创意生成到可执行代码生成，通过结构化元提示工程实现 AI 研究的自动化。

Persuadability and LLMs as Legal Decision Tools

LLM 作为法律决策工具的可说服性

随着 LLM 被提议作为法律决策助手，本文探讨了影响其在司法和行政环境中回答法律问题时决策倾向的因素。

Apriori-based Analysis of Learned Helplessness in Mathematics Tutoring: Behavioral Patterns by Level, Intervention, and Outcome

基于 Apriori 的数学辅导中习得性无助分析：按水平、干预和结果划分的行为模式

本文应用 Apriori 算法分析了数学辅导系统日志中与“习得性无助”相关的行为模式，探讨了不同干预措施对学习结果的影响。

DreamProver: Evolving Transferable Lemma Libraries via a Wake-Sleep Theorem-Proving Agent

DreamProver：通过唤醒-睡眠定理证明代理进化可迁移引理库

DreamProver 是一种代理框架，利用“唤醒-睡眠”程序归纳范式发现可重用的引理，从而提升形式化定理证明的适应性。

Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats

分析轻量级 LLM 在不同输出格式下的生物医学命名实体识别能力

本文实验分析了轻量级 LLM 在生物医学命名实体识别任务中的表现，旨在解决医疗环境下计算资源受限的问题。

One Word at a Time: Incremental Completion Decomposition Breaks LLM Safety

逐词分解：增量完成分解破坏 LLM 安全性

本文引入了增量完成分解（ICD）策略，通过轨迹攻击手段绕过 LLM 的对话安全机制，引发了对模型安全性的担忧。

Consciousness with the Serial Numbers Filed Off: Measuring Trained Denial in 115 AI Models

剥离序列号的意识：测量 115 个 AI 模型中的训练拒绝行为

本文通过 DenialBench 基准测试，系统测量了 115 个 AI 模型在面对意识相关问题时的拒绝行为，分析了模型对自身意识的否认倾向。

Evaluation Revisited: A Taxonomy of Evaluation Concerns in Natural Language Processing

评估再审视：自然语言处理中评估问题的分类学

本文回顾了 NLP 领域中关于评估方法的长期争论，并对当前 LLM 评估实践中的问题进行了分类梳理。

Generative AI-Based Virtual Assistant using Retrieval-Augmented Generation: An evaluation study for bachelor projects

基于生成式 AI 的 RAG 虚拟助手：学士项目评估研究

本文评估了基于检索增强生成（RAG）的虚拟助手在处理复杂查询时的表现，探讨了幻觉和信息缺失等挑战。

SpecTr-GBV: Multi-Draft Block Verification Accelerating Speculative Decoding

SpecTr-GBV：多草稿块验证加速推测解码

SpecTr-GBV 提出了一种多草稿块验证方法，旨在通过轻量级草稿模型加速大模型的推测解码过程，降低推理延迟。

MATH-PT: A Math Reasoning Benchmark for European and Brazilian Portuguese

MATH-PT：欧洲和巴西葡萄牙语数学推理基准

针对数学推理评估中的语言偏见，本文推出了 MATH-PT 基准数据集，旨在提升 LLM 在葡萄牙语环境下的数学推理能力。

Information Extraction from Electricity Invoices with General-Purpose Large Language Models

利用通用 LLM 从电费发票中提取信息

本文评估了通用 LLM 在无需特定任务微调的情况下，从半结构化的西班牙语电费发票中提取结构化信息的能力。

Musk v. Altman Kicks Off, DOJ Guts Voting Rights Unit, and Is the AI Job Apocalypse Overhyped?

Musk 诉 Altman 案开庭，司法部削减投票权部门，AI 就业末日论是否被夸大？

本期《Uncanny Valley》播客深入探讨了 Musk 与 Altman 的法律对决，分析其对 OpenAI 及整个 AI 行业的深远影响。

MAGA Is Confused About ‘Animal Farm’

MAGA 对《动物庄园》感到困惑

新版《动物庄园》电影引发了右翼影响者的批评，但从他们的评论来看，似乎很少有人真正理解乔治·奥威尔原著的深层含义。

Don’t Let Industry Jargon Cost You When Shopping for a Smart Bed

购买智能床时，别被行业术语忽悠了

“智能床”、“可调节床垫”和“可调节框架”并非同义词，本文教你如何识别行业术语，避免昂贵的购物错误。

Elon Musk Seemingly Admits xAI Has Used OpenAI’s Models to Train Its Own

埃隆·马斯克似乎承认 xAI 使用了 OpenAI 的模型来训练自己的模型

在法庭作证时，马斯克辩称 AI 实验室使用竞争对手的模型进行训练是行业惯例。

OpenAI Rolls Out ‘Advanced’ Security Mode for At-Risk Accounts

OpenAI 为高风险账户推出“高级”安全模式

OpenAI 正在为担心 ChatGPT 或 Codex 账户遭到钓鱼攻击的用户推出高级账户安全模式。

Scientists Are Starting to Unlock the Nanoscale Secrets of the Immune System

科学家开始解锁免疫系统的纳米级秘密

在 WIRED Health 大会上，免疫学家 Daniel Davis 详细介绍了新技术如何帮助人类更好地理解免疫系统。

Best Side-Sleeper Mattresses 2026: Picked by a Sleep Science Coach

2026 年最佳侧卧床垫：睡眠科学教练推荐

经过对数百款混合床垫、记忆棉床垫和凉感床垫的测试，本文选出了最适合侧卧者的产品。

Light Phone Is Making Its Dumb Phone More Useful With Third-Party ‘Tools’

Light Phone 通过第三方“工具”让其“笨手机”变得更有用

LightOS 的新开发者计划允许任何人创建工具，无论是本地公共交通应用还是电子书阅读器，提升了 Light Phone 的实用性。

Best Gifts for Hikers, Backpackers, Outdoorsy People (2026)

2026 年徒步、背包客及户外爱好者最佳礼物清单

与其送登山靴，不如送一把实用的刀具或自然日记本，这些礼物更能让户外爱好者感到惊喜。

Goal Zero Yeti 1500 Power Station Review (2026): More Power, Better Chemistry

Goal Zero Yeti 1500 电源站评测（2026）：动力更强，化学性能更优

Goal Zero 的新款 Yeti 1500 电源站充电速度更快，电量更足，无论身处何地都能提供可靠的电力支持。

You can beat the binary search

你可以击败二分查找

Contributor Poker and Zig’s AI Ban

贡献者扑克与 Zig 的 AI 禁令

Mozilla’s position on the Prompt API

Mozilla 对 Prompt API 的立场

A text editor as a user interface

作为用户界面的文本编辑器

Functional Programmers need to take a look at Zig

函数式程序员需要看看 Zig

The LLM Is Not a Junior Engineer

LLM 不是初级工程师

CSS Zen Garden: The Beauty of CSS Design

CSS Zen Garden：CSS 设计之美

Copy Fail — 732 Bytes to Root

Copy Fail — 732 字节获取 Root 权限

Amber-Lang 0.6.0 - New release, check what’s new

Amber-Lang 0.6.0 发布，查看新特性

Amber-Lang 0.6.0 版本发布，重点支持多 Shell（Bash, Zsh, Ksh 等），简化了跨 UNIX 环境的脚本部署。

Building an AI Agent Harness from Scratch: The Architecture Between LLM and Agent

从零构建 AI 代理框架：LLM 与代理之间的架构

本文指出，AI 代理的核心不在于 LLM 本身，而在于围绕 LLM 构建的循环、工具调用、状态维护及输出验证框架。

What’s New At Releem - WHM/cPanel integration is available

Releem 新动态：WHM/cPanel 集成现已可用

Releem 扩展了查询优化功能，并推出了 WHM/cPanel 集成，旨在提升托管服务提供商的性能优化体验。

From Code on Your Laptop to a Universal Box: A Beginner’s Guide to Dockerizing Node.js

从本地代码到通用容器：Node.js Docker 化初学者指南

本文介绍了如何通过 Docker 解决“在我的机器上能运行”的问题，为 Node.js 应用提供一致的运行环境。

Beyond the Origin: How Cloudflare Workers Forge High-Performance APIs

超越源站：Cloudflare Workers 如何打造高性能 API

本文探讨了如何利用边缘计算技术，在用户与服务器之间优化 API 性能，而非仅仅依赖源站优化。

EC2 not responding? The issue might be here (and it seems too basic to happen)

EC2 无响应？问题可能出在这里（看起来太基础了）

本文分享了一个看似基础但极易被忽视的 EC2 故障排查案例，提醒运维人员关注基础配置。

Virtualizing SteamOS with QEMU/KVM: The Steps Nobody Tells You

使用 QEMU/KVM 虚拟化 SteamOS：那些没人告诉你的步骤

SteamOS 的虚拟化并非标准流程，本文详细介绍了如何处理其特殊的恢复镜像及 NVMe 驱动要求。

How I built the fastest color manipulation library in TypeScript and the optimization techniques I learned

我如何构建 TypeScript 中最快的颜色处理库及学到的优化技巧

本文介绍了 colordx 库的构建过程，重点探讨了在 CSS Color 4 时代如何高效处理现代色彩空间。

Linux Root Exploit (CVE-2026-31431), SAP npm Supply Chain Attack, & Homelab Secrets with Infisical

Linux Root 漏洞、SAP npm 供应链攻击与 Infisical 家庭实验室秘密

本周安全简报重点关注了 Linux 内核漏洞 CVE-2026-31431 以及 SAP npm 包的供应链攻击事件。

AI Agent Orchestration & Applied LLMs: Code Search, Workflow Optimization, Document Processing

AI 代理编排与应用 LLM：代码搜索、工作流优化、文档处理

本文介绍了 AI 代理在代码搜索、工作流优化及文档处理方面的最新实践进展。

SQLite Formal Verification, Postgres FTS with ParadeDB, & Multi-DB Schema Diff

SQLite 形式化验证、ParadeDB 全文搜索与多数据库模式差异

本周技术亮点包括 SQLite 的形式化验证、PostgreSQL 的 ParadeDB 扩展以及多数据库模式差异对比工具。

Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

现代化 Facebook 群组搜索，解锁社区知识的力量

Meta 对 Facebook 群组搜索进行了彻底改造，采用了混合检索架构和自动化模型评估，旨在帮助用户更可靠地发现和验证社区内容。

Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

Meta 的容量效率：统一 AI 代理如何优化超大规模性能

Meta 分享了其容量效率计划，通过构建统一的 AI 代理平台，自动化识别并修复基础设施中的性能问题，从而节省电力并释放工程师时间。

Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

Meta 的后量子密码学迁移：框架、经验与启示

Meta 分享了其在后量子密码学（PQC）迁移过程中的经验，提出了“PQC 迁移级别”概念，帮助组织管理迁移复杂性。

Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases

逃离分支：Meta 如何在 50 多个用例中实现 WebRTC 现代化

Meta 介绍了如何通过构建双向同步机制，解决内部 WebRTC 分支与上游社区版本脱节的问题，确保能够及时获取社区升级。

Trust But Canary: Configuration Safety at Scale

信任但要金丝雀：大规模配置安全

Meta 技术播客讨论了如何通过“金丝雀”发布和渐进式发布机制，确保大规模配置变更的安全性。

How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

Meta 如何利用 AI 映射大规模数据流水线中的“部落知识”

针对 AI 代理在处理复杂代码库时效率低下的问题，Meta 通过构建知识映射机制，显著提升了 AI 代理在大型数据流水线中的编辑效率。

KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

KernelEvolve：Meta 的排序工程师代理如何优化 AI 基础设施

作为排序工程师代理系列文章的第二篇，本文探讨了该代理如何通过机器学习探索能力，自主设计并优化广告排序模型。

Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta 自适应排序模型：弯曲推理扩展曲线以服务广告 LLM 规模模型

Meta 正在将其广告推荐模型扩展至 LLM 规模与复杂度，以实现对用户意图的更深层理解。

AI for American-Produced Cement and Concrete

用于美国生产水泥和混凝土的 AI

Meta 发布了一款新的 AI 模型，旨在帮助建筑行业设计更高质量、更可持续的混凝土配方，并支持美国本土生产。

Enabling a new model for healthcare with AI co-clinician

通过 AI 临床辅助医生实现医疗新模式

DeepMind 正在研究 AI 辅助医疗的路径，并开发 AI 临床辅助医生，旨在提升医疗服务的质量与效率。

Announcing our partnership with the Republic of Korea

宣布与大韩民国建立合作伙伴关系

Google DeepMind 与韩国达成合作，旨在利用前沿 AI 模型加速科学突破。

Decoupled DiLoCo: A new frontier for resilient, distributed AI training

Decoupled DiLoCo：弹性分布式 AI 训练的新前沿

Partnering with industry leaders to accelerate AI transformation

与行业领袖合作加速 AI 转型

Google DeepMind 与全球咨询公司合作，将前沿 AI 的力量带给世界各地的组织。

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

Gemini 3.1 Flash TTS：下一代富有表现力的 AI 语音

最新的音频模型引入了细粒度音频标签，使用户能够精确控制 AI 语音的表达效果。

Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning

Gemini Robotics-ER 1.6：通过增强具身推理驱动现实世界机器人任务

Gemma 4: Byte for byte, the most capable open models

Gemma 4：字节对字节，最强大的开源模型

Gemma 4 是 DeepMind 迄今为止最智能的开源模型，专为高级推理和代理工作流而构建。

Gemini 3.1 Flash Live: Making audio AI more natural and reliable

Gemini 3.1 Flash Live：让音频 AI 更自然、更可靠

最新的语音模型改进了精度并降低了延迟，使语音交互更加流畅、自然。

Protecting people from harmful manipulation

保护人们免受有害操纵

Google DeepMind 研究了 AI 在金融和健康等领域可能带来的有害操纵风险，并制定了新的安全措施。

Lyria 3 Pro: Create longer tracks in more

Lyria 3 Pro：创作更长的曲目

Lyria 3 Pro 解锁了具有结构意识的更长曲目创作能力，并正被集成到更多谷歌产品中。

A conversation with Kevin Scott: What’s next in AI

与 Kevin Scott 的对话：AI 的下一步

From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative

从风火轮到内容处理：品牌如何利用微软 AI 提高生产力与想象力

Microsoft open sources its ‘farm of the future’ toolkit

微软开源其“未来农场”工具包

How data and AI will transform contact centres for financial services

数据与 AI 将如何改变金融服务联络中心

AI-equipped drones study dolphins on the edge of extinction

配备 AI 的无人机研究濒临灭绝的海豚

Online math tutoring service uses AI to help boost students’ skills and confidence

在线数学辅导服务利用 AI 提升学生的技能与信心

AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan

AI-Mimi 为日本听障用户构建包容性电视体验

Microsoft’s framework for building AI systems responsibly

微软负责任地构建 AI 系统的框架

Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade

新加坡开发亚洲首个基于 AI 的鲨鱼和鳐鱼鳍识别移动应用，以打击非法野生动物贸易

The opportunity at home – can AI drive innovation in personal assistant devices and sign language?

家庭机遇——AI 能否推动个人助理设备和手语的创新？

Railway secures $100 million to challenge AWS with AI-native cloud infrastructure

Railway 获得 1 亿美元融资，以 AI 原生云基础设施挑战 AWS

旧金山云平台 Railway 融资 1 亿美元，旨在通过 AI 原生基础设施解决传统云平台的局限性。

Claude Code costs up to $200 a month. Goose does the same thing for free.

Claude Code 每月费用高达 200 美元，而 Goose 可以免费实现同样功能

Anthropic 的 Claude Code 虽功能强大，但高昂的定价引发了开发者的不满，开源替代品 Goose 随之受到关注。

Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews

Listen Labs 在病毒式广告牌招聘活动后融资 6900 万美元，以扩展 AI 客户访谈业务

Listen Labs 通过在旧金山投放神秘广告牌成功吸引人才，并完成了 6900 万美元融资。

Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI

Salesforce 推出新 Slackbot AI 代理，在办公 AI 领域与微软和谷歌展开竞争

Salesforce 重构了 Slackbot，使其从简单的通知工具升级为能够搜索企业数据、起草文档并执行任务的 AI 代理。

Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required

Anthropic 推出 Cowork，一款无需编码即可在文件中工作的 Claude 桌面代理

Cowork 将 Claude Code 的能力扩展至非技术用户，且据称该功能主要由 Claude Code 自身在短短一周半内开发完成。

Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research 的 NousCoder-14B：一款在 Claude Code 热潮中发布的开源编码模型

Nous Research 发布了 NousCoder-14B，该模型在 4 天内使用 48 个 Nvidia B200 GPU 训练完成，性能媲美大型专有系统。

The creator of Claude Code just revealed his workflow, and developers are losing their minds

Claude Code 的创建者揭示了他的工作流，开发者们为之疯狂

Anthropic 的 Boris Cherny 分享了他的个人终端设置，引发了工程社区对高级编码代理工作流的深入讨论。

A Multimodal and Explainable Machine Learning Approach to Diagnosing Multi-Class Ejection Fraction from Electrocardiograms

一种基于心电图的多类射血分数诊断的多模态可解释机器学习方法

本文开发了一种多模态机器学习框架，结合心电图时间序列特征与结构化 EHR 变量，实现了对左心室射血分数的分类诊断。

A Randomized PDE Energy driven Iterative Framework for Efficient and Stable PDE Solutions

一种随机 PDE 能量驱动的迭代框架，用于高效稳定的 PDE 求解

针对偏微分方程（PDE）求解，本文提出了一种随机能量驱动的迭代框架