AI News Daily - 2026-05-02

2026-05-02

今日要点

AI 代理（Agent）生态爆发：从 Anthropic 的 Claude Code 到 Meta 的 Ranking Engineer Agent，AI 正在从简单的聊天机器人转向能够自主执行复杂任务、优化基础设施并进行科学发现的“代理”架构。
Linux 安全警报：名为“CopyFail”的严重漏洞（CVE-2026-31431）被披露，影响自 2017 年以来的几乎所有 Linux 发行版，允许攻击者获取 root 权限。
算力与基础设施竞赛：OpenAI 正在扩建 Stargate 计算基础设施以支持 AGI，而 Anthropic 则与亚马逊、谷歌及 Broadcom 达成大规模算力合作，以应对日益增长的 AI 需求。
行业监管与伦理挑战：针对 AI 生成内容的真实性（如 Spotify 的人类艺术家认证）、AI 滥用（如明尼苏达州禁止 AI 生成裸照）以及科技公司在数据隐私和安全方面的争议持续发酵。

Hacker News

Grok 4.3

Show HN: WhatCable，一款用于检测 USB-C 线缆的小型菜单栏应用

WhatCable 是一款驻留在 macOS 菜单栏的小工具，旨在解决 USB-C 线缆规格混乱的问题。它能够读取 Mac 系统已识别的线缆数据，并以直观的语言告知用户该线缆的具体功能，包括充电功率（如 5W 或 100W）、数据传输速度以及是否支持 Thunderbolt 4 或显示输出。

Apple accidentally left Claude.md files Apple Support app

苹果在 Apple Support 应用中意外遗留了 Claude.md 文件

据报道，苹果公司在最新的 Apple Support 应用更新中，意外将包含 Claude 相关信息的 Markdown 文件打包进了安装包。这一发现引发了外界对于苹果内部是否正在测试或集成 Anthropic 的 Claude 模型进行辅助开发的猜测。

Uber torches 2026 AI budget on Claude Code in four months

Uber 在四个月内烧光了 2026 年全年的 AI 预算

Uber 的 CTO 透露，由于工程师们对 Claude Code 和 Cursor 等 AI 编程工具的依赖程度极高，公司在短短四个月内就耗尽了全年的 AI 预算。这些工具虽然极大地提升了开发效率，但其高昂的调用成本也让这家网约车巨头陷入了“工具太好用以至于用不起”的尴尬境地。

AI uses less water than the public thinks

AI 使用的水资源比公众想象的要少

本文探讨了 AI 对自然资源的影响，指出公众对 AI 耗水量的担忧往往被夸大。随着技术的成熟，AI 在资源利用效率方面正在不断优化，尽管它在早期阶段引发了关于环境影响的广泛讨论，但实际数据表明其影响处于可控范围内。

The Gay Jailbreak Technique

“同性恋”越狱技术

这是一种针对大语言模型（如 GPT-4o、Claude 4 Sonnet 等）的新型越狱技术。研究者发现，通过在提示词中模拟或要求模型扮演同性恋角色，并结合特定的意图引导，可以绕过模型的安全审查机制，从而诱导模型输出原本被禁止的内容（如非法指南）。

Police Have Used License Plate Readers at Least 14x to Stalk Romantic Interests

警方在过去几年中至少 14 次利用车牌识别系统跟踪私人情感对象

调查显示，执法部门使用的车牌自动识别系统（ALPR）存在严重的滥用风险。在过去几年中，至少有 14 起案例被证实是警察利用该系统跟踪其私人情感对象，引发了公众对监控技术隐私边界的强烈担忧。

Your website is not for you

你的网站不是为你自己做的

本文探讨了网站设计的核心哲学，强调网站的最终目的是服务于用户而非开发者或所有者。文章建议开发者应从用户体验、可访问性和信息架构的角度出发，摒弃自我中心的创作倾向，以确保网站能真正解决用户的问题。

City Learns Flock Accessed Cameras in Children’s Gymnastics Room as a Sales Demo

某城市发现 Flock 公司员工为演示监控技术，擅自访问儿童体操室摄像头

亚特兰大郊区的一座城市发现，监控技术公司 Flock 的销售人员为了向其他城市的警察部门推销产品，竟然擅自访问了该市的敏感监控摄像头，其中包括儿童体操室、游乐场和学校的监控画面。这一行为严重侵犯了居民隐私，引发了当地社区的强烈抗议。

Ask HN: Who is hiring? (May 2026)

Ask HN：谁在招聘？（2026 年 5 月）

这是 Hacker News 社区 2026 年 5 月份的招聘贴。企业主和招聘负责人在此发布职位信息，要求明确工作地点（远程或现场），并鼓励非知名公司详细介绍其业务内容，旨在为技术人才提供直接的求职渠道。

An open letter asking NHS England to keep its code open

一封要求英国国家医疗服务体系（NHS）保持代码开源的公开信

针对英国 NHS 近期可能收紧软件代码开源政策的动向，开发者社区发起联名信，重申“公共资金资助的代码应向公众开放”的原则。信中指出，开源不仅符合英国政府的设计原则，也是确保医疗系统软件透明度和安全性的关键。

OpenWarp

OpenWarp 是一个基于 Warp 终端构建的开源项目，旨在为用户提供“自带提供商”（BYOP）的能力。它支持 OpenAI、Anthropic、Gemini、Ollama、DeepSeek 等 6 种原生 API 协议，允许用户完全掌控密钥、模型和系统提示词，所有凭证仅保存在本地，确保了隐私与灵活性。

Flock cameras keep telling police a man who doesn’t have a warrant has a warrant

Flock 摄像头持续向警方误报某人持有逮捕令

视频揭露了 Flock 监控系统存在严重的算法误报问题。一名并未持有逮捕令的男子被系统多次错误标记，导致其频繁受到警方的骚扰和盘查，凸显了自动化执法工具在准确性与问责机制上的缺失。

Spotify adds ‘Verified’ badges to distinguish human artists from AI

Spotify 增加“已验证”徽章以区分人类艺术家与 AI

为了应对 AI 生成音乐的泛滥，Spotify 引入了“Verified by Spotify”徽章。带有绿色勾选图标的徽章将出现在符合“真实性标准”的人类艺术家名称旁，旨在帮助用户识别音乐内容的来源，维护平台内容的原创性。

Canonical/Ubuntu have been under DDoS

Canonical/Ubuntu 遭受 DDoS 攻击

Ubuntu 的母公司 Canonical 近期遭受了大规模的分布式拒绝服务（DDoS）攻击，导致其部分网站和服务中断。此次攻击影响了用户更新 Linux 系统及访问相关文档的能力，目前相关技术团队正在进行修复。

TechCrunch

Coatue has a plan to buy up land for data centers, possibly for Anthropic

Coatue 计划收购土地建设数据中心，可能用于支持 Anthropic

知名风投公司 Coatue 正在筹划一项新业务，旨在收购靠近大型电力来源的土地，用于建设数据中心。外界猜测此举是为了满足 Anthropic 等 AI 巨头对算力基础设施的迫切需求。

Pentagon inks deals with Nvidia, Microsoft, and AWS to deploy AI on classified networks

五角大楼与英伟达、微软及 AWS 签署协议，在机密网络中部署 AI

为了减少对单一 AI 供应商的依赖，美国国防部（DOD）与英伟达、微软和 AWS 签署了多项 AI 部署协议。此举是在五角大楼与 Anthropic 因模型使用条款发生争议后，为实现 AI 供应商多元化而采取的重要举措。

Ubuntu services hit by outages after DDoS attack

Ubuntu 服务在 DDoS 攻击后出现中断

一个黑客组织声称对 Ubuntu 和 Canonical 的网站发起了 DDoS 攻击。此次攻击导致用户无法更新其 Linux 操作系统，引发了广泛的关注。

Musk v. Altman is just getting started

马斯克诉奥特曼案才刚刚开始

埃隆·马斯克针对 OpenAI 的诉讼案本周进入庭审阶段。马斯克在证人席上接受了长达三天的质询，大量内部邮件、短信和推文被作为证据提交。马斯克的核心论点是，萨姆·奥特曼将 OpenAI 转为营利性模式的行为背叛了公司的初衷。

People are finally using Reddit’s search

人们终于开始使用 Reddit 的搜索功能了

Reddit CEO Steve Huffman 表示，Reddit 的搜索功能使用量同比增长了 30%。这表明 Reddit 在提升搜索体验方面所做的努力正在获得用户的认可。

ChatGPT Images 2.0 is a hit in India, but not a big winner elsewhere, yet

ChatGPT Images 2.0 在印度大受欢迎，但在其他地区尚未成为主流

ChatGPT Images 2.0 在印度市场表现强劲，用户广泛利用其进行头像创作和电影感肖像生成。然而，该功能在全球其他地区的普及程度目前仍处于起步阶段。

As Tim Cook steps down, Apple hit record sales — but a chip shortage looms

蒂姆·库克卸任之际，苹果销售额创下新高，但芯片短缺阴云笼罩

在蒂姆·库克卸任前夕，苹果公布了创纪录的销售业绩。然而，库克警告称，由于“RAMageddon”（内存芯片危机）导致的供应链短缺，可能会在未来几个月内对苹果的 Mac 产品线产生负面影响。

Y Combinator alum Skio sells for $105M cash, only raised $8M, founder says

YC 校友企业 Skio 以 1.05 亿美元现金被收购，创始人称仅融资 800 万美元

订阅计费金融科技公司 Skio 被竞争对手 Recharge 收购。Skio 创始人表示，公司在仅融资 800 万美元的情况下实现了 1.05 亿美元的现金退出，是一次非常成功的商业案例。

Sources: Anthropic potential $900B+ valuation round could happen within 2 weeks

消息人士：Anthropic 可能在两周内完成估值超 9000 亿美元的融资

据知情人士透露，Anthropic 正在要求投资者在 48 小时内提交其最新一轮融资的认购额度。预计该公司本轮融资后的估值将超过 9000 亿美元。

Apple was surprised by AI-driven demand for Macs

苹果对 AI 驱动的 Mac 需求感到惊讶

苹果公司表示，由于 AI 领域对高性能计算的需求激增，Mac mini、Studio 和 Neo 系列产品的需求超出了预期。苹果预计在接下来的一个季度中，这些产品仍将面临供应紧张的局面。

The Verge

微软正在测试重新设计的 Windows 11 运行菜单，支持深色模式等功能

微软正在 Windows 11 的实验频道中测试全新的“运行”菜单。新界面不仅外观更加现代化，响应速度更快，还正式加入了对深色模式的支持，旨在提升系统的整体一致性。

Apple raises the Mac Mini’s starting price

苹果提高了 Mac Mini 的起售价

苹果公司已将其在线商店中 599 美元的 256GB 版本 Mac Mini 下架，导致该系列产品的起售价升至 799 美元。此举发生在该公司警告芯片短缺将影响 Mac 产品供应的次日。

All the evidence revealed so far in Musk v. Altman

马斯克诉奥特曼案中目前披露的所有证据

随着马斯克诉 OpenAI 案的庭审推进，大量早期邮件、照片和公司文件被公开。证据显示，在 OpenAI 成立之初，英伟达 CEO 黄仁勋曾向其提供过支持，这些细节为理解 OpenAI 的起源提供了新的视角。

Birdfy’s smart bird feeder is down to its best-ever price for Mother’s Day

Birdfy 智能喂鸟器在母亲节前夕降至历史最低价

为了迎接母亲节，Birdfy 智能喂鸟器（特别是 4K 金属版）推出了大幅折扣。这款产品是科技爱好者送给母亲的独特礼物选择之一。

Amazon’s built-in AI price history expands to show the entire last year

亚马逊内置的 AI 价格追踪功能扩展至显示过去一年的完整记录

亚马逊的 AI 助手 Rufus 现在可以展示商品过去一年的价格变动历史。用户只需在 App 中点击“价格历史”按钮或询问 Rufus，即可查看价格走势，此举旨在为即将到来的 Prime Day 购物节提供参考。

Dreame — the vacuum company — just ‘launched’ its own phones

吸尘器公司追觅（Dreame）“发布”了自己的手机

以扫地机器人闻名的追觅公司在加州举办的 Next 活动上展示了两款手机。尽管该公司雄心勃勃，但外界对其从家电跨界到手机制造的举动持怀疑态度。

This accessory can snap a Steam Controller to your phone — or almost anything else

这款配件可以将 Steam 控制器固定在手机或任何物体上

随着新款 Steam 控制器的发布，配件厂商 Mechanism 推出了 Basegrip。这是一款创新的固定装置，允许用户将控制器安装在手机、Ikea Skadis 挂板或其他表面上，极大地扩展了控制器的使用场景。

Players from the NBA, NFL, and MLB call for a ban on betting ‘unders’

NBA、NFL 和 MLB 球员呼吁禁止对“小分”进行投注

各大职业体育联盟的球员协会联合致信美国商品期货交易委员会（CFTC），要求禁止预测市场平台允许用户对球员的“表现不佳”或“受伤”进行投注，认为这会威胁到球员的安全与比赛的公正性。

Severe Linux Copy Fail security flaw uncovered using AI scanning help

利用 AI 扫描发现严重的 Linux “Copy Fail”安全漏洞

CVE-2026-31431 漏洞（被称为“Copy Fail”）影响了自 2017 年以来的几乎所有 Linux 发行版。该漏洞允许任何用户通过简单的 Python 脚本获取管理员权限，目前已引起安全界的广泛关注。

Dreame’s rocket-powered car can do 0–60 in 0.9 seconds because you can just say things now

追觅的火箭动力汽车 0-60 英里加速仅需 0.9 秒

在追觅的 Next 活动上，该公司展示了一款火箭动力电动汽车，其性能参数令人咋舌。尽管其性能听起来有些不可思议，但这一展示再次凸显了追觅在跨界技术研发上的激进策略。

Ars Technica

Man dies covered in necrotic lesions after amoebas eat him alive

男子因阿米巴原虫感染导致全身坏死性病变死亡

医生分析认为，该男子的死亡是由三个看似普通但致命的因素共同作用导致的，最终导致阿米巴原虫侵蚀其身体。

Ubuntu infrastructure has been down for more than a day

Ubuntu 基础设施已宕机超过一天

Ubuntu 的基础设施中断已持续超过 24 小时，这不仅影响了日常服务，还阻碍了关于那个关键 root 权限漏洞的沟通与修复工作。

Senators ban themselves from prediction markets after candidates bet on own races

参议员在候选人押注自身选情后禁止自己参与预测市场

针对候选人利用预测市场押注自身选情的行为，参议员们谴责这种“公然的腐败”，并立法禁止自己参与此类市场。

Minnesota passes ban on fake AI nudes; app makers risk $500K fines

明尼苏达州通过禁令，禁止制作 AI 伪造裸照，应用开发者面临 50 万美元罚款

明尼苏达州立法严厉打击 AI 生成的非自愿裸照（CSAM），违规的应用开发者将面临高达 50 万美元的罚款。

Amazon stuck with months of repairs after drone strikes on data centers

亚马逊数据中心遭无人机袭击，面临数月的维修工作

由于中东地区数据中心遭到无人机袭击，AWS 已停止向该地区客户收费，维修工作预计将持续数月。

Scorpions go terminator mode and reinforce their weapons with metal

蝎子进入“终结者”模式，用金属强化武器

研究发现，蝎子会根据不同的狩猎模式，在螯和尾刺中分布不同比例的金属元素，以强化其捕食武器。

GPT-5.5 matches heavily hyped Mythos Preview in new cybersecurity tests

测试结果显示，OpenAI 的 GPT-5.5 在网络安全任务上的表现已达到 Anthropic Mythos Preview 的水平，证明了这种能力并非单一模型的突破。

Is your Purosangue SUV not sharp enough? Ferrari has you covered.

法拉利 Purosangue SUV 不够犀利？法拉利为你准备了新方案

法拉利即将推出一款更强劲的 V12 四座车型，随后还将发布品牌首款电动汽车。

Virgin Galactic reveals new ship, but it’s running out of time and cash

维珍银河发布新飞船，但时间和资金所剩无几

维珍银河虽然发布了新飞船，但其现金储备是否足以支撑漫长的测试阶段仍存疑。

Apple may take “several months” to catch up to Mac mini and Studio demand

苹果可能需要“数月”时间才能满足 Mac mini 和 Studio 的需求

芯片短缺和 AI 爱好者的强劲需求，导致苹果 Mac 产品线面临长期的供应压力。

Product Hunt

Marx Finance

Marx Finance 一个由 AI 代理进行市场辩论的平台。

CipherLock

CipherLock 通过破解密码来学习密码学的工具。

Zed 1.0

Zed 1.0 高性能、开源、支持多人协作的代码编辑器。

Buda

Buda 招募 AI 代理作为同步团队来运营你的公司。

Postiz

Postiz 面向 OpenClaw 等代理的社交媒体调度工具。

HiveTerm

HiveTerm 集成了 Claude、Codex、Gemini 等模型的统一工作空间。

Bitgrain

Bitgrain 比 Figma 更轻量、比 Canva 更灵活的设计工作室工具。

Montage

Montage 用于代理式用户界面的运行时框架。

ScreenVeil

ScreenVeil 隐藏电脑上不应被他人看见的内容。

nudge

nudge AI 自动为你安排全周任务的日程管理工具。

MIT Technology Review

Cyber-Insecurity in the AI Era

AI 时代的网络不安全

AI 扩大了攻击面并增加了复杂性，使得传统的安全方法难以应对。本文探讨了为何必须以 AI 为核心重新构建安全架构。

Operationalizing AI for Scale and Sovereignty

AI 的规模化与主权化运营

企业正在通过掌控数据来定制 AI，以平衡所有权与可信数据的流动，从而实现 AI 工厂的规模化与可持续性。

The Download: a new Christian phone network, and debugging LLMs

每日下载：新的基督教手机网络与 LLM 调试

介绍了一款旨在屏蔽色情和性别相关内容的基督教手机网络，以及用于调试大语言模型的新工具。

Inexpensive seafloor-hopping submersibles could stoke deep-sea science—and mining

廉价的海底跳跃潜水器可能推动深海科学与采矿

NOAA 正在利用新型潜水器在太平洋海底寻找关键矿产资源，这既促进了科学研究，也引发了对深海采矿的讨论。

Trump’s mass firing just dealt another blow to American science

特朗普的大规模解雇再次打击了美国科学界

美国国家科学基金会（NSF）的 22 名董事会成员被集体解雇，这对美国科学研究的资金分配和管理造成了严重冲击。

美国新的基督教手机网络旨在屏蔽色情和性别相关内容

该网络在运营商层面实施强制过滤，即使是成人用户也无法关闭，引发了关于网络审查的争议。

Exclusive eBook: Inside the stealthy startup that pitched brainless human clones

独家电子书：揭秘那家兜售“无脑人类克隆体”的隐秘初创公司

探讨了初创公司 R3 Bio 提出的“无脑克隆体”作为人类备份身体的伦理争议与愿景。

This startup’s new mechanistic interpretability tool lets you debug LLMs

这家初创公司的新型机械可解释性工具让你能够调试 LLM

Goodfire 推出的 Silico 工具允许研究人员在训练过程中深入 AI 模型内部并调整参数，从而实现更精细的控制。

The Download: the North Pole’s future and humanoid data

每日下载：北极的未来与人形机器人数据

探讨了北极气候变化的研究进展以及人形机器人数据的重要性。

The Download: storing nuclear waste and orchestrating agents

每日下载：核废料储存与代理编排

讨论了核能的复兴以及如何为 AI 代理制定有效的编排计划。

Flowseal / zapret-discord-youtube

OpenAI Blog

Introducing Advanced Account Security

引入高级账户安全推出抗钓鱼登录、更强的恢复机制和增强保护，以防止账户被盗。

Where the goblins came from

哥布林从何而来分析 GPT-5 行为中个性化怪癖的根源、时间线及修复方案。

Building the compute infrastructure for the Intelligence Age

构建智能时代的计算基础设施 OpenAI 扩展 Stargate 项目，增加数据中心容量以满足 AGI 需求。

Cybersecurity in the Intelligence Age

智能时代的网络安全提出五部分行动计划，旨在民主化 AI 网络防御并保护关键系统。

Our commitment to community safety

我们对社区安全的承诺介绍 OpenAI 如何通过模型防护、滥用检测和政策执行来保障 ChatGPT 安全。

OpenAI models, Codex, and Managed Agents come to AWS

OpenAI 模型、Codex 和托管代理登陆 AWS 企业现可在 AWS 环境中构建安全的 AI 应用。

OpenAI available at FedRAMP Moderate

OpenAI 获得 FedRAMP Moderate 授权 ChatGPT 企业版和 API 现可供美国联邦机构安全使用。

The next phase of the Microsoft OpenAI partnership

微软与 OpenAI 合作的下一阶段双方修订协议，简化合作关系，支持 AI 持续创新。

An open-source spec for orchestration: Symphony

Symphony：一种开源的编排规范将问题追踪器转化为全天候代理系统，提升工程产出。

Choco automates food distribution with AI agents

Choco 利用 AI 代理自动化食品分发客户案例：Choco 通过 OpenAI API 简化分发流程，提升生产力。

Anthropic Blog

Introducing Claude Opus 4.7

推出 Claude Opus 4.7 在编码、代理、视觉和多步任务中表现更强，更加彻底和一致。

Introducing Claude Design by Anthropic Labs

推出 Claude Design 与 Claude 协作创建设计、原型、幻灯片等视觉作品。

Claude is a space to think

Claude 是一个思考的空间承诺 Claude 将保持无广告，以维护用户信任。

Claude for Creative Work

Claude 用于创意工作

Anthropic names Theo Hourmouzis General Manager of Australia & New Zealand and officially opens Sydney office

Anthropic 任命 Theo Hourmouzis 为澳新地区总经理，并正式开设悉尼办公室

An update on our election safeguards

选举安全保障更新

Anthropic and NEC collaborate to build Japan’s largest AI engineering workforce

Anthropic 与 NEC 合作构建日本最大的 AI 工程团队

Anthropic and Amazon expand collaboration for up to 5 gigawatts of new compute

Anthropic 与亚马逊扩大合作，新增 5 吉瓦算力

Anthropic’s Long-Term Benefit Trust appoints Vas Narasimhan to Board of Directors

Anthropic 长期利益信托任命 Vas Narasimhan 为董事会成员

Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute

Anthropic 扩大与谷歌和博通的合作，新增数吉瓦下一代算力

Google AI Blog

Celebrating 20 years of Google Translate: Fun facts, tips and new features to try

庆祝谷歌翻译 20 周年：趣事、技巧与新功能

Join the new AI Agents Vibe Coding Course from Google and Kaggle

加入谷歌与 Kaggle 的 AI 代理“Vibe Coding”课程

8 Gemini tips for organizing your space (and life)

8 个利用 Gemini 整理空间与生活的技巧

Here’s how our TPUs power increasingly demanding AI workloads.

谷歌 TPU 如何驱动日益严苛的 AI 工作负载

Elevating Austria: Google invests in its first data center in the Alps.

提升奥地利：谷歌在阿尔卑斯山投资首个数据中心

We’re launching two specialized TPUs for the agentic era.

为代理时代推出两款专用 TPU

3 new ways Ads Advisor is making Google Ads safer and faster

Ads Advisor 的 3 种新方式，让 Google Ads 更安全、更快捷

7 ways to travel smarter this summer, with help from Google

谷歌助你今夏更聪明地旅行的 7 种方式

A new way to explore the web with AI Mode in Chrome

Chrome AI 模式：探索网页的新方式

New ways to create personalized images in the Gemini app

Gemini 应用中创建个性化图像的新方式

Hugging Face Blog

AI evals are becoming the new compute bottleneck

AI 评估正成为新的算力瓶颈

Granite 4.1 LLMs: How They’re Built

Granite 4.1 LLM：构建方式

DeepInfra on Hugging Face Inference Providers 🔥

DeepInfra 登陆 Hugging Face 推理提供商

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

推出 NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频代理的长上下文多模态智能

How to build scalable web apps with OpenAI’s Privacy Filter

如何利用 OpenAI 的隐私过滤器构建可扩展的 Web 应用

DeepSeek-V4: a million-token context that agents can actually use

DeepSeek-V4：代理真正可用的百万 Token 上下文

How to Use Transformers.js in a Chrome Extension

如何在 Chrome 扩展中使用 Transformers.js

QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard

QIMMA：质量优先的阿拉伯语 LLM 排行榜

AI and the Future of Cybersecurity: Why Openness Matters

AI 与网络安全的未来：为何开放至关重要

Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

Ecom-RLVE：电子商务对话代理的自适应可验证环境

The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

正交性之后：美德伦理代理与 AI 对齐

AGI Is Not Multimodal

AGI 不是多模态的

Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

形状、对称性与结构：数学在机器学习研究中角色的转变

What’s Missing From LLM Chatbots: A Sense of Purpose

LLM 聊天机器人缺失了什么：目标感

We Need Positive Visions for AI Grounded in Wellbeing

我们需要基于福祉的 AI 正向愿景

Financial Market Applications of LLMs

LLM 在金融市场的应用

A Brief Overview of Gender Bias in AI

AI 中性别偏见的简要概述

Mamba Explained

Mamba 详解

Car-GPT: Could LLMs finally make self-driving cars happen?

Car-GPT：LLM 能否最终实现自动驾驶？

Do text embeddings perfectly encode text?

文本嵌入能完美编码文本吗？

arXiv CS.AI

Compositional Meta-Learning for Mitigating Task Heterogeneity in Physics-Informed Neural Networks

用于缓解物理信息神经网络中任务异构性的组合元学习

Binary Spiking Neural Networks as Causal Models

作为因果模型的二进制脉冲神经网络

When Your LLM Reaches End-of-Life: A Framework for Confident Model Migration in Production Systems

当 LLM 到达生命周期终点：生产系统中自信模型迁移的框架

End-to-end autonomous scientific discovery on a real optical platform

真实光学平台上的端到端自主科学发现

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

思考并运行：通过自愈多代理 AI 实现自主 ML 流水线生成

Unsupervised Electrofacies Classification and Porosity Characterization in the Offshore Keta Basin Using Wireline Logs

利用测井数据对 Keta 近海盆地进行无监督电相分类与孔隙度表征

TRUST: A Framework for Decentralized AI Service v.0.1

TRUST：去中心化 AI 服务框架 v.0.1

Unpacking Vibe Coding: Help-Seeking Processes in Student-AI Interactions While Programming

解构“Vibe Coding”：编程中学生与 AI 交互的求助过程

arXiv CS.CL

BatteryPass-12K: The First Dataset for the Novel Digital Battery Passport Conformance Task

BatteryPass-12K：首个数字电池护照一致性任务数据集

Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

长度价值模型：Token 级长度建模的可扩展价值预训练

CL-bench Life: Can Language Models Learn from Real-Life Context?

CL-bench Life：语言模型能从现实生活中学习上下文吗？

Useless but Safe? Benchmarking Utility Recovery with User Intent Clarification in Multi-Turn Conversations

无用但安全？多轮对话中用户意图澄清的效用恢复基准测试

Exploring the Limits of Pruning: Task-Specific Neurons, Model Collapse, and Recovery in Task-Specific Large Language Models

探索剪枝极限：任务特定 LLM 中的任务特定神经元、模型崩溃与恢复

Cross-Lingual Response Consistency in Large Language Models: An ILR-Informed Evaluation of Claude Across Six Languages

LLM 中的跨语言响应一致性：基于 ILR 的 Claude 六语言评估

Semantic Structure of Feature Space in Large Language Models

LLM 特征空间的语义结构

Path-Lock Expert: Separating Reasoning Mode in Hybrid Thinking via Architecture-Level Separation

Path-Lock Expert：通过架构级分离实现混合思维中的推理模式分离

WIRED

OpenAI Enables Marketing Cookies by Default for Free ChatGPT Users

OpenAI 默认开启免费 ChatGPT 用户的营销 Cookie

Dangerous New Linux Exploit Gives Attackers Root Access to Countless Computers

危险的 Linux 新漏洞赋予攻击者无数计算机的 Root 权限

A Dark-Money Campaign Is Paying Influencers to Frame Chinese AI as a Threat

暗钱运动支付网红费用，将中国 AI 描绘为威胁

This Eye-Catching Indoor Garden Is 20 Percent Off Right Now

这款引人注目的室内花园目前八折优惠

The Next Alzheimer’s Breakthrough Will Take More Than Just Science

阿尔茨海默病的下一个突破需要的不仅仅是科学

The Chinese Government Just Got the World’s Largest Digital Rights Conference Canceled

中国政府导致全球最大的数字权利会议被取消

You Found Satoshi？ Let’s See the Receipts

你找到了中本聪？让我们看看证据

17 Best Graduation Gifts That Aren’t Totally Cringe (2026)

2026 年 17 个不尴尬的最佳毕业礼物

What Chef Jon Kung Swears By in the Kitchen (2026)

厨师 Jon Kung 在厨房里信奉什么（2026）

Do You Need Aluminum Luggage? (2026): Rimowa, Away, Carl Friedrik

你需要铝制行李箱吗？（2026）

Lobsters

combat LLM spam by building a web of trust

通过建立信任网打击 LLM 垃圾信息

Why I Don’t Vibe Code

为什么我不进行“Vibe Coding”

Progressive Web Components

渐进式 Web 组件

If I Could Make My Own GitHub

如果我可以创建自己的 GitHub

What are you doing this weekend?

这个周末你打算做什么？

micro-benchmarks don’t tell the whole story

微基准测试不能说明全部情况

Pu.sh – a full coding-agent harness in 400 lines of shell (pu.dev)

Pu.sh：400 行 Shell 代码实现的完整编码代理工具

Porting microgpt to Futhark, Part I

将 microgpt 移植到 Futhark，第一部分

DEV Community

Building Production-Grade Tools for AI Agents: What Works After 100 Deployments

构建 AI 代理的生产级工具：100 次部署后的经验总结

I Threw Away My ILIKE Queries and My Search Bar Finally Works - MeiliSearch

我抛弃了 ILIKE 查询，搜索栏终于好用了 - MeiliSearch

I Built a Full-Stack Invoice App from Scratch. Here’s the Complete Breakdown

我从零构建了一个全栈发票应用，这是完整拆解

Why I’m Learning ROS 2 as a Database Person

作为数据库从业者，我为什么要学习 ROS 2

Prompt engineering techniques

提示词工程技术

How MPI Works Under the Hood (Without the Jargon)

MPI 是如何工作的（无术语版）

11 Minutes, $1.73, and GPT-5.5 Cybersecurity Simulation

11 分钟、1.73 美元与 GPT-5.5 网络安全模拟

Security news weekly round-up - 1st May 2026

安全新闻周报 - 2026 年 5 月 1 日

CopyFail Linux Root, AI Jailbreak & Emerging AI Security Platforms

CopyFail Linux Root、AI 越狱与新兴 AI 安全平台

Local LLMs with PandasAI, Claude for Code Security & Jupyter Integration

本地 LLM 与 PandasAI、Claude 代码安全及 Jupyter 集成

Meta Engineering

How Meta Is Strengthening End-to-End Encrypted Backups

Meta 如何加强端到端加密备份

Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

现代化 Facebook 群组搜索，释放社区知识的力量

Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

Meta 的容量效率：统一 AI 代理如何优化超大规模性能

Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

Meta 的后量子密码迁移：框架、经验与启示

Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases

逃离分支：Meta 如何在 50 多个用例中现代化 WebRTC

Trust But Canary: Configuration Safety at Scale

信任但 Canary：大规模配置安全

How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

Meta 如何利用 AI 映射大规模数据流水线中的部落知识

KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

KernelEvolve：Meta 的排名工程师代理如何优化 AI 基础设施

Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta 自适应排名模型：弯曲推理扩展曲线以服务广告 LLM 模型

DeepMind Blog

Enabling a new model for healthcare with AI co-clinician

通过 AI 临床辅助实现医疗新模式

Announcing our partnership with the Republic of Korea

宣布与韩国建立合作伙伴关系

Decoupled DiLoCo: A new frontier for resilient, distributed AI training

解耦 DiLoCo：弹性分布式 AI 训练的新前沿

Partnering with industry leaders to accelerate AI transformation

与行业领袖合作加速 AI 转型

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

Gemini 3.1 Flash TTS：下一代富有表现力的 AI 语音

Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning

Gemini Robotics-ER 1.6：通过增强具身推理驱动现实世界机器人任务

Gemma 4: Byte for byte, the most capable open models

Gemma 4：最强大的开源模型

Gemini 3.1 Flash Live: Making audio AI more natural and reliable

Gemini 3.1 Flash Live：让音频 AI 更自然、更可靠

Protecting people from harmful manipulation

保护人们免受有害操纵

Lyria 3 Pro: Create longer tracks in more

Lyria 3 Pro：创作更长的曲目

Microsoft AI Blog

A conversation with Kevin Scott: What’s next in AI

与 Kevin Scott 对话：AI 的下一步

From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative

从风火轮到内容处理：品牌如何利用微软 AI 提升生产力与想象力

Microsoft open sources its ‘farm of the future’ toolkit

微软开源其“未来农场”工具包

How data and AI will transform contact centres for financial services

数据与 AI 如何改变金融服务联络中心

AI-equipped drones study dolphins on the edge of extinction

配备 AI 的无人机研究濒临灭绝的海豚

Online math tutoring service uses AI to help boost students’ skills and confidence

在线数学辅导服务利用 AI 提升学生技能与信心

AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan

AI-Mimi 为日本听障用户构建包容性电视体验

Microsoft’s framework for building AI systems responsibly

微软负责任地构建 AI 系统的框架

Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade

新加坡开发亚洲首个 AI 鲨鱼和鳐鱼鳍识别应用，打击非法野生动物贸易

The opportunity at home – can AI drive innovation in personal assistant devices and sign language?

家庭机遇：AI 能否驱动个人助理设备与手语创新？

VentureBeat AI

Railway secures $100 million to challenge AWS with AI-native cloud infrastructure

Railway 融资 1 亿美元，以 AI 原生云基础设施挑战 AWS

Claude Code costs up to $200 a month. Goose does the same thing for free.

Claude Code 每月费用高达 200 美元，而 Goose 可以免费实现同样功能

Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews

Listen Labs 在病毒式广告牌招聘活动后融资 6900 万美元

Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI

Salesforce 推出全新 Slackbot AI 代理，在办公 AI 领域对抗微软与谷歌

Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required

Anthropic 推出 Cowork，无需编码即可在文件中工作的 Claude 桌面代理

Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research 的 NousCoder-14B：一款开源编码模型

The creator of Claude Code just revealed his workflow, and developers are losing their minds

Claude Code 的创建者揭示了他的工作流程，开发者们为之疯狂

arXiv CS.LG

Monitoring Neural Training with Topology: A Footprint-Predictable Collapse Index

利用拓扑监控神经网络训练：一种足迹可预测的崩溃指数

Simple Self-Conditioning Adaptation for Masked Diffusion Models

掩码扩散模型的简单自条件适应

People-Centred Medical Image Analysis

以人为中心的医学图像分析

When Continual Learning Moves to Memory: A Study of Experience Reuse in LLM Agents

当持续学习转向记忆：LLM 代理中经验重用的研究

Automatic Causal Fairness Analysis with LLM-Generated Reporting

利用 LLM 生成报告进行自动因果公平性分析

Fidelity, Diversity, and Privacy: A Multi-Dimensional LLM Evaluation for Clinical Data Augmentation

保真度、多样性与隐私：临床数据增强的多维 LLM 评估

Dynamic Adversarial Fine-Tuning Reorganizes Refusal Geometry

动态对抗微调重组拒绝几何

NORACL: Neurogenesis for Oracle-free Resource-Adaptive Continual Learning

NORACL：面向无 Oracle 资源自适应持续学习的神经发生

arXiv CS.CV

Automated Detection of Mutual Gaze and Joint Attention in Dual-Camera Settings via Dual-Stream Transformers

通过双流 Transformer 在双摄像头设置中自动检测相互注视与联合注意

Reconstruction by Generation: 3D Multi-Object Scene Reconstruction from Sparse Observations

通过生成进行重建：从稀疏观测中进行 3D 多对象场景重建

InterPartAbility: Text-Guided Part Matching for Interpretable Person Re-Identification

InterPartAbility：用于可解释人员重识别的文本引导部分匹配

Lightweight Distillation of SAM 3 and DINOv3 for Edge-Deployable Individual-Level Livestock Monitoring and Longitudinal Visual Analytics

SAM 3 和 DINOv3 的轻量级蒸馏，用于边缘部署的个体牲畜监测与纵向视觉分析

Energy-Efficient Plant Monitoring via Knowledge Distillation

通过知识蒸馏实现节能植物监测

HQ-UNet: A Hybrid Quantum-Classical U-Net with a Quantum Bottleneck for Remote Sensing Image Segmentation

HQ-UNet：具有量子瓶颈的混合量子经典 U-Net，用于遥感图像分割

AttriBE: Quantifying Attribute Expressivity in Body Embeddings for Recognition and Identification

AttriBE：量化身体嵌入中用于识别的属性表达力

Towards Generalizable Mapping of Hedges and Linear Woody Features from Earth Observation Data: a national Product for Germany

迈向从地球观测数据中对树篱和线性木本特征进行可推广映射：德国的国家产品

Towards Data Science

How to Get Hired in the AI Era

如何在 AI 时代被录用

Churn Without Fragmentation: How a Party-Label Bug Reversed My Headline Finding

无碎片化的流失：政党标签错误如何逆转了我的结论

Ghost: A Database for Our Times?

Ghost：我们时代的数据库？

Why Powerful Machine Learning Is Deceptively Easy

为什么强大的机器学习看起来容易得令人困惑

A Gentle Introduction to Stochastic Programming

随机规划入门

Proxy-Pointer RAG: Multimodal Answers Without Multimodal Embeddings

Proxy-Pointer RAG：无需多模态嵌入的多模态答案

How to Study the Monotonicity and Stability of Variables in a Scoring Model using Python

如何使用 Python 研究评分模型中变量的单调性与稳定性

Why AI Engineers Are Moving Beyond LangChain to Native Agent Architectures

为什么 AI 工程师正在超越 LangChain 转向原生代理架构

4 YAML Files Instead of PySpark: How We Let Analysts Build Data Pipelines Without Engineers

4 个 YAML 文件替代 PySpark：我们如何让分析师在没有工程师的情况下构建数据流水线

Ensembles of Ensembles of Ensembles: A Guide to Stacking

集成之集成：Stacking 指南