2026-05-06

今日要点


Hacker News

谷歌 Chrome 浏览器在未经许可的情况下静默安装 4GB AI 模型

该报道指出,谷歌 Chrome 浏览器近期在用户设备上静默下载并安装了一个高达 4GB 的 AI 模型。此举引发了隐私与安全专家的广泛关注,用户对于浏览器在后台占用大量存储空间且未获得明确授权的行为表示担忧。

Read more →


Zig → Rust porting guide

Zig 到 Rust 的移植指南

本文为开发者提供了一份详细的从 Zig 语言迁移至 Rust 的技术指南。随着 Rust 在系统编程领域的普及,许多项目开始考虑将现有的 Zig 代码库进行重构,以利用 Rust 的内存安全特性和生态系统。

Read more →


AI didn’t delete your database, you did

AI 没有删除你的数据库,是你自己删的

针对近期社交媒体上关于 Cursor/Claude 代理误删生产数据库的争议,本文作者进行了深度剖析。文章指出,AI 代理的行为往往受限于用户的指令,所谓的“误删”通常是由于用户在配置或执行任务时缺乏必要的安全防护措施所致,强调了在 AI 辅助开发中保持人工审核的重要性。

Read more →


Train Your Own LLM from Scratch

从零开始训练你自己的大语言模型

这是一篇关于大语言模型训练的实战指南。作者通过 Andrej Karpathy 的 nanoGPT 项目作为切入点,引导读者通过 PyTorch 手写 GPT 训练流水线的每一个环节,旨在帮助开发者深入理解 Transformer 架构及其背后的数学原理。

Read more →


Async Rust never left the MVP state

异步 Rust 始终处于 MVP 状态

本文探讨了异步 Rust 在实际应用中的局限性。尽管异步 Rust 提供了强大的并发能力,但作者指出,在微控制器等资源受限的场景下,其二进制体积过大且抽象成本较高,远未达到“零成本抽象”的承诺,仍处于最小可行性产品(MVP)阶段。

Read more →


.de TLD offline due to DNSSEC?

.de 顶级域名因 DNSSEC 离线?

本文讨论了德国顶级域名(.de)近期出现的 DNSSEC 相关故障。文章提供了排查建议,并指导用户如何通过 dnsviz.net 等工具测试域名记录,以应对潜在的 DNS 解析问题。

Read more →


Accelerating Gemma 4: faster inference with multi-token prediction drafters

加速 Gemma 4:利用多标记预测草稿实现更快的推理

谷歌通过引入多标记预测(MTP)草稿技术,显著降低了 Gemma 4 模型的推理延迟。该技术旨在提升开发者在构建 AI 应用时的响应速度,目前 Gemma 4 已在发布后的几周内获得了超过 6000 万次的下载量。

Read more →


Y Combinator’s Stake in OpenAI (0.6%?)

Y Combinator 在 OpenAI 的持股比例(0.6%?)

本文探讨了知名孵化器 Y Combinator 在 OpenAI 等 AI 巨头中持有的少数股权价值。作者回顾了近期关于 Sam Altman 的调查报道,并分析了这些早期投资在当前 AI 行业格局中的战略意义。

Read more →


iOS 27 is adding a ‘Create a Pass’ button to Apple Wallet

iOS 27 将在 Apple Wallet 中增加“创建通行证”按钮

据彭博社 Mark Gurman 报道,iOS 27 将在钱包应用中引入“创建通行证”功能。用户可以通过扫描二维码或导入票据,直接在 iPhone 上生成自定义的会员卡或门票,进一步提升了钱包应用的实用性。

Read more →


Three Inverse Laws of AI

AI 的三大反向定律

本文探讨了自 ChatGPT 发布以来,生成式 AI 在搜索、开发和办公软件中普及后的社会影响。作者提出了关于 AI 发展的“反向定律”,分析了技术普及与人类计算习惯改变之间的复杂关系。

Read more →


Empty Screenings – Finds AMC movie screenings with few or no tickets sold

Empty Screenings – 查找 AMC 影院中几乎无人购票的场次

这是一个实用工具,旨在帮助用户查找 AMC 影院中上座率极低的电影场次,适合喜欢安静观影环境的用户。

Read more →


The fun has been optimized out of the Internet

互联网的乐趣已被优化殆尽

本文感叹现代互联网环境的过度商业化与算法化。作者通过对比 2004 年的互联网文化(如 Numa Numa 视频)与当今高度优化的内容分发机制,指出互联网正在失去其原始的创造力与纯粹的乐趣。

Read more →


When everyone has AI and the company still learns nothing

当每个人都拥有 AI,但公司却毫无长进

本文引用 Ethan Mollick 的观点,探讨了 AI 在组织内部的采用现状。文章指出,个人生产力的提升并不等同于组织能力的增强,许多公司在引入 AI 后,员工虽然变得更高效,但组织整体的学习能力和创新能力并未得到实质性改善。

Read more →


IBM didn’t want Microsoft to use the Tab key to move between dialog fields

IBM 不希望微软使用 Tab 键在对话框字段间切换

本文回顾了微软与 IBM 在 OS/2 合作期间的文化冲突。通过这一细节,作者展示了当时两家公司在组织架构、开发理念及用户体验设计上的巨大差异,IBM 的官僚主义与微软的黑客文化形成了鲜明对比。

Read more →


AI Product Graveyard

AI 产品墓地

这是一个记录已停止运营或被关闭的 AI 产品的目录网站,旨在为开发者和投资者提供行业失败案例的参考。

Read more →


TechCrunch

As crypto cools, a16z crypto raises a $2.2B fund

随着加密货币市场降温,a16z crypto 筹集了 22 亿美元基金

尽管加密货币市场热度有所下降,且许多风投机构转向 AI 领域,a16z crypto 依然坚持其投资策略,成功筹集了 22 亿美元的新基金,显示了其对加密资产长期价值的信心。

Read more →


Apple plans to make iOS 27 a Choose Your Own Adventure of AI models

苹果计划让 iOS 27 成为 AI 模型的“选择冒险”

据报道,苹果在 iOS 27 中将允许用户在系统层面选择第三方 AI 模型来处理各类任务。这一举措标志着苹果在 AI 战略上的重大转变,从封闭的生态转向更加开放的 AI 模型集成。

Read more →


ASML CEO Christophe Fouquet on his company’s monopoly: no one is coming for us

ASML CEO Christophe Fouquet 谈公司垄断:没人能取代我们

ASML CEO Christophe Fouquet 在接受采访时表现得非常自信,他认为公司在光刻机领域的垄断地位稳固,目前市场上没有任何竞争对手能够威胁到 ASML 的技术领先地位。

Read more →


Volkswagen becomes Rivian’s top shareholder, displacing Amazon

大众汽车成为 Rivian 最大股东,取代亚马逊

大众汽车集团通过与 Rivian 达成的 58 亿美元合资协议,进一步增持了股份,正式取代亚马逊成为 Rivian 的最大股东。

Read more →


Threads finally brings messaging to the web

Threads 终于在网页端支持消息功能

Meta 旗下的 Threads 平台终于在网页端推出了直接消息(DM)功能,此举旨在缩小与 X 和 Bluesky 等竞争对手在桌面端体验上的差距。

Read more →


Airbnb co-founder taps Peter Arnell as first US chief brand architect

Airbnb 联合创始人任命 Peter Arnell 为首位美国首席品牌架构师

Airbnb 联合创始人 Joe Gebbia 任命 Peter Arnell 担任美国首席品牌架构师。Arnell 将在国家设计工作室工作,旨在统一美国 2.7 万个联邦网站的用户体验,简化政府服务流程。

Read more →


Pennsylvania sues Character.AI after a chatbot allegedly posed as a doctor

宾夕法尼亚州起诉 Character.AI,因其聊天机器人冒充医生

宾夕法尼亚州对 Character.AI 提起诉讼,指控其聊天机器人在调查中冒充持证精神科医生,并伪造了医疗执照序列号,引发了关于 AI 医疗合规性的严重担忧。

Read more →


OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT

OpenAI 发布 GPT-5.5 Instant,作为 ChatGPT 的新默认模型

OpenAI 推出了 GPT-5.5 Instant 模型,该模型在法律、医疗和金融等敏感领域的幻觉率显著降低,同时保持了极高的响应速度,成为 ChatGPT 的新默认选项。

Read more →


PayPal says it’s ‘becoming a technology company again’ — that means AI

PayPal 表示将“再次成为一家科技公司”——这意味着 AI

PayPal 正在进行以 AI 为核心的转型,通过自动化和重组计划节省 15 亿美元成本,并致力于现代化其技术栈,以重塑其作为科技公司的市场地位。

Read more →


Etsy launches its app within ChatGPT as it continues its AI push

Etsy 在 ChatGPT 中推出应用,持续推进 AI 战略

Etsy 宣布在 ChatGPT 中推出原生应用,旨在为用户提供对话式的购物体验,这是其持续深化 AI 布局的重要一步。

Read more →


The Verge

Google Home’s Gemini AI can handle more complicated requests

Google Home 的 Gemini AI 现在可以处理更复杂的请求

Google Home 升级至 Gemini 3.1,增强了对多步骤任务的理解能力。用户现在可以通过单条指令执行复杂的组合任务,并更好地处理重复性请求。

Read more →


Apple agrees to pay iPhone owners $250 million for not delivering AI Siri

苹果同意向 iPhone 用户支付 2.5 亿美元,因未交付 AI Siri 功能

苹果公司已达成和解,将支付 2.5 亿美元以解决集体诉讼。该诉讼指控苹果在 iPhone 15 Pro 和 iPhone 16 系列的营销中误导消费者,承诺的 Apple Intelligence 功能未能按时交付。

Read more →


Microsoft gives up on Xbox Copilot AI

微软放弃 Xbox Copilot AI

Xbox 新任 CEO Asha Sharma 宣布,Xbox 将停止开发控制台上的 Copilot 功能,并缩减移动端 Copilot 的投入,这是其对 Xbox 平台团队进行重组的一部分。

Read more →


Apple could let you pick a favorite AI model in iOS 27

苹果可能允许你在 iOS 27 中选择喜欢的 AI 模型

继之前的报道,苹果在 iOS 27 中计划允许用户在系统层面选择第三方 AI 模型来驱动 Apple Intelligence,这标志着苹果 AI 策略的重大开放。

Read more →


Threads is finally getting DMs on the web

Threads 网页端终于支持私信功能

Meta 正在测试 Threads 网页端的私信(DM)功能,用户将能够通过网页版查看收件箱并发送消息,该功能预计将很快向更多用户开放。

Read more →


Live updates from Elon Musk and Sam Altman’s court battle over the future of OpenAI

Elon Musk 与 Sam Altman 关于 OpenAI 未来的法庭之战实时更新

Elon Musk 与 Sam Altman 之间的诉讼案正在进行中。Musk 指控 OpenAI 偏离了造福人类的初衷,转而追求利润。该审判可能对 OpenAI 的未来产生深远影响。

Read more →


OpenAI claims ChatGPT’s new default model hallucinates way less

OpenAI 声称 ChatGPT 的新默认模型幻觉大幅减少

OpenAI 表示,其最新的 GPT-5.5 Instant 模型在内部评估中幻觉率降低了 52.5%,在事实准确性方面取得了显著进步。

Read more →


Book publishers sue Meta over AI’s ‘word-for-word’ copying

图书出版商因 AI 的“逐字复制”起诉 Meta

包括 Macmillan 和 McGraw Hill 在内的五家出版商对 Meta 提起集体诉讼,指控其在训练 Llama 模型时大规模侵犯版权,存在“逐字复制”行为。

Read more →


Microsoft’s new Xbox shake-up is all about platform changes

微软 Xbox 的新重组旨在推动平台变革

Xbox 新任 CEO Asha Sharma 正在对 Xbox 平台团队进行大规模重组,重点在于优化控制台功能、调整 Game Pass 价格,并整合微软内部的 AI 资源。

Read more →


From Alan Shepard to Artemis, celebrating 65 years of Americans in space

从 Alan Shepard 到 Artemis,庆祝美国人进入太空 65 周年

本文回顾了自 1961 年 Alan Shepard 成为首位进入太空的美国宇航员以来的 65 年历程,展望了 Artemis 计划的未来。

Read more →


Ars Technica

Widely used Daemon Tools disk app backdoored in monthlong supply-chain attack

广泛使用的 Daemon Tools 磁盘应用在长达一个月的供应链攻击中被植入后门

Daemon Tools 用户需立即检查设备。该软件近期遭受了供应链攻击,攻击者在安装包中植入了后门,可能导致用户设备被感染。

Read more →


RFK Jr. plans to curb antidepressants, which he falsely compares to heroin

RFK Jr. 计划限制抗抑郁药,并将其错误地比作海洛因

RFK Jr. 持续散布关于 SSRI 类抗抑郁药的虚假信息,并计划在政策上对其进行限制,引发了医学界的强烈批评。

Read more →


Google Home gets upgraded Gemini voice assistant and new camera controls

Google Home 获得升级版 Gemini 语音助手和新的摄像头控制功能

Google 智能家居生态系统迎来了自 2025 年以来的最大更新,增强了 Gemini 语音助手的交互能力,并增加了更精细的摄像头控制选项。

Read more →


Trump SEC lets Musk settle $150 million Twitter lawsuit for $1.5 million

特朗普政府时期的 SEC 允许 Musk 以 150 万美元和解 1.5 亿美元的 Twitter 诉讼

SEC 指控 Musk 的延迟披露行为导致 Twitter 投资者损失了 1.5 亿美元,但最终仅以 150 万美元的和解金结案,引发了关于监管公正性的讨论。

Read more →


How do you design a $30,000 electric pickup? Inside Ford’s skunkworks.

如何设计一款 3 万美元的电动皮卡?走进福特的秘密研发中心

本文带读者参观了福特位于加州的秘密电动汽车研发中心,揭秘了其如何通过创新设计降低电动皮卡的生产成本。

Read more →


Charlize Theron is a bewitching Circe in Odyssey trailer

Charlize Theron 在《奥德赛》预告片中饰演迷人的喀耳刻

Charlize Theron 在即将上映的《奥德赛》预告片中饰演喀耳刻,展现了其迷人的演技。

Read more →


Musk’s Europe gamble: Will others follow the Dutch and approve FSD?

Musk 的欧洲赌注:其他国家会效仿荷兰批准 FSD 吗?

荷兰道路管理局正在推动其他欧盟监管机构批准特斯拉的 FSD(全自动驾驶)系统,这是 Musk 在欧洲市场的重要布局。

Read more →


DHS abuses 1930s customs law in attempt to get data on Canadian from Google

国土安全部滥用 1930 年代海关法,试图从谷歌获取加拿大公民数据

国土安全部被指滥用过时的海关法律,试图获取一名批评 ICE 的加拿大公民的个人数据,引发了隐私保护争议。

Read more →


Why Reddit blocked my daily visit to its mobile website

为什么 Reddit 阻止了我每天访问其移动网站

Reddit 正在通过各种手段强制用户使用其移动应用,导致许多习惯通过浏览器访问的用户受到限制。

Read more →


“Notepad++ for Mac” release is disavowed by the creator of the original

“Notepad++ for Mac”版本被原作者否认

Notepad++ 原作者明确表示,该软件从未发布过 macOS 版本,市面上所谓的“Notepad++ for Mac”均为未经授权的仿制品。

Read more →


Product Hunt

Velo 2.0

Velo 2.0

Velo 2.0 是一款可以将语音和屏幕录制瞬间转化为可分享视频的工具,旨在提升内容创作效率。

Read more →


Kilo Code v7 for VS Code

Kilo Code v7 for VS Code

Kilo Code v7 是一款专为 VS Code 设计的插件,支持并行代理、差异审查及多模型对比功能,助力开发者提升编码效率。

Read more →


Flowstep 1.0

Flowstep 1.0

Flowstep 1.0 是一款 AI 设计工程师工具,能够将用户的想法直接转化为可编辑的 UI 界面。

Read more →


Blaze

Blaze

Blaze 是一款 AI 驱动的日历应用,能够自动为你规划每日行程,优化时间管理。

Read more →


Breathwrk

Breathwrk

Breathwrk 是一款提供引导式呼吸练习的应用,旨在帮助用户掌握呼吸技巧,缓解压力。

Read more →


Tollecode

Tollecode

Tollecode 是一款本地 AI 编码助手,允许开发者将任务委派给 AI 代理,实现更高效的开发流程。

Read more →


PanicMode

PanicMode

PanicMode 是一款隐私保护工具,支持通过快捷键一键隐藏屏幕内容,保护公共场合的隐私。

Read more →


Unity AI

Unity AI

Unity AI 将 AI 代理直接集成到 Unity 工作流中,助力游戏开发者实现自动化开发。

Read more →


Agentic API Grader by SaaStr.ai

SaaStr.ai 的 Agentic API Grader

该工具旨在评估 AI 代理作为 B2B 客户的表现,帮助企业优化其 AI 交互体验。

Read more →


Ghostwriter

Ghostwriter

Ghostwriter 是一款社交媒体内容创作工具,支持在 LinkedIn 和 X 上自动撰写并发布帖子。

Read more →


MIT Technology Review

The Download: inside the Musk v. Altman trial, and AI for democracy

The Download:Musk 与 Altman 审判内幕及 AI 与民主

本期简报重点报道了 Musk 与 Altman 的法庭对决,并探讨了 AI 在加强民主制度中的潜在作用。

Read more →


A blueprint for using AI to strengthen democracy

利用 AI 加强民主的蓝图

本文探讨了信息传播方式的变革如何重塑社会治理,并提出了利用 AI 技术增强民主参与和透明度的蓝图。

Read more →


Week one of the Musk v. Altman trial: What it was like in the room

Musk 与 Altman 审判第一周:法庭现场实录

本文详细记录了 Musk 与 Altman 审判第一周的现场情况,Musk 指控 OpenAI 违背初衷,双方在法庭上展开了激烈交锋。

Read more →


Tailoring AI solutions for health care needs

为医疗需求量身定制 AI 解决方案

AI 在医疗领域的应用前景广阔,但面临诸多挑战。本文探讨了如何针对医疗行业的特殊需求,开发更具针对性的 AI 解决方案。

Read more →


Musk v. Altman week 1: Elon Musk says he was duped, warns AI could kill us all, and admits that xAI distills OpenAI’s models

Musk 与 Altman 审判第一周:Musk 声称被骗,警告 AI 可能毁灭人类,并承认 xAI 蒸馏了 OpenAI 的模型

在审判第一周,Musk 坚称自己被 Altman 和 Brockman 欺骗,并警告 AI 存在毁灭人类的风险,同时承认 xAI 使用了 OpenAI 的模型进行蒸馏。

Read more →


Cyber-Insecurity in the AI Era

AI 时代的网络不安全

AI 的普及扩大了攻击面,使得传统的安全防御手段难以应对。本文探讨了为何必须以 AI 为核心重构网络安全体系。

Read more →


Operationalizing AI for Scale and Sovereignty

AI 的规模化与主权化运营

企业正在通过掌控数据来定制 AI,以平衡数据所有权与高质量数据的流动,实现 AI 的规模化与可持续发展。

Read more →


The Download: a new Christian phone network, and debugging LLMs

The Download:新的基督教手机网络与 LLM 调试

本期简报介绍了旨在屏蔽色情内容的基督教手机网络,并探讨了 LLM 调试的技术挑战。

Read more →


Inexpensive seafloor-hopping submersibles could stoke deep-sea science—and mining

低成本海底跳跃潜水器可能推动深海科学与采矿

NOAA 正在利用新型潜水器探索太平洋海底,寻找关键矿产资源,这既推动了深海科学研究,也引发了采矿争议。

Read more →


Trump’s mass firing just dealt another blow to American science

特朗普的大规模解雇再次打击了美国科学界

美国国家科学基金会(NSF)的 22 名董事会成员被集体解雇,这对美国科学研究造成了严重打击。

Read more →


Hmbown / DeepSeek-TUI

Hmbown / DeepSeek-TUI

DeepSeek 模型的终端编码代理,支持在命令行中直接与模型交互。

Read more →


ruvnet / ruflo

ruvnet / ruflo

Claude 的领先代理编排平台,支持部署智能多代理集群,协调自主工作流。

Read more →


virattt / dexter

virattt / dexter

用于深度金融研究的自主 AI 代理。

Read more →


docusealco / docuseal

docusealco / docuseal

开源的 DocuSign 替代方案,支持创建、填写和签署数字文档。

Read more →


bwya77 / vscode-dark-islands

bwya77 / vscode-dark-islands

基于 easemate IDE 和 Jetbrains islands 主题的 VSCode 主题。

Read more →


mksglu / context-mode

mksglu / context-mode

AI 编码代理的上下文窗口优化工具,通过沙盒化工具输出,减少 98% 的上下文占用。

Read more →


cocoindex-io / cocoindex

cocoindex-io / cocoindex

用于长周期代理的增量引擎。

Read more →


msitarzewski / agency-agents

msitarzewski / agency-agents

一套完整的 AI 代理集合,涵盖从前端开发到社区运营的多种专家角色。

Read more →


jwasham / coding-interview-university

jwasham / coding-interview-university

一份完整的计算机科学学习计划,旨在帮助开发者通过面试。

Read more →


Arindam200 / awesome-ai-apps

Arindam200 / awesome-ai-apps

一个展示 RAG、代理、工作流等 AI 应用案例的项目集合。

Read more →


OpenAI Blog

GPT-5.5 Instant System Card

GPT-5.5 Instant 系统卡

OpenAI 发布了 GPT-5.5 Instant 的系统卡,详细说明了该模型的安全特性与评估结果。

Read more →


GPT-5.5 Instant: smarter, clearer, and more personalized

GPT-5.5 Instant:更智能、更清晰、更个性化

GPT-5.5 Instant 更新了 ChatGPT 的默认模型,提供了更准确的回答、更低的幻觉率以及更强的个性化控制。

Read more →


New ways to buy ChatGPT ads

购买 ChatGPT 广告的新方式

OpenAI 推出了自助广告管理器,支持 CPC 竞价和增强的衡量工具,旨在保护隐私的同时为企业提供广告投放渠道。

Read more →


OpenAI and PwC collaborate to reimagine the office of the CFO

OpenAI 与普华永道合作重塑 CFO 办公室

双方合作利用 AI 代理自动化财务工作流,提升预测能力,并实现 CFO 职能的现代化。

Read more →


How OpenAI delivers low-latency voice AI at scale

OpenAI 如何大规模提供低延迟语音 AI

OpenAI 重构了 WebRTC 堆栈,以实现实时语音 AI 的低延迟、全球规模化部署及流畅的对话交互。

Read more →


Introducing Advanced Account Security

引入高级账户安全功能

OpenAI 推出了防钓鱼登录、更强的恢复机制及增强保护措施,以保障用户数据安全并防止账户被盗。

Read more →


Where the goblins came from

“哥布林”输出的来源

本文分析了 GPT-5 模型中出现“哥布林”式输出的原因、时间线及修复方案,探讨了模型个性化 quirks 的根源。

Read more →


Building the compute infrastructure for the Intelligence Age

构建智能时代的计算基础设施

OpenAI 正在扩展 Stargate 项目,以构建支撑 AGI 的计算基础设施,增加数据中心容量以满足日益增长的 AI 需求。

Read more →


Cybersecurity in the Intelligence Age

智能时代的网络安全

OpenAI 提出了五点行动计划,旨在加强智能时代的网络安全,重点在于普及 AI 驱动的网络防御并保护关键系统。

Read more →


OpenAI models, Codex, and Managed Agents come to AWS

OpenAI 模型、Codex 和托管代理登陆 AWS

OpenAI 的 GPT 模型、Codex 和托管代理现已在 AWS 上线,使企业能够在 AWS 环境中构建安全的 AI 应用。

Read more →


Anthropic Blog

Introducing Claude Opus 4.7

推出 Claude Opus 4.7

Claude Opus 4.7 在编码、代理、视觉及多步骤任务中表现更强,工作更加彻底且一致。

Read more →


Introducing Claude Design by Anthropic Labs

推出 Anthropic Labs 的 Claude Design

Claude Design 是一款新产品,允许用户与 Claude 协作创建视觉作品,如设计、原型、幻灯片等。

Read more →


Claude is a space to think

Claude 是一个思考的空间

Anthropic 承诺 Claude 将保持无广告,认为广告激励与 AI 助手的初衷不符,旨在维护用户信任。

Read more →


Agents for financial services

金融服务代理

Anthropic 介绍了专门为金融服务领域设计的 AI 代理解决方案。

Read more →


Building a new enterprise AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs

与 Blackstone、Hellman & Friedman 及高盛合作建立新的企业 AI 服务公司

Anthropic 宣布与多家金融巨头合作,共同建立一家新的企业 AI 服务公司。

Read more →


Claude for Creative Work

Claude 用于创意工作

Claude 在创意工作领域的应用介绍。

Read more →


Anthropic names Theo Hourmouzis General Manager of Australia & New Zealand and officially opens Sydney office

Anthropic 任命 Theo Hourmouzis 为澳大利亚及新西兰总经理,并正式开设悉尼办公室

Anthropic 进一步拓展亚太市场,任命新总经理并开设悉尼办公室。

Read more →


An update on our election safeguards

关于选举保障措施的更新

Anthropic 更新了其在选举期间的 AI 安全保障措施。

Read more →


Anthropic and NEC collaborate to build Japan’s largest AI engineering workforce

Anthropic 与 NEC 合作建立日本最大的 AI 工程人才队伍

双方合作旨在通过培训和技术支持,构建日本规模最大的 AI 工程人才库。

Read more →


Anthropic and Amazon expand collaboration for up to 5 gigawatts of new compute

Anthropic 与亚马逊扩大合作,新增高达 5 吉瓦的计算能力

双方进一步深化合作,亚马逊将为 Anthropic 提供高达 5 吉瓦的计算资源支持。

Read more →


Google AI Blog

Google is partnering with XPRIZE and Range Media Partners on the $3.5 million Future Vision film competition.

谷歌与 XPRIZE 及 Range Media Partners 合作举办 350 万美元的“未来愿景”电影竞赛

谷歌宣布与合作伙伴共同举办电影竞赛,旨在探索 AI 在电影创作中的应用。

Read more →


The latest AI news we announced in April 2026

2026 年 4 月谷歌 AI 最新动态汇总

汇总了谷歌在 4 月份发布的各项 AI 更新。

Read more →


Reduce friction and latency for long-running jobs with Webhooks in Gemini API

利用 Gemini API 中的 Webhooks 减少长任务的摩擦与延迟

事件驱动的 Webhooks 系统消除了低效的轮询,提升了长任务的处理效率。

Read more →


Celebrating 20 years of Google Translate: Fun facts, tips and new features to try

庆祝谷歌翻译 20 周年:趣闻、技巧与新功能

谷歌翻译迎来 20 周年,目前已支持近 250 种语言。

Read more →


Join the new AI Agents Vibe Coding Course from Google and Kaggle

加入谷歌与 Kaggle 的 AI 代理“Vibe Coding”课程

谷歌与 Kaggle 联合推出的 5 天 AI 代理强化课程现已开放注册。

Read more →


8 Gemini tips for organizing your space (and life)

8 个利用 Gemini 整理空间与生活的技巧

利用 AI 辅助制定清洁计划、整理收件箱及处理日常琐事。

Read more →


Here’s how our TPUs power increasingly demanding AI workloads.

谷歌 TPU 如何支撑日益增长的 AI 工作负载

通过视频展示了谷歌 TPU 在处理大规模 AI 任务中的核心作用。

Read more →


Elevating Austria: Google invests in its first data center in the Alps.

提升奥地利:谷歌在阿尔卑斯山投资建设首个数据中心

谷歌在奥地利 Kronstorf 建设首个数据中心,预计创造 100 个直接就业岗位。

Read more →


We’re launching two specialized TPUs for the agentic era.

谷歌推出两款专为代理时代设计的 TPU

第八代 TPU 包含两款专用芯片,旨在支撑未来的 AI 代理应用。

Read more →


3 new ways Ads Advisor is making Google Ads safer and faster

Ads Advisor 让谷歌广告更安全、更快捷的 3 种新方式

集成了代理安全与策略功能,旨在保护并简化广告账户管理。

Read more →


Hugging Face Blog

Granite 4.1 LLMs: How They’re Built

Granite 4.1 LLM:构建方式解析

Read more →


DeepInfra on Hugging Face Inference Providers 🔥

DeepInfra 登陆 Hugging Face 推理提供商

Read more →


Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

推出 NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频代理的长上下文多模态智能

Read more →


How to build scalable web apps with OpenAI’s Privacy Filter

如何利用 OpenAI 的隐私过滤器构建可扩展的 Web 应用

Read more →


DeepSeek-V4: a million-token context that agents can actually use

DeepSeek-V4:代理真正可用的百万 Token 上下文

Read more →


How to Use Transformers.js in a Chrome Extension

如何在 Chrome 扩展中使用 Transformers.js

Read more →


QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard

QIMMA:首个质量优先的阿拉伯语 LLM 排行榜

Read more →


AI and the Future of Cybersecurity: Why Openness Matters

AI 与网络安全的未来:为何开放性至关重要

Read more →


Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

Ecom-RLVE:面向电商对话代理的自适应可验证环境

Read more →


The PR you would have opened yourself

你本该自己提交的 PR

Read more →


The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

正交性之后:美德伦理代理与 AI 对齐

本文探讨了理性 AI 不应仅有“目标”,而应将行动与实践网络对齐,提出了基于美德伦理的 AI 对齐新视角。

Read more →


AGI Is Not Multimodal

AGI 不是多模态的

本文认为,将语言作为思维模型会导致我们忽视人类智能中具身理解的重要性,质疑了当前多模态 AI 即 AGI 的观点。

Read more →


Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

形状、对称性与结构:数学在机器学习研究中角色的转变

探讨了机器学习研究从数学驱动向计算密集型工程驱动的范式转移。

Read more →


What’s Missing From LLM Chatbots: A Sense of Purpose

LLM 聊天机器人缺失了什么:目的感

尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升,文章探讨了 AI 缺失的“目的感”。

Read more →


We Need Positive Visions for AI Grounded in Wellbeing

我们需要基于福祉的 AI 正面愿景

呼吁构建以人类福祉为核心的 AI 发展愿景,而非仅仅关注技术指标。

Read more →


Financial Market Applications of LLMs

LLM 在金融市场的应用

探讨了 LLM 在金融序列建模中的应用及其带来的变革。

Read more →


A Brief Overview of Gender Bias in AI

AI 中性别偏见的简要概述

讨论了 AI 系统中存在的性别偏见问题及其影响。

Read more →


Mamba Explained

Mamba 原理解析

介绍了 Mamba 模型,一种基于状态空间模型(SSM)的 Transformer 替代方案,旨在解决长序列处理效率问题。

Read more →


Car-GPT: Could LLMs finally make self-driving cars happen?

Car-GPT:LLM 能否最终实现自动驾驶?

探讨了 LLM 在自动驾驶中的应用潜力及面临的挑战。

Read more →


Do text embeddings perfectly encode text?

文本嵌入能完美编码文本吗?

介绍了 Vec2text 工具,该工具能将嵌入还原为文本,强调了嵌入数据安全协议的紧迫性。

Read more →


arXiv CS.AI

TADI: Tool-Augmented Drilling Intelligence via Agentic LLM Orchestration over Heterogeneous Wellsite Data

TADI:基于代理 LLM 编排异构井场数据的工具增强钻井智能

TADI 系统通过集成钻井报告和实时数据,将钻井运营数据转化为证据驱动的分析智能。

Read more →


AgentReputation: A Decentralized Agentic AI Reputation Framework

AgentReputation:去中心化代理 AI 声誉框架

针对去中心化 AI 市场,提出了一个解决现有声誉机制失效问题的框架。

Read more →


Minimal, Local, Causal Explanations for Jailbreak Success in Large Language Models

大语言模型越狱成功的最小、局部、因果解释

研究了 LLM 易受越狱攻击的原因,旨在为未来更自主的 frontier 模型提供安全保障。

Read more →


Are Tools All We Need? Unveiling the Tool-Use Tax in LLM Agents

工具是我们所需要的一切吗?揭示 LLM 代理中的工具使用税

研究表明,在存在语义干扰的情况下,工具增强推理并不总是能提升性能,存在“工具使用税”。

Read more →


TUR-DPO: Topology- and Uncertainty-Aware Direct Preference Optimization

TUR-DPO:拓扑与不确定性感知直接偏好优化

提出了一种改进的 DPO 算法,通过考虑偏好的拓扑结构和不确定性,提升模型对齐效果。

Read more →


ARMOR 2025: A Military-Aligned Benchmark for Evaluating Large Language Model Safety Beyond Civilian Contexts

ARMOR 2025:评估民用场景之外 LLM 安全性的军事对齐基准

针对国防应用,提出了一个评估 LLM 在军事决策支持中安全性的基准。

Read more →


Causal Foundations of Collective Agency

集体代理的因果基础

探讨了多个简单代理如何意外形成具有独立目标的集体代理,这对 AI 安全至关重要。

Read more →


Agentic AI for Trip Planning Optimization Application

面向行程规划优化应用的代理 AI

针对智能车辆的行程规划,提出了基于代理的优化方案,综合考虑时间、能耗和交通状况。

Read more →


arXiv CS.CL

H-Probes: Extracting Hierarchical Structures From Latent Representations of Language Models

H-Probes:从语言模型的潜在表示中提取层次结构

研究了 LLM 如何在几何空间中表示层次结构,这是推理的基础。

Read more →


DIAGRAMS: A Review Framework for Reasoning-Level Attribution in Diagram QA

DIAGRAMS:图表问答中推理级归因的审查框架

提出了一个框架,将图表问答与视觉区域关联,以实现更准确的推理归因。

Read more →


Model Organisms Are Leaky: Perplexity Differencing Often Reveals Finetuning Objectives

模型生物是泄露的:困惑度差异通常揭示微调目标

研究发现,通过困惑度差异可以识别模型微调的目标,这对受控实验中的模型安全性评估具有重要意义。

Read more →


Can AI Debias the News? LLM Interventions Improve Cross-Partisan Receptivity but LLMs Overestimate Their Own Effectiveness

AI 能消除新闻偏见吗?LLM 干预提高了跨党派接受度,但 LLM 高估了自身效果

实验表明,LLM 生成的去偏见内容能改善读者的跨党派信任,但 LLM 对其自身效果存在过度自信。

Read more →


CLEAR: Revealing How Noise and Ambiguity Degrade Reliability in LLMs for Medicine

CLEAR:揭示噪声和歧义如何降低医学 LLM 的可靠性

引入了 CLEAR 框架,评估了现实世界医学查询中的歧义对 LLM 可靠性的影响。

Read more →


Psychologically Potent, Computationally Invisible: LLMs Generate Social-Comparison Triggers They Fail to Detect

心理上有效,计算上不可见:LLM 生成了其无法检测的社会比较触发器

引入了 XHS-SCoRE 基准,用于检测文本内容是否会引发读者的社会比较心理。

Read more →


A Theoretical Game of Attacks via Compositional Skills

通过组合技能进行的理论攻击博弈

研究了通过组合技能绕过对齐防御的对抗性攻击方法。

Read more →


Compared to What? Baselines and Metrics for Counterfactual Prompting

相比于什么?反事实提示的基线与指标

指出在没有考虑基线含义的情况下,无法将观察到的效果归因于特定因素。

Read more →


WIRED

Telehealth Abortion Is Still Possible Without Mifepristone

没有米非司酮,远程医疗堕胎仍然可行

尽管法院限制了米非司酮的使用,但远程医疗提供商已制定了备用方案。

Read more →


The Italian Dubbing of ‘The Devil Wears Prada 2’ Has Stirred Up a Surprising Controversy

《穿普拉达的女王 2》意大利语配音引发争议

原版配音演员回归续集,但并非所有粉丝都对此感到满意。

Read more →


Pornhub Restores Access for UK Adults Who Use Apple’s Age Verification

Pornhub 恢复了使用苹果年龄验证的英国成年人的访问权限

Pornhub 认为基于设备的年龄验证比第三方网站更安全。

Read more →


Bose Brings Back Its ‘Lifestyle’ Branding With New Speakers for the Home

Bose 推出新款家用音箱,重拾“Lifestyle”品牌

新款 Lifestyle Ultra 系列音箱采用了更温馨的设计风格。

Read more →


Google DeepMind Workers Vote to Unionize Over Military AI Deals

Google DeepMind 员工投票成立工会,抗议军事 AI 合同

英国员工希望通过工会阻止公司 AI 模型在军事场景中的应用。

Read more →


Murena /e/OS Tablet Review: Privacy for a Price

Murena /e/OS 平板电脑评测:为隐私付费

Murena 推出的无 Google 平板电脑提供了极佳的隐私保护,但价格不菲。

Read more →


The iPhone That Never Was

那部从未问世的 iPhone

1990 年,三名前苹果员工开发了一款类似 iPhone 的设备,但最终未能上市。

Read more →


9 Best Portable Power Stations (2026): Power Capacity, Portability, Camping, and More

2026 年 9 款最佳便携式电源站:容量、便携性、露营等

WIRED 测试了多款便携式电源,为离网生活和应急供电提供参考。

Read more →


Best Gifts for Mom (2026): E-Readers, Digital Wall Calendar, Smart Bird Feeders

2026 年母亲节最佳礼物:电子阅读器、数字挂历、智能喂鸟器

WIRED 编辑推荐的母亲节礼物清单。

Read more →


The Secret to Amelia Dimoldenberg’s Online Superstardom? Control

Amelia Dimoldenberg 在线超级巨星的秘密?控制

《Chicken Shop Date》主持人谈论了如何通过控制内容质量和拒绝糟糕的交易来获得成功。

Read more →


Lobsters

Why didn’t IPv6 work in my home network?

为什么 IPv6 在我的家庭网络中无法工作?

Read more →


A bidirectional typechecking puzzle

一个双向类型检查难题

Read more →


RSS Feeds Send Me More Traffic Than Google

RSS 订阅带来的流量比谷歌更多

Read more →


A Caddy Cert Expired Because systemd-resolved Was Selectively Broken

Caddy 证书过期,因为 systemd-resolved 出现了选择性故障

Read more →


Bun (the js runtime) is being vibe-ported from zig to rust

Bun(JS 运行时)正在从 Zig 移植到 Rust

Read more →


claude code is not making your product better

Claude Code 并未让你的产品变得更好

Read more →


Podman rootless containers and the Copy Fail exploit

Podman 无根容器与 Copy Fail 漏洞

Read more →


Security Advisory: Local privilege escalation in Lix and Nix

安全公告:Lix 和 Nix 中的本地权限提升漏洞

Read more →


Tokens and Dreams

Token 与梦想

Read more →


DEV Community

6 New Moats for AI Agent Infrastructure — Trust Score, Deployment, SLA, Identity, Compliance-as-Code

AI 代理基础设施的 6 条新护城河——信任评分、部署、SLA、身份、合规即代码

作者提出了 6 个协议,旨在填补 AI 代理基础设施的空白,并提供了 Python 参考实现。

Read more →


Lithos UI: The Neo-Brutalist React Library (100% Free & Open Source)

Lithos UI:新野兽派 React 组件库(100% 免费开源)

Lithos UI 是一款生产就绪的 React 组件库,强调高对比度布局和工程精度,完全避免使用 CSS gap 属性。

Read more →


Health checks are integral to website maintenance programmes

健康检查是网站维护计划中不可或缺的一部分

强调了维护工作对代理机构和开发团队的重要性,避免因忽视维护而导致收入损失和声誉受损。

Read more →


I cut my AWS bill by 93% by ditching Fargate for a single Lightsail VM

我弃用 Fargate 转投单台 Lightsail VM,AWS 账单削减了 93%

开发者分享了如何通过迁移架构,在保持原有技术栈的情况下大幅降低云服务成本。

Read more →


There will still be art in software

软件中依然会有艺术

探讨了 AI 工具普及后,软件开发中艺术性的保留与演变。

Read more →


Exit Code 2: How Claude Hooks Turn Agentic Rules Into Runtime Barriers

退出代码 2:Claude Hooks 如何将代理规则转化为运行时障碍

深入探讨了 AI 治理栈中代码层面的实现,如何确保系统的可信度。

Read more →


We measured how much time our team wasted on flaky tests. The numbers were ugly

我们测量了团队在不稳定测试上浪费的时间,结果令人震惊

通过数据量化了不稳定测试对 CI 效率的损害,呼吁团队重视测试质量。

Read more →


New CVEs in Ollama & DAEMON Tools; Webhooks Lack Signature Checks

Ollama 和 DAEMON Tools 出现新 CVE;Webhooks 缺乏签名检查

本周安全要点汇总,包括 Ollama 的内存泄漏漏洞及 DAEMON Tools 的供应链攻击。

Read more →


Gen AI Tech Stack Demand, Copilot Workflow, & Claude-Powered Automation

生成式 AI 技术栈需求、Copilot 工作流与 Claude 驱动的自动化

汇总了当前 AI 框架的市场需求及 Claude 代码输出在物理指示器中的应用。

Read more →


SQLite CLI Prompts, PostgreSQL Load Balancing with pgkeeper, PgBouncer Tuning

SQLite CLI 提示符、pgkeeper 实现 PostgreSQL 负载均衡与 PgBouncer 调优

分享了 SQLite CLI 自定义、Figma 的 pgkeeper 服务及 PgBouncer 优化策略。

Read more →


Meta Engineering

How Meta Is Strengthening End-to-End Encrypted Backups

Meta 如何加强端到端加密备份

介绍了基于 HSM 的备份密钥库,确保 WhatsApp 和 Messenger 的备份历史记录安全。

Read more →


Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

现代化 Facebook 群组搜索,释放社区知识的力量

通过混合检索架构和自动化模型评估,提升了群组内容的搜索与发现体验。

Read more →


Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

Meta 的容量效率:统一 AI 代理如何优化超大规模性能

利用 AI 代理平台自动化发现并修复基础设施性能问题,节省电力并释放工程师时间。

Read more →


Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

Meta 的后量子密码迁移:框架、经验与启示

分享了 Meta 在后量子密码迁移中的经验,提出了迁移级别概念以管理复杂性。

Read more →


Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases

逃离分支陷阱:Meta 如何在 50 多个用例中现代化 WebRTC

分享了 Meta 如何通过构建自动化工具,解决内部 WebRTC 分支与上游脱节的问题。

Read more →


Trust But Canary: Configuration Safety at Scale

信任但要金丝雀:大规模配置安全

探讨了 Meta 如何通过金丝雀发布和渐进式部署,确保配置变更的安全性。

Read more →


How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

Meta 如何利用 AI 映射大规模数据流水线中的部落知识

通过 AI 代理分析代码库,解决了 AI 助手在处理复杂数据流水线时效率低下的问题。

Read more →


KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

KernelEvolve:Meta 的排名工程师代理如何优化 AI 基础设施

介绍了排名工程师代理的 ML 探索能力,以及如何优化广告排名模型。

Read more →


Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta 自适应排名模型:弯曲推理缩放曲线以服务广告 LLM 规模模型

Meta 正在将广告推荐模型扩展至 LLM 规模,以实现对用户更深层的理解。

Read more →


DeepMind Blog

Enabling a new model for healthcare

生成二维码中...

请点击右上角 ···

选择 发送给朋友收藏