2026-05-27
今日要点
- AI 代理生态爆发与争议:从 Anthropic 的 Cowork 到 Google 的 Antigravity 2.0,AI 代理正从代码辅助向自主工作流演进,但关于其成本、可靠性及“AI 幻觉”的讨论愈发激烈。
- 监管与地缘政治博弈:荷兰政府出于公共利益考虑阻止美国公司收购关键数字身份供应商;西班牙封禁 Polymarket 等预测市场;美国政府则在核能与连接汽车领域展现出不同的监管态度。
- 科技巨头动态:Dropbox CEO Drew Houston 宣布离职;Google I/O 后的 AI 搜索转型引发用户反弹,导致 DuckDuckGo 安装量激增;SpaceX 持续扩张,Starlink 拿下美国航空大单。
- 学术与前沿研究:AI 在数学领域取得突破,成功推翻离散几何中的 80 年前猜想;同时,关于 AI 代理的可靠性、置信度校准及“人类在环”(HITL)的重要性成为研究热点。
Hacker News
Spain blocks prediction markets Polymarket, Kalshi over lack of gambling licence
西班牙因缺乏赌博牌照封禁 Polymarket 和 Kalshi 预测市场
西班牙监管机构已正式封禁 Polymarket 和 Kalshi 等预测市场平台。当局指出,这些平台在未获得必要赌博牌照的情况下运营,违反了当地法律。此举反映了欧洲各国对去中心化及新兴金融预测工具监管力度的加强。
GitHub Actions was down
GitHub Actions 服务中断
GitHub Actions 在今日出现服务中断,导致开发者无法正常触发自动化工作流。用户在尝试获取 OTP 验证码或连接 Webhook 时遇到困难,GitHub 官方已针对不同区域(如澳大利亚、欧盟)的 Enterprise Cloud 状态进行排查。
Netherlands blocks US takeover of vital digital supplier
荷兰阻止美国公司收购关键数字供应商
荷兰政府正式阻止了一家美国公司对该国关键 IT 供应商 Solvinity 的收购。Solvinity 负责运营荷兰公民数字身份认证系统(DigiD),该系统广泛应用于医疗预约、购房等公共服务。荷兰政府此举旨在减少对美国技术的依赖,保护国家数字基础设施安全。
Motorola phones have started hijacking the Amazon app to insert affiliate codes
摩托罗拉手机被曝劫持亚马逊应用植入推广代码
摩托罗拉手机近期被发现存在恶意行为,其系统软件会劫持用户手机中的亚马逊应用,并自动植入推广代码(Affiliate Codes)。即使是售价高达 1900 美元的 Razr Fold 折叠屏手机也未能幸免。这种做法引发了用户对隐私和设备完整性的严重担忧。
DynIP – Dynamic DNS with RFC 2136, IPv6, DNSSEC, and BYOD
DynIP:支持 RFC 2136、IPv6、DNSSEC 和 BYOD 的动态 DNS 服务
DynIP 是一款面向家庭实验室、边缘路由器和基础设施团队的动态 DNS 服务。其核心优势在于极高的更新速度,能在 60 秒内完成全球解析传播,远超传统 DDNS 服务 30 分钟的缓存时间。该服务支持 RFC 2136 TSIG 协议,并允许用户自带域名。
Dropbox CEO Drew Houston to step down
Dropbox CEO Drew Houston 宣布离职
Dropbox 首席执行官 Drew Houston 正式宣布将卸任 CEO 一职。作为 Dropbox 的联合创始人,Houston 在过去多年中带领公司从简单的云存储服务转型为协作平台。目前公司已发布领导层更新公告,后续接任者及公司战略方向备受关注。
The user is visibly frustrated
用户表现出明显的挫败感
本文探讨了为何当前的 AI 编码代理(Coding Agents)会令用户感到沮丧。作者认为,问题在于其对话式用户体验(UX):AI 表现得像一个乐于助人的同事,触发了人类的社交本能,但它们缺乏人类的责任感和学习适应能力,导致重复犯错时用户体验极差。
Uber, Lyft drivers in Massachusetts form first US ride-share union
马萨诸塞州 Uber 和 Lyft 司机成立美国首个网约车工会
马萨诸塞州的 Uber 和 Lyft 司机正式成立了美国首个网约车工会。这一历史性举措标志着零工经济从业者在争取劳动权益、薪资保障和工作条件改善方面迈出了重要一步,可能对全美范围内的网约车行业监管产生深远影响。
Uber president says AI spending is getting ‘harder to justify’
Uber 总裁称 AI 投入正变得“难以证明其合理性”
Uber 总裁在近期发言中表示,公司在 AI 领域的巨额支出正面临越来越大的压力。他指出,目前 AI 的实际使用效果与生产力提升之间缺乏明确的因果联系,这使得继续维持高额的 AI 研发投入变得愈发困难。
The real cost of owning a home
拥有住房的真实成本
本文反驳了“租房就是浪费钱”的传统观念。作者详细分析了购房过程中被忽视的隐形成本,包括维护费、税收、保险及机会成本等。对于那些考虑购房的人来说,理解这些财务细节对于做出明智的决策至关重要。
Outsourcing plus local AI will soon become more economical vs. frontier labs
外包加本地 AI 将比前沿实验室模型更具经济效益
文章分析指出,随着本地 AI 模型性能的提升,企业未来将更倾向于采用“外包+本地 AI”的模式,而非依赖昂贵的前沿实验室模型。这种组合在成本控制和定制化需求方面展现出更强的竞争力,预示着 AI 部署模式的转变。
Does anybody like React?
有人喜欢 React 吗?
作者对 React 在现代 Web 开发中的统治地位提出了质疑。文章认为,React 往往被当作解决所有问题的“锤子”,导致项目过度复杂化。对于中大型 JS 项目,作者建议开发者重新审视技术选型,避免盲目跟风。
Big tech’s anti-labor playbook has come for Wikipedia
大科技公司的反劳工策略已波及维基百科
文章指出,维基百科正面临来自大科技公司反劳工策略的压力。随着 AI 训练对数据的需求激增,维基百科作为核心数据源,其贡献者的权益和社区自治模式正受到资本逻辑的侵蚀。
Chemistry behind the Garden Grove chemical tank
花园林化学储罐背后的化学原理
本文深入探讨了花园林(Garden Grove)化学储罐事故背后的化学机制。作者通过科学视角分析了甲基丙烯酸甲酯(Methyl Methacrylate)的特性及其在极端条件下的反应,为理解此类工业安全事故提供了专业参考。
AWS Fired the One Employee Who Gave a Damn
AWS 解雇了唯一一个真正负责的员工
作者讲述了其 AWS 账户在 2025 年被无故删除后,一名名为 Tarus Balog 的员工如何通过不懈努力将其恢复的经历。然而,这名拥有 20 年开源经验的员工最终被 AWS 解雇,文章以此抨击了大型科技公司内部官僚主义对个体价值的漠视。
TechCrunch
UK Visa Portal spilled thousands of applicants’ passports and selfies online — and hasn’t fixed the leak
英国签证门户网站泄露数千名申请人的护照和自拍照,且尚未修复漏洞
英国签证申请流程中的第三方网站被曝存在严重安全漏洞,导致数千名申请人的护照和自拍照等敏感文件在线泄露。令人震惊的是,该公司在面对漏洞时并未积极修复,反而采取了法律手段应对质疑。
What we’re looking for in Startup Battlefield 2026, and how to apply in time for the May 27 deadline
2026 年创业战场(Startup Battlefield)申请指南及截止日期提醒
Startup Battlefield 2026 的申请即将于 5 月 27 日截止。本文详细介绍了评审团关注的重点领域,并为有意参赛的创业者提供了最后的申请建议,帮助他们完善提交材料。
Trump Admin permits Volvo to keep selling connected cars in the U.S.
特朗普政府允许沃尔沃继续在美国销售联网汽车
沃尔沃(多数股权由中国吉利控股)宣布,已获得美国政府许可,可以继续在美国销售联网汽车。这一决定使沃尔沃能够顺利推进其在美国工厂的扩张计划,缓解了此前关于数据安全和地缘政治的担忧。
Trump administration wants nuclear startups to use plutonium for their reactors
特朗普政府希望核能初创公司在反应堆中使用钚
美国政府目前持有大量武器级钚,政府正寻求通过核能初创公司将其转化为能源。这一政策旨在处理库存的同时,推动核能技术的创新应用。
DuckDuckGo installs are up 30% as users reject being ‘force-fed’ Google’s AI Search
DuckDuckGo 安装量激增 30%,用户拒绝被“强行喂食”谷歌 AI 搜索
在谷歌 I/O 2026 大会上,谷歌将搜索结果中的蓝色链接替换为 AI 代理,引发了广泛的负面反馈。用户对这种“强行喂食”的 AI 搜索感到不满,导致 DuckDuckGo 的应用安装量在短时间内激增了 30%。
Starship’s path to reusability looks murky after SpaceX’s S-1
SpaceX S-1 测试后,星舰的重复使用之路显得扑朔迷离
SpaceX 近期的 IPO 和星舰(Starship)火箭测试飞行提供了关键数据。分析认为,虽然星舰展现了潜力,但其实现完全重复使用的路径仍存在不确定性,这让支持者和批评者都感到复杂。
SpaceX’s Starlink nabs American Airlines contract, another win for its IPO
SpaceX Starlink 拿下美国航空合同,为其 IPO 再添胜绩
美国航空(American Airlines)宣布计划在超过 500 架空客飞机上安装 Starlink Wi-Fi。这是 SpaceX 在 IPO 前夕获得的又一重大商业合同,进一步巩固了其在航空互联网市场的地位。
OpenRouter more than doubles valuation to $1.3B in a year
OpenRouter 一年内估值翻倍至 13 亿美元
OpenRouter 完成了 1.13 亿美元的 B 轮融资,由 CapitalG 领投。过去六个月内,其使用量增长了 5 倍,显示出多 AI 模型协作的未来趋势已成现实。
This startup is betting India’s gig economy can train the world’s robots
这家初创公司押注印度零工经济来训练全球机器人
Human Archive 是一家由加州大学伯克利分校和斯坦福大学研究人员创立的初创公司。他们雇佣印度的零工工人佩戴摄像头和传感器设备,收集真实的物理训练数据,以供 AI 和机器人实验室使用。
Dutch government blocks US company from acquisition, citing ‘risk to public interest’
荷兰政府以“公共利益风险”为由阻止美国公司收购
荷兰政府阻止了一家美国公司对一家云服务商的收购,该云服务商托管了荷兰的数字身份服务。此举是欧洲减少对美国技术依赖的又一举措。
The Verge
NASA’s permanent Moon base plans start with three missions this year
NASA 的永久月球基地计划今年启动三项任务
NASA 宣布了针对月球南极地区的系列任务,旨在为 2028 年的载人登月做准备。今年将启动三项“月球基地”任务,这只是 NASA 计划中十余项任务的开端。
Google Health is here, but a lot of people want their Fitbit app back instead
Google Health 上线,但许多用户更想要回 Fitbit 应用
Fitbit 应用正式退役,被 Google Health 取代。随着新产品 Fitbit Air 的发布,用户对这一变动表现出困惑和不满,社交媒体上充斥着要求恢复旧版应用的呼声。
GE’s nugget ice maker is nearly half off if you buy it refurbished
GE 碎冰机翻新版半价优惠
Woot 正在促销翻新版的 GE Profile Opal 2.0 Ultra 碎冰机,售价仅为 264.99 美元,比原价便宜了 184 美元。优惠活动将持续至 6 月 3 日。
Sony’s sloppy Spider-Man universe gets even messier with Spider-Noir
索尼的蜘蛛侠宇宙因《蜘蛛侠:暗影》变得更加混乱
索尼在《蜘蛛侠:平行宇宙》取得成功后,试图进一步扩展其蜘蛛侠电影宇宙。然而,新项目《蜘蛛侠:暗影》(Spider-Noir)的加入让本已混乱的版权和叙事逻辑显得更加扑朔迷离。
The best Memorial Day sales you can still shop
依然可以参与的阵亡将士纪念日促销活动
尽管长周末已经结束,但许多阵亡将士纪念日的促销活动仍在继续。包括 MacBook Air 在内的多款电子产品和户外用品仍有大幅折扣。
American Airlines is getting Starlink Wi-Fi
美国航空将引入 Starlink Wi-Fi
美国航空计划在数百架飞机上安装 SpaceX 的 Starlink Wi-Fi 系统,旨在为乘客提供更高速、稳定的空中互联网体验。
Memory V re-creates the Memorymoog without the massive headaches or price tag
Memory V:无需高昂代价即可重现 Memorymoog 的经典音色
Arturia 推出的 Memory V 模拟器成功复刻了传奇合成器 Memorymoog 的音色,解决了原版设备昂贵且极易损坏的问题,让现代音乐人能轻松使用这一经典音色。
Saving for a Switch 2 is easier with Newegg’s gift card deal
Newegg 礼品卡优惠助力 Switch 2 攒钱计划
Newegg 推出 Nintendo 礼品卡优惠活动,用户可以以 170 美元的价格购买 200 美元的礼品卡额度,这对于计划购买 Switch 2 的玩家来说是一个不错的省钱机会。
Oppo’s Bubble is a thin round screen for taking rear camera selfies
Oppo Bubble:一款用于后置摄像头自拍的轻薄圆形屏幕配件
Oppo 发布了一款名为 Bubble 的智能手机配件。它是一个轻薄的圆形屏幕,可以安装在手机背面,让用户在自拍时能通过后置摄像头获得更好的画质,并实时预览构图。
Govee included a book on ‘white supremacy’ in its website imagery
Govee 在网站图片中植入了关于“白人至上主义”的书籍
智能家居品牌 Govee 被发现其产品宣传图中包含了一本关于“白人至上主义”的书籍。这一细节被细心的 Verge 读者发现,引发了关于品牌内容审核和背景道具选择的讨论。
Ars Technica
Is Peter Thiel the target of Pope Leo’s Gandalf quote? An investigation.
彼得·蒂尔是教皇利奥引用甘道夫名言的目标吗?一项调查。
教皇利奥在关于 AI 的通谕中引用了《指环王》中甘道夫的名言,引发了外界猜测。本文深入调查了这一引用是否暗指科技亿万富翁彼得·蒂尔(Peter Thiel)。
Musk says US military suicide drones used Starlink in violation of SpaceX rules
马斯克称美军自杀式无人机违规使用 Starlink
马斯克表示,美军的自杀式无人机在未经授权的情况下使用了 Starlink 服务,而非官方的 Starshield 系统。他将此归咎于军事承包商的违规操作。
NASA takes steps toward building Moon Base, including discussing a “perimeter”
NASA 采取措施建设月球基地,包括讨论“周边防线”
NASA 正在推进月球基地的建设规划,并开始讨论如何建立“周边防线”。NASA 强调,所有行动都将严格遵守《外层空间条约》。
We’re starting to see some PC makers respond to Apple’s MacBook Neo
我们开始看到 PC 制造商对苹果 MacBook Neo 的回应
随着苹果 MacBook Neo 的发布,PC 制造商开始推出竞品。虽然 600 美元以下的笔记本电脑市场一直存在,但要制造出真正高质量的产品依然困难。
Millions of AI agents imperiled by critical vulnerability in open source package
开源包中的严重漏洞威胁数百万 AI 代理
名为“BadHost”的漏洞被发现存在于 Starlette 包中,该包每周下载量高达 3.25 亿次,数百万 AI 代理因此面临安全风险。
Want an oxygen-rich atmosphere? Stuff oxygen’s friends in the mantle.
想要富氧大气?把氧气的朋友塞进地幔里。
研究表明,将碳和硫等元素封存在地球内部(地幔)可能是地球大气层富含氧气的原因之一。
FBI agent explains how easy it is to ID people posting AI porn without consent
FBI 特工解释识别未经同意发布 AI 色情内容的人有多容易
FBI 特工指出,通过社交媒体上的蛛丝马迹,识别并追踪那些未经同意发布 AI 色情内容的人员其实非常容易。
3D-printable humanoid legs let robotics experiments run wild
3D 打印人形腿让机器人实验更加自由
Hugging Face 推出了一个 2500 美元的双足机器人项目,旨在为研究人员和开发者提供可 3D 打印的人形腿组件,推动机器人实验的发展。
Windows’ classic 3D Space Cadet pinball is getting a physical re-creation
Windows 经典 3D 太空军校生弹球游戏将推出实体版
经典的 Windows 3D 太空军校生弹球游戏即将迎来实体化重制,但开发者面临着如何将虚拟物理约束转化为现实世界物理限制的挑战。
Review: The Boroughs is a smart, pitch-perfect creature feature
影评:《The Boroughs》是一部聪明且完美的生物惊悚片
《The Boroughs》凭借出色的演员阵容、精妙的剧本和引人入胜的超自然悬疑情节,成为了一部不可多得的生物惊悚佳作。
Product Hunt
Brew
Brew 是一款专为电子邮件营销设计的 AI 工具,旨在通过 Claude 的设计能力提升营销邮件的转化率。
Bond
Bond 是一款基于真实购买信号驱动的外呼营销工具,帮助企业更精准地触达潜在客户。
Willow Scribe
Willow Scribe 是一款语音转文字工具,用户只需口述内容,Scribe 即可自动完成后续的撰写工作。
Parsewise API
Parsewise API 是一款专为代理式多文档处理设计的 API,旨在简化复杂文档的解析流程。
DodoForm
DodoForm 能够将用户的口述、图片或草图转化为结构化的数据,极大简化了数据录入工作。
Kept
Kept 是一款本地 AI 聊天记录保存工具,所有聊天内容均以 Markdown 格式存储在本地,无需云端同步,保护隐私。
marpy.io
marpy.io 是一个专为 Python 技术栈构建的 AI 编码平台,旨在提升 Python 开发者的生产力。
DNSimple CLI
DNSimple CLI 允许用户通过命令行界面直接管理 DNS 设置,提升运维效率。
LikePulse
LikePulse 能够实时分析 YouTube 观众的反应,帮助创作者精准定位观众的兴趣点。
Ajar
Ajar 是一款 Mac 工具,支持 AI 代理的盖子角度同步和保持唤醒功能,确保 AI 任务不中断。
MIT Technology Review
Rethinking organizational design in the age of agentic AI
在代理式 AI 时代重新思考组织设计
尽管 85% 的组织希望在三年内实现“代理化”,但 76% 的组织承认其现有的基础设施和流程无法支持这一变革。文章指出,企业需要从人员、流程和技术三个维度进行深度重构,以适应 AI 代理带来的组织架构挑战。
The Download: puncturing the AI jobs panic
下载:戳破 AI 就业恐慌
尽管关于 AI 取代白领工作的恐慌不断,但目前尚无证据表明 AI 对就业市场产生了大规模的负面影响。本期简报对 AI 就业恐慌进行了现实核查。
A reality check on the AI jobs hysteria
AI 就业恐慌的现实核查
文章分析了科技行业近期裁员潮与 AI 之间的关系,指出 AI 并非导致大规模失业的直接原因。对于知识工作者而言,与其恐慌,不如关注 AI 如何改变工作方式。
It’s time to address the looming crisis in entry-level work.
是时候解决入门级工作面临的危机了
虽然 AI 尚未导致大规模失业,但它正在悄悄削弱入门级工作的价值。文章呼吁关注这一趋势,防止职场新人失去成长的第一级阶梯。
The Download: coding’s future, the ‘Steroid Olympics,’ and AI-driven science
下载:编码的未来、“类固醇奥运会”与 AI 驱动的科学
本期简报涵盖了 Anthropic 的 Code with Claude 活动、关于增强竞技运动(Enhanced Games)的讨论以及 AI 在科学发现中的应用。
Google I/O showed how the path for AI-driven science is shifting
谷歌 I/O 展示了 AI 驱动科学的路径转变
谷歌 DeepMind CEO Demis Hassabis 在 I/O 大会上表示,我们正处于奇点的前夜。文章分析了 AI 如何改变科学发现的范式。
The Enhanced Games fit right in with the rest of 2026’s longevity vibes
增强竞技运动(Enhanced Games)与 2026 年的“长寿氛围”不谋而合
首届增强竞技运动将在拉斯维加斯举行,参赛者被鼓励使用增强药物。文章探讨了这一争议性赛事背后的社会心理。
Roundtables: Can AI Learn to Understand the World?
圆桌会议:AI 能学会理解世界吗?
专家们探讨了 AI 如何超越 LLM 的局限,通过世界模型(World Models)真正理解外部世界。
Scaling creativity in the age of AI
在 AI 时代扩展创造力
文章探讨了技术如何始终贯穿于人类叙事和创造力的演变中,从早期的洞穴壁画到现代的 AI 生成内容。
Anthropic’s Code with Claude showed off coding’s future—whether you like it or not
Anthropic 的 Code with Claude 展示了编码的未来——无论你是否喜欢
Anthropic 在伦敦举办的开发者活动展示了 AI 编码的强大能力,引发了关于开发者未来角色的激烈讨论。
GitHub Trending
Lum1104 / Understand-Anything
该项目将代码转化为交互式知识图谱,支持 Claude Code、Cursor、Copilot 等多种工具,帮助开发者通过提问探索代码库。
affaan-m / ECC
ECC 是一个代理性能优化系统,专注于 AI 代理的技能、本能、记忆和安全,适用于 Claude Code、Cursor 等平台。
rohitg00 / ai-engineering-from-scratch
一个从零开始学习 AI 工程的教程项目,涵盖了构建和部署 AI 应用的全过程。
anthropics / knowledge-work-plugins
Anthropic 开源的插件库,主要供知识工作者在 Claude Cowork 中使用。
mukul975 / Anthropic-Cybersecurity-Skills
包含 754 个结构化网络安全技能的 AI 代理库,映射至 MITRE ATT&CK 等 5 大框架,适用于多种 AI 平台。
hardikpandya / stop-slop
一个用于移除 AI 生成文本中“AI 味”(AI tells)的技能文件,帮助提升文本的自然度。
Leonxlnx / taste-skill
Taste-Skill 旨在赋予 AI 更好的审美,防止其生成平庸、通用的内容。
DigitalPlatDev / FreeDomain
DigitalPlat 提供的免费域名服务,旨在让每个人都能拥有自己的域名。
jellyfin / jellyfin
开源媒体系统 Jellyfin 的服务端后端及 API 仓库。
Axorax / awesome-free-apps
精选的最佳免费 PC 和移动应用列表。
OpenAI Blog
OpenAI, Grupo Folha and Grupo UOL announce strategic content partnership
OpenAI 与 Grupo Folha 和 Grupo UOL 达成战略内容合作伙伴关系
OpenAI 与巴西媒体集团 Grupo Folha 和 Grupo UOL 达成合作,将可信的巴西新闻引入 ChatGPT,在确保透明度和归属权的前提下,扩大用户获取高质量新闻的渠道。
How Virgin Atlantic ships faster with Codex
维珍航空如何利用 Codex 加速交付
维珍航空利用 Codex 在紧迫的假日旅行截止日期前完成了移动应用的重构,实现了近乎 100% 的单元测试覆盖率,且未出现任何 P1 级缺陷。
OpenAI named a Leader in enterprise coding agents by Gartner
OpenAI 被 Gartner 评为企业级 AI 编码代理领导者
OpenAI 的 Codex 因其创新性和企业级部署能力,在 2026 年 Gartner 企业 AI 编码代理魔力象限中被评为领导者。
AdventHealth advances whole-person care with OpenAI
AdventHealth 利用 OpenAI 推进全人护理
AdventHealth 正在使用 ChatGPT for Healthcare 简化工作流程,减轻行政负担,从而将更多时间投入到患者护理中。
An OpenAI model has disproved a central conjecture in discrete geometry
OpenAI 模型推翻了离散几何中的一个核心猜想
OpenAI 的模型成功解决了 80 年前的“单位距离问题”,推翻了离散几何中的一个重大猜想,标志着 AI 驱动数学研究的里程碑。
How Ramp engineers accelerate code review with Codex
Ramp 工程师如何利用 Codex 加速代码审查
Ramp 工程师通过将 Codex 与 GPT-5.5 结合,将代码审查时间从数小时缩短至数分钟,显著提升了开发效率。
The next phase of OpenAI’s Education for Countries
OpenAI“国家教育计划”的下一阶段
OpenAI 正在扩大其教育计划,通过新的合作伙伴关系、教师培训和工具,改善全球学习成果。
Introducing OpenAI for Singapore
推出“OpenAI 新加坡计划”
OpenAI 启动了与新加坡的多年期 AI 合作伙伴关系,旨在通过部署 AI 技术、培养本地人才,支持新加坡的商业和公共服务。
Advancing content provenance for a safer, more transparent AI ecosystem
推进内容溯源,构建更安全、透明的 AI 生态系统
OpenAI 正在通过 Content Credentials、SynthID 和验证工具,帮助用户识别和信任 AI 生成的内容。
OpenAI and Dell partner to bring Codex to hybrid and on-premise enterprise environments
OpenAI 与戴尔合作,将 Codex 带入混合及本地企业环境
OpenAI 与戴尔达成合作,帮助企业在混合和本地环境中安全地部署 AI 编码代理,保护数据和工作流安全。
Anthropic Blog
Introducing Claude Opus 4.7
推出 Claude Opus 4.7
最新的 Opus 模型在编码、代理、视觉和多步任务处理方面表现更强,在关键工作任务中展现出更高的彻底性和一致性。
Introducing Claude Design by Anthropic Labs
推出 Anthropic Labs 的 Claude Design
Claude Design 是一款新产品,允许用户与 Claude 协作创建精美的视觉作品,如设计稿、原型、幻灯片和单页文档等。
Claude is a space to think
Claude 是一个思考的空间
Anthropic 承诺 Claude 将保持无广告状态,认为广告激励与真正有用的 AI 助手目标不兼容。
Anthropic appoints KiYoung Choi as Representative Director of Korea ahead of Seoul office opening
Anthropic 任命 KiYoung Choi 为韩国代表董事,筹备首尔办公室
Anthropic 正式任命 KiYoung Choi 为韩国代表董事,为即将开设的首尔办公室做准备。
Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas”
Anthropic 联合创始人 Chris Olah 对教皇利奥十四世通谕《Magnifica humanitas》的评论
Chris Olah 对教皇关于 AI 的通谕发表了看法,探讨了教会与 AI 发展的伦理交集。
Widening the conversation on frontier AI
扩大关于前沿 AI 的对话
Anthropic 致力于推动更广泛的社会对话,探讨前沿 AI 技术的影响与治理。
KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance
毕马威与 Anthropic 达成战略联盟,将 Claude 集成至其 27.6 万名员工的核心业务中
毕马威(KPMG)宣布将 Claude 集成到其全球业务中,赋能 27.6 万名员工。
Anthropic acquires Stainless
Anthropic 收购 Stainless
Anthropic 完成了对 Stainless 的收购,旨在增强其技术能力。
PwC is deploying Claude to build technology, execute deals, and reinvent enterprise functions for clients
普华永道部署 Claude 以构建技术、执行交易并重塑客户企业职能
普华永道(PwC)正在利用 Claude 提升其咨询和技术服务能力。
Anthropic forms $200 million partnership with the Gates Foundation
Anthropic 与盖茨基金会达成 2 亿美元合作伙伴关系
Anthropic 与盖茨基金会合作,共同投入 2 亿美元,利用 AI 解决全球性挑战。
Google AI Blog
Catch up on the Dialogues stage at Google I/O 2026.
回顾 Google I/O 2026 对话舞台
本期回顾了 I/O 大会上关于 AI、量子计算、机器人和创造力未来的深度讨论。
We’re announcing new community investments in Missouri.
宣布在密苏里州的新社区投资
谷歌宣布在密苏里州进行社区投资,旨在建设下一代劳动力并支持能源项目。
100 things we announced at I/O 2026
谷歌 I/O 2026 发布的 100 项公告
谷歌汇总了 I/O 大会上的所有重要公告、发布和演示。
A new experiment brings better group meetings to Google Beam
一项新实验为 Google Beam 带来更好的群组会议体验
Google Beam 引入了新的实验功能,通过逼真的音视频效果,让混合办公会议更具沉浸感。
I/O 2026
谷歌 I/O 2026
回顾谷歌 I/O 2026 大会,了解谷歌如何让 AI 变得更加实用。
How AI Mode is changing the way people search in the U.S.
AI 模式如何改变美国用户的搜索方式
AI 模式发布一年后,数据显示用户正从关键词搜索转向自然语言查询。
New ways to create and get things done in Google Workspace
Google Workspace 的新创作与办公方式
谷歌在 Gmail、Docs 和 Keep 中引入了语音功能,并发布了设计工具 Google Pics 和 AI Inbox 更新。
I/O 2026: Welcome to the agentic Gemini era
I/O 2026:欢迎进入代理式 Gemini 时代
Sundar Pichai 介绍了 Gemini 如何通过代理能力帮助用户更高效地完成任务。
Gemini 3.5: frontier intelligence with action
Gemini 3.5:具备行动力的前沿智能
Gemini 3.5 系列模型正式发布,结合了前沿智能与执行能力。
A new era for AI Search
AI 搜索的新时代
谷歌分享了将搜索引擎与 AI 结合的最新进展。
Hugging Face Blog
Harness, Scaffold, and the AI Agent Terms Worth Getting Right
代理、脚手架与 AI 代理术语的正确理解
文章澄清了 AI 代理领域中“Harness”和“Scaffold”等关键术语的定义,帮助开发者更准确地理解代理架构。
Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models
迈向光速文本生成:Nemotron-Labs 扩散语言模型
探讨了利用扩散语言模型实现极速文本生成的最新研究进展。
Specialization Beats Scale: A Strategic Variable Most AI Procurement Decisions Overlook
专业化胜过规模:AI 采购决策中常被忽视的战略变量
文章指出,在 AI 采购中,模型的专业化程度往往比单纯的规模更重要。
OlmoEarth v1.1: A more efficient family of Earth observation models
OlmoEarth v1.1:更高效的地球观测模型系列
发布了更高效的地球观测模型 OlmoEarth v1.1。
Introducing the Ettin Reranker Family
推出 Ettin 重排序模型系列
介绍了全新的 Ettin 重排序模型系列,旨在提升检索质量。
PaddleOCR 3.5: Running OCR and Document Parsing Tasks with a Transformers Backend
PaddleOCR 3.5:基于 Transformers 后端运行 OCR 和文档解析任务
PaddleOCR 3.5 现已支持 Transformers 后端,提升了 OCR 和文档解析的性能。
The Open Agent Leaderboard
开放代理排行榜
介绍了 Hugging Face 的开放代理排行榜,用于评估 AI 代理的性能。
Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality
Granite 多语言嵌入 R2:Apache 2.0 开源,支持 32K 上下文,百兆参数下最佳检索质量
发布了 Granite 多语言嵌入模型 R2,在百兆参数规模下实现了顶尖的检索质量。
Unlocking asynchronicity in continuous batching
解锁连续批处理中的异步性
探讨了如何通过异步处理提升连续批处理的效率。
Building Blocks for Foundation Model Training and Inference on AWS
AWS 上基础模型训练与推理的构建模块
介绍了在 AWS 上构建基础模型训练和推理环境的组件。
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
正交性之后:美德伦理代理与 AI 对齐
文章探讨了 AI 对齐的新视角,认为理性 AI 不应仅追求目标,而应基于美德伦理进行实践。
AGI Is Not Multimodal
AGI 不是多模态的
文章反驳了 AGI 必然是多模态的观点,强调了具身智能在理解世界中的核心作用。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
形状、对称性与结构:数学在机器学习研究中角色的转变
探讨了机器学习研究从数学驱动向工程驱动的范式转移。
What’s Missing From LLM Chatbots: A Sense of Purpose
LLM 聊天机器人缺失了什么:目标感
文章指出,尽管 LLM 能力不断提升,但它们缺乏真正的“目标感”,导致用户体验未得到相应改善。
We Need Positive Visions for AI Grounded in Wellbeing
我们需要基于福祉的 AI 正向愿景
呼吁构建以人类福祉为核心的 AI 发展愿景。
Financial Market Applications of LLMs
LLM 在金融市场的应用
探讨了 LLM 在金融建模和预测中的潜力与挑战。
A Brief Overview of Gender Bias in AI
AI 中性别偏见的简要概述
讨论了 AI 系统中存在的性别偏见及其影响。
Mamba Explained
Mamba 原理解析
详细解析了 Mamba 模型,作为 Transformer 的替代方案,其在长序列处理上的优势。
Car-GPT: Could LLMs finally make self-driving cars happen?
Car-GPT:LLM 能否最终实现自动驾驶?
探讨了 LLM 在自动驾驶领域的应用前景及面临的挑战。
Do text embeddings perfectly encode text?
文本嵌入能完美编码文本吗?
文章介绍了 Vec2text 技术,展示了如何将嵌入还原为文本,强调了嵌入数据的安全性。
arXiv CS.AI
In Search of the Ingredients of Open-Endedness: Replicating Picbreeder with Large Vision-Language Models
寻找开放性的要素:利用大型视觉语言模型复制 Picbreeder
研究探讨了如何利用大型视觉语言模型实现 AI 的开放式创造力。
Confidence Calibration in Large Language Models
大型语言模型中的置信度校准
研究发现 LLM 存在过度自信的问题,即置信度往往高于准确率。
How Much Thinking is Enough? Quantifying and Understanding Redundancy in LLM Reasoning
思考多少才够?量化并理解 LLM 推理中的冗余
研究分析了 LLM 推理过程中的冗余行为,探讨了如何优化推理效率。
Context: Proactive Goal-Directed Intelligence via Composable Sandboxed Programs, Declarative Wiring, and Structured Interaction
Context:通过可组合沙盒程序、声明式连接和结构化交互实现主动目标导向智能
介绍了 Magarshak 架构的智能层 Context,旨在实现主动的目标导向代理。
Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
面向可靠的 LLM 代理工作流设计:优化延迟、可靠性与成本的权衡
分析了 LLM 代理工作流中的核心权衡问题,并提出了优化方案。
Quantum Frog: Emergent Cooperation and Difficulty Scaling in a Quantized-Time Cooperative Game
量子青蛙:量化时间合作游戏中的涌现合作与难度缩放
介绍了一款名为“量子青蛙”的合作游戏,用于研究 AI 的合作行为。
BODHI: Precise OS Kernel Specification Inference
BODHI:精确的操作系统内核规范推理
利用 LLM 自动化生成操作系统内核的精确规范,提升形式化验证效率。
When Correct Beliefs Collapse: Epistemic Resilience of LLMs under Clinical Pressure
当正确信念崩溃:临床压力下 LLM 的认知韧性
提出了 Med-Stress 框架,评估 LLM 在临床对话压力下的信念稳定性。
arXiv CS.CL
Document Classification Pattern Recognition via Information Fusion: A Systematic Review of Multimodal and Multiview Representation Approaches
基于信息融合的文档分类模式识别:多模态和多视图表示方法的系统综述
综述了多模态和多视图信息融合在文档分类中的应用。
Raon-Speech Technical Report
Raon-Speech 技术报告
介绍了 Raon-Speech 模型,一款在英语和韩语语音理解、回答和生成方面表现优异的 9B 参数模型。
Multi-Persona Debate System for Automated Scientific Hypothesis Generation
用于自动化科学假设生成的多元辩论系统
利用多角色辩论系统,帮助研究人员合成碎片化知识,生成科学假设。
Improving the Completeness and Comparability of Segment Disclosures: A Large Language Model Approach
提高分部披露的完整性和可比性:一种大型语言模型方法
利用 LLM 改进财务报告中分部披露的质量。
EchoDistill:Alignment Noisy-to-Clean Self-Distillation for Robust Audio LLMs
EchoDistill:用于鲁棒音频 LLM 的噪声到清晰对齐自蒸馏
提出了一种自蒸馏方法,提升音频 LLM 在真实噪声环境下的鲁棒性。
TriVAL: A Tri-Validation Framework for Faithful Automatic Optimization Modeling
TriVAL:用于忠实自动优化建模的三重验证框架
提出了 TriVAL 框架,确保 LLM 在优化建模中的准确性和忠实度。
SLAP: Stratified Loss-based Pruning for On-Policy Data-Efficient Instruction Tuning
SLAP:基于分层损失剪枝的在线策略数据高效指令微调
提出了一种高效的指令微调方法,减少了训练数据需求和时间。
Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges
忠实还是捏造?LLM 评判中合理化偏见的因果框架
分析了 LLM 作为评判者时存在的合理化偏见,并提出了因果分析框架。
WIRED
Pope Leo Schooled the Tech Bros on Tolkien
教皇利奥给科技大佬们上了一堂托尔金课
教皇在通谕中引用《指环王》名言,被视为对误读该作品的科技亿万富翁的巧妙讽刺。
Why the Vatican Invited Anthropic to the Pope’s AI Encyclical Presentation
梵蒂冈为何邀请 Anthropic 参加教皇 AI 通谕发布会
教皇的通谕标志着教会与硅谷之间前所未有的联盟。
The Best Movies to Stream This Month (May 2026)
本月最佳流媒体电影(2026 年 5 月)
推荐了《Bugonia》、《Good Boy》和《Send Help》等值得一看的电影。
What Pope Leo XIV’s First Encyclical Says About the Power of AI
教皇利奥十四世的首份通谕对 AI 权力的看法
通谕《Magnifica humanitas》批评了技术权力过度集中在少数全球玩家手中的现象。
Internet Starts to Return in Iran After 3-Month Blackout
伊朗在 3 个月断网后开始恢复互联网连接
监测显示伊朗互联网连接正在逐步恢复,但尚不清楚是否为永久性恢复。
7 Best Outdoor Security Cameras (2026) After Testing Dozens
2026 年 7 款最佳户外安全摄像头评测
经过测试,推荐了 7 款无需订阅费的户外安全摄像头。
I’ve Tested Dozens of Packing Cubes. Here’s What’s Worth Taking on Your Next Trip
我测试了数十款收纳袋,这些值得带上你的下一次旅行
分享了旅行收纳袋的选购建议。
The US Can Put People on the Moon. Why Can’t It Get Iranians Online?
美国能把人送上月球,为什么不能让伊朗人上网?
探讨了互联网接入对伊朗社会变革的重要性,以及美国政府在其中的角色。
15 Best Travel Toiletry Bags, Tested Over Many Miles (2026)
2026 年 15 款最佳旅行洗漱包评测
评估了多款洗漱包的收纳和设计性能。
Google Fitbit Air Review: Barely There, Always Running
Google Fitbit Air 评测:轻若无物,持续运行
评测了 Google 的新款可穿戴设备 Fitbit Air,称其为最易用且实惠的设备。
Lobsters
What is a harmonic? An interactive comic about additive synthesis
什么是谐波?关于加法合成的交互式漫画
通过交互式漫画形式解释了加法合成中的谐波概念。
Stop advertising in your commits
停止在提交信息中做广告
呼吁开发者停止在 Git 提交信息中植入广告。
The social contract of writing
写作的社会契约
探讨了写作背后的社会责任与契约精神。
The pressure
压力
探讨了技术工作中的压力来源及应对之道。
Using SwiftUI to Build a Mac-assed App in 2026
2026 年使用 SwiftUI 构建地道的 Mac 应用
分享了使用 SwiftUI 开发原生 Mac 应用的经验。
readable.css
介绍了一款旨在提升网页可读性的 CSS 框架。
Using AI to write better code more slowly
使用 AI 更慢地写出更好的代码
探讨了 AI 如何帮助开发者放慢节奏,从而写出更高质量的代码。
Encyclical Letter of His Holiness Leo XIV Magnifica Humanitas
教皇利奥十四世通谕《Magnifica humanitas》
分享了教皇关于 AI 的通谕原文。
Software For My New Home Server
为我的新家庭服务器准备的软件
分享了家庭服务器的软件配置方案。
Building an AsyncIO executor for the 3DS
为 3DS 构建 AsyncIO 执行器
分享了在任天堂 3DS 上实现 AsyncIO 的技术细节。
DEV Community
I Replaced My Entire Business Stack with 4 Notion Templates
我用 4 个 Notion 模板替换了整个业务栈
作者通过 Notion 模板和 Python 自动化层,成功取代了原先昂贵的 SaaS 工具组合,大幅降低了成本。
We Tried 6 Memory Providers for Hermes Agent — Here’s What We Learned
我们为 Hermes Agent 尝试了 6 种记忆提供商——学到了什么
分享了在为 AI 代理实现持久化记忆过程中的经验教训。
Can Google Antigravity 2.0 Pass the “Napkin Challenge”? 📝🚀
Google Antigravity 2.0 能通过“餐巾纸挑战”吗?
测试了 Google 的新 AI 代理在处理复杂房地产投资建议时的自主能力。
Multiplexing SSH Connections with Control Master: Speed Up Deployments and Automation
使用 Control Master 复用 SSH 连接:加速部署与自动化
介绍了如何通过 SSH 连接复用技术提升运维效率。
I Built a Screenshot-to-React Generator in 3 Hours
我在 3 小时内构建了一个截图转 React 生成器
分享了如何利用 AI 快速将 UI 截图转化为 React 代码。
Why ‘AI Without Hype’ Stopped Differentiating in 2026
为什么“无炒作 AI”在 2026 年不再具有差异化
探讨了 AI 咨询行业中“无炒作”口号的泛滥与失效。
A SEC filing research prompt pack for source-aware stock research
一套用于源感知股票研究的 SEC 文件研究提示词包
提供了一套帮助用户从 SEC 文件中进行深度研究的提示词工具。
SchemaSpy vs SchemaCrawler - Which Database Documentation Tool is Right for You?
SchemaSpy 与 SchemaCrawler——哪款数据库文档工具适合你?
对比了两款主流数据库文档工具的优缺点。
One of the First Public HiDream-O1-Image LoRAs — and How to Train Your Own
首批公开的 HiDream-O1-Image LoRA 之一——以及如何训练你自己的
分享了 HiDream-O1-Image 模型的 LoRA 训练经验。
Human-in-the-Loop: The Most Important Concept in AI That Keeps You Employed
人类在环(HITL):AI 中最重要的概念,决定了你的就业
深入探讨了 HITL 的重要性,以及为何它是人类在 AI 时代保持竞争力的关键。
Meta Engineering
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends:构建可扩展至数十亿用户的社交发现功能
介绍了 Meta