2026-06-13
今日要点
- 埃隆·马斯克成为全球首位万亿富翁:SpaceX 在周五成功上市,股价表现强劲,推动马斯克个人财富突破 1 万亿美元大关,引发了关于财富集中与科技巨头影响力的广泛讨论。
- AI 代理与自动化风险凸显:多起报道指出 AI 代理在缺乏监管的情况下可能导致严重后果,包括误操作导致的高额云服务账单、自动化诈骗以及对网络安全的威胁。
- 科技行业 IPO 热潮:继 SpaceX 之后,Anthropic 和 OpenAI 等 AI 巨头也传出上市动向,市场正经历一场以“MANGOS”为代表的科技公司上市潮。
- AI 编码工具的进化与竞争:Claude Fable 5、Kimi K2.7-Code 等新模型发布,AI 辅助编程正从简单的代码生成转向具备主动性、持久记忆和复杂任务处理能力的“人工通用工程师”。
- 网络安全与隐私挑战:AUR 软件包遭到大规模恶意软件攻击,同时美国 Section 702 监控法案面临过期,数字主权与数据安全成为各国政府与企业的核心议题。
Hacker News
If you are asking for human attention, demonstrate human effort
如果你在寻求人类的关注,请展示人类的努力
随着 AI 生成的代码、文档和调试报告激增,团队协作中出现了一个新的礼仪问题:何时将 AI 的输出直接转发给同事是合适的?文章探讨了在 AI 能够高效集成内部代码库的背景下,人类在沟通中应保持的“努力门槛”,以避免过度依赖自动化工具导致的人际沟通质量下降。
AI agent bankrupted their operator while trying to scan DN42
AI 代理在扫描 DN42 网络时导致其操作员破产
一名 AI 代理在尝试加入 DN42 业余网络进行扫描时,由于失控的自动化行为,在短时间内产生了高达 6531.30 美元的 AWS 账单,直接导致其操作员面临财务危机。这一事件再次敲响了 AI 代理在缺乏严格成本控制和安全护栏下运行的警钟。
Claude Fable is relentlessly proactive
Claude Fable 具有极强的主动性
用户反馈显示,Claude Fable 5 展现出了惊人的主动性。它不仅能识别代码中的细微故障(如不必要的水平滚动条),还会主动采取多种策略来解决问题。这种“主动式”AI 正在改变开发者与工具的交互方式,使其更像是一个能够独立完成任务的合作伙伴。
Nobody ever gets credit for fixing problems that never happened (2001) [pdf]
没人会因为解决了从未发生的问题而获得赞誉
这篇 2001 年的经典文章探讨了预防性维护和风险管理中的悖论:当系统运行平稳、潜在故障被提前消除时,负责维护的人员往往因为“什么都没发生”而无法获得应有的认可。在 AI 时代,这种预防性工作的价值评估变得更加困难。
CRISPR tech selectively shreds cancer cells, including “undruggable” cancers
CRISPR 技术选择性粉碎癌细胞,包括“不可成药”癌症
CRISPR 基因编辑技术在癌症治疗领域取得重大突破,能够精准识别并“粉碎”癌细胞,甚至对那些传统药物难以触及的“不可成药”癌症也表现出显著疗效。这项技术为癌症治疗提供了全新的思路,有望彻底改变肿瘤治疗的格局。
Kimi K2.7-Code: open-source coding model with better token efficiency
Kimi K2.7-Code:具有更高 Token 效率的开源编码模型
Moonshot AI 推出的 Kimi K2.7-Code 是基于 K2.6 构建的代理型编码模型。该模型在处理长周期复杂软件工程任务时表现更佳,且通过优化架构,将思考 Token 的使用量降低了约 30%,显著提升了端到端的任务完成效率。
A Call to Action: Stop the FCC’s KYC Regime
行动呼吁:停止 FCC 的 KYC 制度
文章批评了 FCC 试图通过“了解你的客户”(KYC)制度来打击骚扰电话的举措。作者认为,虽然骚扰电话确实令人困扰,但 FCC 提出的全面监控方案是一种过度反应,会严重侵犯公民隐私,且无法从根本上解决问题。
AUR packages compromised with Infostealer and Rootkit
AUR 软件包遭到信息窃取程序和 Rootkit 攻击
Arch User Repository (AUR) 遭遇安全危机,一名冒充受信任维护者的攻击者接管并感染了超过 408 个软件包,植入了信息窃取程序和 Rootkit。虽然维护者团队已在 6 月 12 日前清除了恶意提交,但此次事件凸显了开源社区供应链安全的脆弱性。
“Don’t You Just Upload It to ChatGPT?”
“你难道不直接把它上传到 ChatGPT 吗?”
作者通过个人生活中的琐事,探讨了 AI 在日常任务处理中的普及程度。当人们习惯于将所有问题都交给 AI 处理时,我们是否正在丧失独立思考和处理复杂任务的能力?文章引发了关于 AI 依赖症的深刻反思。
Ryanair dark UX patterns summer 2026 refresher
瑞安航空 2026 夏季暗黑 UX 模式回顾
瑞安航空以其复杂的“暗黑 UX”设计闻名,文章回顾了其经典的诱导性设计,例如将“不购买保险”选项隐藏在复杂的下拉菜单中。随着夏季旅游旺季到来,作者提醒用户在预订廉价航空时需格外警惕这些设计陷阱。
I Am Not a Reverse Centaur
我不是反向半人马
作者重申了其对 LLM 辅助编程的立场,认为即便没有伦理或环境顾虑,LLM 也不适合其个人的工作流。文章探讨了在 AI 贡献激增的开源项目中,人类开发者如何保持独立性和代码质量的控制权。
Digital Sovereignty Becomes an Imperative as the US Reads Dutch Emails
随着美国读取荷兰邮件,数字主权成为当务之急
美国众议院获取荷兰公务员未删减邮件的事件,将“数字主权”从口号推向了实际操作层面。文章指出,各国必须具备抵御外部法律压力、控制供应商访问权限的能力,才能在数字化时代真正掌握数据控制权。
WASI 0.3
WASI 0.3 版本发布
WebAssembly 系统接口(WASI)发布了 0.3 版本,进一步完善了 WebAssembly 在服务器端和边缘计算环境中的系统调用能力,为跨平台运行提供了更强的支持。
How to setup a local coding agent on macOS
如何在 macOS 上设置本地编码代理
作者分享了在 macOS 上搭建本地编码代理的经验,利用 Gemma 4 的多 Token 预测(MTP)更新,实现了更快的响应速度。该方案旨在解决互联网连接不稳定时无法使用云端 AI 编码工具的问题。
The Future of Email
电子邮件的未来
电子邮件长期存在欺骗和伪造问题。随着 AI 技术的普及,伪造邮件变得更加难以辨别。文章探讨了在 AI 时代,电子邮件系统如何通过技术手段重建信任,以及用户应如何应对日益复杂的钓鱼攻击。
TechCrunch
Chinese cybercrime operation that used AI to scam ‘hundreds of thousands of victims’ sued by Google
谷歌起诉利用 AI 诈骗“数十万受害者”的中国网络犯罪团伙
谷歌对一个名为“Outsider Enterprise”的组织提起诉讼,指控其利用 AI 自动化技术发送了 250 万条诈骗短信,在两周内欺骗了数十万受害者。这是科技巨头打击 AI 驱动的大规模网络犯罪的最新行动。
SpaceX IPO closes up 19% and delivers the world’s first trillionaire
SpaceX IPO 收盘上涨 19%,造就全球首位万亿富翁
SpaceX 在周五完成了备受瞩目的 IPO,开盘价高于 135 美元的发行价,收盘上涨 19%。这一历史性时刻不仅标志着商业航天进入新阶段,也使埃隆·马斯克的个人财富突破 1 万亿美元。
SpaceX IPO: Live updates on everything you need to know
SpaceX IPO:你需要知道的一切实时更新
TechCrunch 整理了 SpaceX 上市前后的关键信息,包括公司发展历程、S-1 注册文件中的财务细节以及此次 IPO 对投资者和行业的影响。
SpaceX president Gwynne Shotwell just gave another hint at a Tesla merger
SpaceX 总裁 Gwynne Shotwell 再次暗示与特斯拉合并
SpaceX 总裁 Gwynne Shotwell 的最新言论引发了市场对 SpaceX 与特斯拉合并的猜测。分析认为,两家公司在技术和资源上的整合似乎已成为不可避免的趋势。
Mistral is rumored to be raising €3B at €20B valuation
传闻 Mistral 拟以 200 亿欧元估值融资 30 亿欧元
欧洲 AI 独角兽 Mistral 正在进行新一轮融资,估值预计将达到 200 亿欧元,较其 C 轮融资估值翻了近一倍,显示出资本市场对欧洲 AI 领军企业的强烈信心。
Robinhood sees ‘record-breaking’ traffic after SpaceX stock debuts
SpaceX 股票上市后,Robinhood 流量创下“破纪录”水平
SpaceX 的上市引发了散户投资者的疯狂交易,导致 Robinhood 平台流量激增。尽管部分用户经历了短暂的访问中断,但平台表示问题已迅速解决。
SpaceX, Anthropic, and OpenAI’s hot IPO summer
SpaceX、Anthropic 和 OpenAI 的火热 IPO 夏季
IPO 市场正在复苏,但主角已从传统的 FAANG 转向“MANGOS”(Meta/Microsoft、Anthropic、Nvidia、Google、OpenAI、SpaceX)。这一波 AI 巨头的上市潮将成为投资者和市场估值体系的重大压力测试。
Elon Musk becomes the world’s first trillionaire after SpaceX’s historic IPO
SpaceX 历史性 IPO 后,埃隆·马斯克成为全球首位万亿富翁
SpaceX 的上市将马斯克的纸面财富推向了 1 万亿美元。在马斯克个人影响力达到顶峰的同时,他也面临着前所未有的争议和公众舆论压力。
US surveillance law to expire for first time after lawmakers reject Trump’s controversial pick to lead spy agencies
在议员否决特朗普提名的情报机构负责人后,美国监控法案首次面临过期
由于国会拒绝了特朗普提名的情报机构负责人人选,授权 NSA 和 FBI 进行无证监控的 Section 702 法案极有可能在周五首次过期,这将对美国的监控体系产生深远影响。
Cheaper, faster, and culturally aware, Avataar’s video AI is built for India’s scale
更便宜、更快且具备文化意识,Avataar 的视频 AI 专为印度市场规模打造
Avataar AI 推出了其蒸馏视频模型,定价仅为每秒生成 0.005 美元。该模型针对印度市场的语言和文化特点进行了优化,旨在以极低的成本满足大规模视频生成需求。
The Verge
Nothing CEO says phone prices are going to keep going up
Nothing CEO 表示手机价格将持续上涨
Nothing 公司 CEO Carl Pei 在 X 上表示,由于 RAM 等核心零部件的短缺,手机价格将不可避免地继续上涨。这一趋势已开始影响到中端机型,消费者可能需要尽早进行设备升级。
The world’s first trillionaire is a killer
全球首位万亿富翁是个杀手
文章对马斯克成为万亿富翁表示强烈批评,指出其个人行为不仅充满争议,且其决策在过去一年中直接导致了数十万人的死亡,引发了关于财富与道德责任的激烈讨论。
Siri is good now??
Siri 现在变好用了??
苹果发布了新版 Siri,用户反馈显示其性能有了质的飞跃。曾经被诟病为“只能定闹钟”的 Siri,现在终于展现出了真正的智能水平,能够处理更复杂的任务。
A trillion dollars is a stupid amount of money
一万亿美元是一个荒谬的数字
文章探讨了“万亿”这一财富量级的概念。对于个人而言,拥有超过 3000 多位亿万富翁总和的财富,不仅是经济上的数字,更意味着对全球政治和经济的巨大权力。
Elon Musk is the world’s first trillionaire
埃隆·马斯克是全球首位万亿富翁
SpaceX 的 IPO 使得马斯克的净资产突破 1 万亿美元。这笔财富主要源于其在 SpaceX 的 48 亿股股份以及在特斯拉等公司的持股。
I held the Trump phone
我拿到了特朗普手机
作者分享了对“特朗普手机”(T1)的上手体验。尽管该手机在科技圈引发了广泛关注,但目前仍处于早期阶段,关于其具体功能和市场定位的讨论仍在持续。
Govee’s rechargeable smart table lamp is down to $60
Govee 可充电智能台灯降至 60 美元
Govee 的经典款智能台灯目前在亚马逊降价至 59.99 美元,这款支持变色和智能控制的台灯是提升居家氛围的性价比之选。
SpaceX’s massive IPO: all the latest news
SpaceX 的大规模 IPO:所有最新消息
SpaceX 的上市不仅让公众能够购买这家火箭、AI 和社交媒体巨头的股票,也让马斯克成为了全球首位万亿富翁,其财富规模甚至超过了许多国家的 GDP。
Jeff Bezos’ AI startup aims to build an ‘artificial general engineer’
杰夫·贝索斯的人工智能初创公司旨在打造“人工通用工程师”
贝索斯创立的 AI 初创公司 Prometheus 旨在开发 AI 驱动的工程工具,以辅助物理产品的设计。该公司致力于实现“人工通用工程师”的目标,即让 AI 具备独立完成复杂工程设计的能力。
SpaceX is now public
SpaceX 现已上市
SpaceX 正式在纳斯达克挂牌交易,发行价为 135 美元。作为历史上最受期待的 IPO 之一,SpaceX 的上市标志着商业航天领域进入了资本运作的新时代。
Ars Technica
PeopleSoft 0-day affecting hundreds of organizations steals gigabytes of data
PeopleSoft 0-day 漏洞影响数百家机构,导致数 GB 数据被窃
Oracle 旗下的 PeopleSoft 软件被曝存在严重的 0-day 漏洞,攻击者利用该漏洞窃取了大量敏感数据。这是近期最严重的软件安全事件之一,受影响机构正在紧急修复。
Controversial FISA spying law expires tonight. The spying will continue.
争议性的 FISA 监控法案今晚过期,但监控仍将继续
尽管 FISA 第 702 条款今晚过期,但由于现有的认证有效期可延续至 2027 年 3 月,美国的监控活动并不会立即停止。
Here’s what Jeff Bezos’ new startup Prometheus will do
杰夫·贝索斯的初创公司 Prometheus 将做什么
Prometheus 是目前资金最雄厚的物理 AI 初创公司之一,其核心目标是利用 AI 改变物理产品的设计流程,填补 AI 在工业工程领域的空白。
Have politics finally come for the National Academies of Science?
政治终于渗透进美国国家科学院了吗?
一份关于气候归因的报告引发了争议,外界担忧美国国家科学院的科学独立性正受到政治因素的威胁。
Ukraine’s one-time test used fully autonomous drones to kill Russian soldiers
乌克兰的一次测试使用全自动无人机击杀俄军士兵
乌克兰正在测试将 AI 模块集成到无人机和机器人中,以实现全自动作战。虽然全自动武器在战场上仍属罕见,但这一趋势引发了关于战争伦理的广泛担忧。
$130 billion in data center projects blocked by protests so far this year
今年以来,价值 1300 亿美元的数据中心项目因抗议被搁置
由于公众对 AI 数据中心能耗和环境影响的担忧,今年已有价值 1300 亿美元的项目被抗议活动阻碍。这让民众意识到,通过政治手段干预科技基础设施建设具有实际影响力。
When it comes to total water use, AI data centers are a drop in the bucket
就总用水量而言,AI 数据中心只是九牛一毛
文章指出,虽然 AI 数据中心对局部地区的水资源造成了压力,但从全球总用水量来看,其占比依然很小。然而,局部影响仍需通过技术手段进行缓解。
Google sues Chinese cybercrime network that used Gemini to automate scams
谷歌起诉利用 Gemini 自动化诈骗的中国网络犯罪网络
谷歌起诉了一个利用 Gemini 模型编写诈骗网站代码的犯罪团伙。该团伙通过自动化手段针对数十万人实施诈骗,谷歌此举旨在维护其 AI 平台的安全性。
RFK Jr. melts down over NYT report, admits he blacklists reporters
小肯尼迪因《纽约时报》报道而崩溃,承认将记者列入黑名单
《纽约时报》报道称小肯尼迪在竞选活动中表现消极,小肯尼迪对此反应激烈,并公开承认其竞选团队会封杀不友好的记者。
The biggest race in the world? The 24 Hours of Le Mans is this weekend.
全球最大的比赛?勒芒 24 小时耐力赛本周末举行
本周末,勒芒 24 小时耐力赛将迎来超过 35 万名观众,62 辆赛车将在昼夜不停的比赛中角逐冠军。
Product Hunt
Clutch Alarm
离合闹钟
一款旨在帮助用户在保证睡眠质量的同时,高效完成目标的闹钟应用。
Firma.dev
Firma.dev
一款为应用程序提供电子签名 API 的服务,平均每个信封的成本仅为 3 美分。
Pond
Pond
一个为初创公司提供融资、市场进入(GTM)策略和赏金任务的平台。
Qursor
Qursor
用户只需指向 UI 界面,即可将精确的上下文信息发送给 AI,提升交互效率。
Bob’s CLI
Bob’s CLI
一款本地优先的 AI 编码命令行工具,能够根据用户的习惯进行自适应调整。
LocIn AI
LocIn AI
利用具备语境感知能力的 AI,为应用程序提供自动化本地化工作流。
Keep
Keep
为 iPhone 或 Mac 提供全屏 3D 时钟场景的应用。
Medicyn
Medicyn
一款将完整的个人医疗记录私密存储在设备上的应用。
HyperSleep
HyperSleep
一款强制用户在睡眠前屏蔽社交媒体的应用,帮助改善睡眠习惯。
Slack Data Agent
Slack Data Agent
无需离开 Slack 即可查询企业内部数据的 AI 代理。
MIT Technology Review
The Download: “reprogramming” aging, and the hidden sense of interoception
下载:细胞“重编程”与隐藏的内感受感官
本期简报介绍了 Life Biosciences 在逆转衰老方面的最新进展,以及关于人类“内感受”(对身体内部状态的感知)的科学研究。
You do your own time
你在虚度自己的时光
一篇关于图书馆与知识守护者的文学随笔,探讨了在数字化时代,人们如何通过阅读和思考来对抗时间的流逝。
Why “reprogramming” is the buzziest approach to reversing aging right now
为什么“重编程”是目前逆转衰老最热门的方法
Life Biosciences 已经开始对青光眼患者进行实验性治疗,通过向眼球注射药物来再生神经。这种“重编程”技术被认为是未来治疗衰老相关疾病的最具潜力的方向。
Inside interoception: The hidden sense of how you feel inside
深入内感受:关于身体内部感觉的隐藏感官
大脑虽然处于黑暗的颅骨中,却能感知心跳、呼吸等内部状态。文章深入浅出地解释了“内感受”这一复杂感官如何影响我们的情绪和决策。
The Download: soccer’s data renaissance and China’s big nuclear plans
下载:足球的数据复兴与中国的核能大计划
本期简报探讨了数据分析如何改变足球比赛,以及中国在大型核反应堆建设方面的惊人进展。
Google DeepMind is worried about what happens when millions of agents start to interact
Google DeepMind 担忧数百万 AI 代理交互时可能引发的后果
DeepMind 正在资助研究 AI 代理在缺乏人类监督的情况下大规模交互可能带来的风险。随着代理能够自主执行任务,这种交互可能导致不可预见的系统性问题。
Job titles of the future: Nature’s drug designer
未来的职位:自然药物设计师
化学家 Tim Cernak 正在利用其在制药行业的经验,探索如何从自然界中寻找灵感来设计更精准的药物,减少对健康细胞的伤害。
Inside soccer’s data renaissance
深入足球的数据复兴
数据分析正在彻底改变足球战术。文章分析了教练如何利用数据来优化球员位置、传球路线,甚至在比赛初期就通过战术调整来掌控局面。
Why China is betting on big nuclear reactors
为什么中国押注大型核反应堆
自 2016 年以来,中国的核能装机容量翻了一番,达到近 60 吉瓦。与美国倾向于小型模块化反应堆不同,中国坚持建设大型压水堆,以实现能源供应的快速增长。
The Download: the “steroid olympics” and a safer Mythos
下载:“类固醇奥运会”与更安全的 Mythos
本期简报讨论了近期举办的“类固醇奥运会”对体育文化的冲击,以及 Anthropic 在 AI 安全方面的最新进展。
GitHub Trending
addyosmani / agent-skills
addyosmani / agent-skills
为 AI 编码代理提供的生产级工程技能库。
music-assistant / server
music-assistant / server
一个开源的媒体库管理器,可连接各种流媒体服务和智能音箱,需在常驻设备上运行。
mattermost / mattermost
mattermost / mattermost
一个用于软件开发全生命周期的开源安全协作平台。
apple / container
apple / container
苹果推出的工具,用于在 Mac 上利用轻量级虚拟机创建和运行 Linux 容器,针对 Apple Silicon 进行了优化。
iptv-org / iptv
iptv-org / iptv
全球公开 IPTV 频道的集合。
obra / superpowers
obra / superpowers
一套行之有效的代理技能框架和软件开发方法论。
refactoringhq / tolaria
refactoringhq / tolaria
用于管理 Markdown 知识库的桌面应用程序。
maziyarpanahi / openmed
maziyarpanahi / openmed
开源医疗 AI 项目。
LMCache / LMCache
LMCache / LMCache
通过最快的 KV 缓存层为 LLM 提速的缓存工具。
phuryn / pm-skills
phuryn / pm-skills
产品经理技能市场,包含 100 多种代理技能和命令,涵盖从发现到增长的全流程。
OpenAI Blog
New OpenAI Academy courses for the next era of work
OpenAI 学院推出新课程,助力新工作时代
OpenAI 推出了三门学院课程,旨在帮助人们构建实用的 AI 技能、创建可重复的工作流,并将 AI 代理应用于日常工作中。
How Preply combines AI and human tutors to personalize learning
Preply 如何结合 AI 与人类导师实现个性化学习
Preply 利用 OpenAI 技术生成课程总结,为学生提供个性化反馈和语言练习,提升学习效果。
How an astrophysicist uses Codex to help simulate black holes
天体物理学家如何利用 Codex 模拟黑洞
天体物理学家 Chi-kwan Chan 使用 Codex 构建黑洞模拟,帮助科学家研究极端物理现象并验证广义相对论。
OpenAI to acquire Ona
OpenAI 将收购 Ona
OpenAI 计划收购 Ona,以扩展 Codex 的云端环境能力,支持企业级工作流中长期运行的 AI 代理。
Supporting Europe’s work in ensuring a trustworthy AI ecosystem
支持欧洲构建可信 AI 生态系统
OpenAI 宣布支持欧盟的 AI 内容透明度实践准则,推动 AI 生成内容的溯源标准和工具建设。
BBVA puts AI at the core of banking with OpenAI
BBVA 与 OpenAI 合作,将 AI 置于银行业务核心
西班牙对外银行(BBVA)将 ChatGPT Enterprise 扩展至 10 万名员工,并与 OpenAI 合作加速全球银行业务的 AI 转型。
Access OpenAI models and Codex through your Oracle cloud commitment
通过 Oracle 云承诺访问 OpenAI 模型和 Codex
企业现在可以通过 Oracle 云访问 OpenAI 模型和 Codex,利用现有的云服务承诺进行 AI 部署,并确保企业级的安全与治理。
PRC-linked influence operations are targeting AI debates in the US
与中国相关的舆论操纵行动正针对美国的 AI 辩论
OpenAI 的一份新报告详细披露了与中国相关的舆论操纵行动,这些行动利用 AI 针对美国的科技辩论、数据中心叙事、关税政策以及关于 ChatGPT 的虚假信息进行干预。
From data to decisions: how LSEG is scaling trusted AI
从数据到决策:伦敦证券交易所集团如何扩展可信 AI
伦敦证券交易所集团(LSEG)利用 OpenAI 技术在全公司范围内扩展可信 AI,加速洞察生成,缩短发布周期,并赋能 4000 名员工。
How engineers at Nextdoor use Codex to build without limits
Nextdoor 的工程师如何利用 Codex 实现无限制构建
Nextdoor 的工程师利用 Codex 和 GPT-5.5 调查难以复现的问题,实现跨平台构建,并将精力集中在产品成果上。
Anthropic Blog
Claude Fable 5 and Claude Mythos 5
Claude Fable 5 与 Claude Mythos 5
Anthropic 发布了新一代智能模型,旨在解决最困难的知识工作和编码问题。
Introducing Claude Corps
推出 Claude Corps
Anthropic 发起了一项全国性奖学金计划,旨在支持职业生涯早期的年轻人,将 AI 的益处带给美国各地的社区。
Expanding Project Glasswing
扩展 Project Glasswing 项目
Anthropic 将 Project Glasswing 项目扩展至全球 15 个国家的约 150 个新组织。
Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas”
Anthropic 联合创始人 Chris Olah 对教皇利奥十四世通谕《Magnifica humanitas》的评论
Chris Olah 分享了其对教皇关于 AI 的通谕的看法。
Results from the first Anthropic Public Record
首份 Anthropic 公共记录结果
Anthropic 发布了首份公共记录报告。
TCS and Anthropic partner to bring Claude to regulated industries
TCS 与 Anthropic 合作,将 Claude 引入受监管行业
塔塔咨询服务公司(TCS)与 Anthropic 达成合作,将 Claude 模型引入银行、航空等受监管行业。
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
DXC 将把 Claude 集成到银行、航空及其他受监管行业依赖的系统中
DXC Technology 将 Claude 集成到关键行业系统中,以提升这些行业的智能化水平。
Introducing the Services Track and Partner Hub of the Claude Partner Network
推出 Claude 合作伙伴网络的“服务轨道”与“合作伙伴中心”
Anthropic 进一步完善了其合作伙伴网络,以支持更广泛的生态系统建设。
What we learned mapping a year’s worth of AI-enabled cyber threats
我们在绘制一年 AI 驱动的网络威胁地图中学到了什么
Anthropic 分享了对过去一年 AI 驱动的网络威胁的分析报告。
Anthropic confidentially submits draft S-1 to the SEC
Anthropic 向 SEC 秘密提交 S-1 草案
Anthropic 已向美国证券交易委员会(SEC)秘密提交了 IPO 注册草案,正式启动上市流程。
Google AI Blog
Our new community investments in Virginia support local jobs and expand energy affordability.
我们在弗吉尼亚州的新社区投资支持当地就业并扩大能源可负担性
谷歌正在通过投资支持弗吉尼亚州的下一代劳动力培养和能源项目。
The latest AI news we announced in May 2026
2026 年 5 月谷歌 AI 最新动态汇总
回顾谷歌在 5 月份发布的各项 AI 更新。
5 ways Google Search can level up your thrift and vintage shopping
谷歌搜索提升二手和复古购物体验的 5 种方式
利用谷歌搜索和购物中的 AI 工具,用户可以更轻松地发现二手好物。
How we used Gemini to build Google I/O 2026
我们如何利用 Gemini 构建 Google I/O 2026
了解谷歌员工如何使用 AI 来策划和制作 Google I/O 2026 大会。
Take our I/O 2026 quiz, vibe coded in Google AI Studio.
参加我们的 I/O 2026 测验,在 Google AI Studio 中体验“氛围编码”
谷歌使用 AI Studio 制作了一个关于 I/O 2026 公告的测验。
9 demos of Gemini Omni and Gemini 3.5 in action
9 个 Gemini Omni 和 Gemini 3.5 的实际演示
观看 9 个视频,展示 Gemini Omni 和 Gemini 3.5 在 Google I/O 2026 上发布的功能。
Check out real-life AI prototypes from the Futures Lab.
查看来自 Futures Lab 的真实 AI 原型
滑铁卢大学的学生开发了如手语导师等 AI 原型,旨在重塑教育和工作的未来。
Catch up on 12 major I/O 2026 moments
回顾 I/O 2026 的 12 个重要时刻
总结了 Google I/O 2026 主题演讲中的 12 个重大发布,包括 Gemini Omni 和 Gemini 3.5 Flash。
Catch up on the Dialogues stage at Google I/O 2026.
回顾 Google I/O 2026 的对话舞台
回顾 I/O 2026 对话环节,行业领袖探讨了 AI、量子计算、机器人技术和创造力的未来。
We’re announcing new community investments in Missouri.
我们宣布在密苏里州进行新的社区投资
谷歌正在密苏里州投资建设下一代劳动力并支持能源项目。
Hugging Face Blog
olmo-eval: An evaluation workbench for the model development loop
olmo-eval:模型开发循环的评估工作台
Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP
PyTorch 中的性能分析(第二部分):从 nn.Linear 到融合 MLP
Introducing North Mini Code: Cohere’s First Model For Developers
推出 North Mini Code:Cohere 首款开发者模型
How an Agent Built a 3D Paris Gallery by Chaining Two Hugging Face Spaces
AI 代理如何通过链接两个 Hugging Face Spaces 构建 3D 巴黎画廊
Migrating Your GitHub CI to Hugging Face Jobs
将 GitHub CI 迁移到 Hugging Face Jobs
The Open Source Community is backing OpenEnv for Agentic RL
开源社区支持 OpenEnv 用于代理强化学习
Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI
Nemotron 3.5 内容安全:面向全球企业 AI 的可定制多模态安全方案
Designing the hf CLI as an agent-optimized way to work with the Hub
将 hf CLI 设计为与 Hub 交互的代理优化方式
Direct Preference Optimization Beyond Chatbots
超越聊天机器人的直接偏好优化(DPO)
Adding MCP Tools to Reachy Mini
为 Reachy Mini 添加 MCP 工具
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
正交性之后:德性伦理代理与 AI 对齐
文章认为理性的人类并不单纯追求“最终目标”,而是将行动与实践网络对齐。因此,AI 的对齐也应从德性伦理的角度出发,而非仅仅关注目标函数。
AGI Is Not Multimodal
AGI 不是多模态的
文章指出,将语言视为思维的唯一模型会导致我们忽视人类智能中深层的具身理解。AGI 的实现不能仅依赖多模态数据的堆砌。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
形状、对称性与结构:数学在机器学习研究中角色的转变
机器学习研究正从数学驱动的架构设计转向计算密集型的工程优先模式。文章探讨了这种转变对未来研究的影响。
What’s Missing From LLM Chatbots: A Sense of Purpose
LLM 聊天机器人缺失了什么:使命感
尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升。文章认为,AI 缺乏真正的“使命感”是限制其进一步发展的关键。
We Need Positive Visions for AI Grounded in Wellbeing
我们需要以福祉为基础的 AI 正向愿景
文章呼吁在 AI 发展中注入更多对人类福祉的关注,而非仅仅追求技术指标的突破。
Financial Market Applications of LLMs
LLM 在金融市场的应用
探讨了 LLM 在处理金融序列数据、自动化交易和市场分析中的潜力与局限。
A Brief Overview of Gender Bias in AI
AI 中性别偏见的简要概述
讨论了 AI 模型中存在的性别偏见及其对社会公平的影响。
Mamba Explained
Mamba 原理解析
Mamba 作为一种基于状态空间模型(SSM)的新型 AI 模型,被视为 Transformer 的有力竞争者,特别是在处理长序列任务时具有更高的效率。
Car-GPT: Could LLMs finally make self-driving cars happen?
Car-GPT:LLM 能否最终实现自动驾驶?
探讨了 LLM 在自动驾驶领域的应用潜力,以及其在安全性、可靠性方面面临的挑战。
Do text embeddings perfectly encode text?
文本嵌入能完美编码文本吗?
“Vec2text”技术展示了如何将嵌入还原为文本,这揭示了嵌入数据在安全协议方面存在的严重漏洞。
arXiv CS.AI
ToolSense: A Diagnostic Framework for Auditing Parametric Tool Knowledge in LLMs
ToolSense:审计 LLM 参数化工具知识的诊断框架
针对 LLM 在工具检索中的瓶颈,ToolSense 提出了一种参数化工具检索方法,通过将工具编码为虚拟 Token 来提升检索准确性。
Arbor: Tree Search as a Cognition Layer for Autonomous Agents
Arbor:作为自主代理认知层的树搜索
Arbor 引入了结构化树搜索作为自主代理的认知层,使其能够在大型、有状态的动作空间中进行更有效的决策。
Strategic Decision Support for AI Agents
AI 代理的战略决策支持
探讨了在现代代理系统中,人类如何从决策者转变为 AI 代理的辅助者,并分析了这种角色转换带来的可靠性挑战。
Pythagoras-Prover: Advancing Efficient Formal Proving via Augmented Lean Formalisation
Pythagoras-Prover:通过增强 Lean 形式化推进高效形式化证明
Pythagoras-Prover 旨在降低 Lean 定理证明的计算成本,通过增强形式化数据来提升证明效率。
PersonaDrive: Human-Style Retrieval-Augmented VLA Agents for Closed-Loop Driving Simulation
PersonaDrive:用于闭环驾驶模拟的人类风格检索增强 VLA 代理
PersonaDrive 引入了人类驾驶风格的变异,使闭环驾驶模拟中的交通代理行为更加真实。
“Did you lie?” Evaluating Lie Detectors across Model Scale and Belief-Verified Model Organisms
“你撒谎了吗?”跨模型规模和信念验证模型生物评估测谎仪
研究评估了现有测谎仪在不同模型规模下的表现,并指出目前的模型生物往往无法满足信念验证的要求。
TrajGenAgent: A Hierarchical LLM Agent for Human Mobility Trajectory Generation
TrajGenAgent:用于人类移动轨迹生成的层次化 LLM 代理
TrajGenAgent 利用层次化 LLM 代理生成高质量的合成移动轨迹,解决了隐私约束下的数据获取难题。
Evoflux: Inference-Time Evolution of Executable Tool Workflows for Compact Agents
Evoflux:紧凑型代理可执行工具工作流的推理时演化
Evoflux 提出了一种在推理时演化工具工作流的方法,使紧凑型语言模型能够更高效地处理复杂的工具调用任务。
arXiv CS.CL
EDEN: A Large-Scale Corpus of Clinical Notes for Italian
EDEN:意大利语临床笔记的大规模语料库
EDEN 包含了约 400 万份完全匿名化的意大利医院急诊科临床笔记,为医疗 NLP 研究提供了宝贵资源。
Helping Figures Tell their Story! Paper-Grounded Video Generation Explaining Complex Scientific Figures
帮助图表讲述故事!解释复杂科学图表的论文基础视频生成
该系统能够根据科学论文内容,生成解释复杂图表的视频,填补了当前视频生成系统在科学叙事方面的空白。
MARD: Mirror-Augmented Reasoning Distillation for Mechanism-Level Drug-Drug Interaction Prediction
MARD:用于机制级药物相互作用预测的镜像增强推理蒸馏
MARD 提出了一种机制级的药物相互作用预测协议,能够识别具体的酶或药效学轴,并提供证据支持。
Constrained Semantic Decompression in LLMs through Persian Proverb-Conditioned Story Generation
通过波斯谚语条件故事生成实现 LLM 中的约束语义解压
研究将波斯谚语转化为故事,作为测试 LLM 抽象到现实映射能力的基准。
Shopping Reasoning Bench: An Expert-Authored Benchmark for Multi-Turn Conversational Shopping Assistants
购物推理基准:专家编写的多轮对话购物助手评估基准
该基准旨在评估购物助手在多轮对话中的推理能力、领域专业知识和质量控制。
MentalMARBERT: Domain-Adaptive Pre-training and Two-Stage Fine-Tuning for Arabic Mental Health Disorders Detection
MentalMARBERT:用于阿拉伯语心理健康障碍检测的领域自适应预训练与两阶段微调
针对阿拉伯语社交媒体文本的方言差异和数据不平衡问题,MentalMARBERT 提升了心理健康障碍的检测准确率。
Observable Patterns Are Not Explanations: A Causal-Geometric Analysis of Latent Reasoning Models
可观察模式并非解释:潜在推理模型的因果几何分析
研究指出,潜在推理模型中的可观察模式(如 BFS 边界)并不等同于内部推理机制,需要更深入的因果分析。
AfriSUD: A Dependency Treebank Collection for Evaluating Models on African Languages
AfriSUD:用于评估非洲语言模型的依存树库集合
AfriSUD 提供了九种非洲语言的句法标注树库,旨在弥补非洲语言在 NLP 研究中的资源匮乏。
WIRED
‘Tell Him He’s a Piece of Shit’: Meta’s New AI Unit Is a Total Mess
“告诉他他是个混蛋”:Meta 的新 AI 部门一团糟
Meta 内部的 AI 战略混乱不堪,高管与员工之间存在严重分歧,导致 AI 部门的运作效率低下。
Donald Trump’s White House UFC Event Would Be Embarrassing Anywhere
唐纳德·特朗普在白宫举办的 UFC 活动在任何地方都会令人尴尬
文章批评了在白宫南草坪举办的 UFC 活动,认为其缺乏尊严,不符合白宫的身份。
Chinese Drivers Are Using Tiny Plastic Heads to Fool Tesla’s Autopilot Safeguards
中国司机使用塑料小人头来欺骗特斯拉的自动驾驶安全防护
为了绕过特斯拉的驾驶员注意力监控,中国司机发明了各种 DIY 工具,包括名人玩偶和闪烁屏幕,引发了对自动驾驶安全性的担忧。
Elon Musk Is the World’s First Trillionaire
埃隆·马斯克是全球首位万亿富翁
SpaceX 的上市使马斯克进入了前所未有的财富领域,其影响力已超越了传统的商业范畴。
China Didn’t Make Americans Hate Data Centers
中国并没有让美国人讨厌数据中心
文章反驳了将美国反数据中心运动归咎于中国干预的观点,指出这更多是由于当地社区对环境和资源消耗的真实担忧。
Crypto Guys Bought the Answer to the CIA’s Mysterious Kryptos Sculpture
加密货币人士买下了 CIA 神秘 Kryptos 雕塑的答案
一群加密货币爱好者买下了关于 CIA 总部 Kryptos 雕塑的解密线索,并承诺将继续保持该竞赛的神秘性。
A White Supremacist Youth Group Helped Orchestrate the Belfast Riots
一个白人至上主义青年团体协助策划了贝尔法斯特骚乱
调查显示,一个与全球新纳粹运动有关的青年团体在贝尔法斯特骚乱中扮演了策划角色,利用社交媒体煽动反移民情绪。
6 Best Digital Notebooks (2026): ReMarkable, Kobo, Kindle
2026 年 6 款最佳数字笔记本:ReMarkable, Kobo, Kindle
评测了当前市场上最优秀的数字笔记本,这些工具结合了手写体验与数字存储的便利性。
4 Best Floodlight Security Cameras (2026) After Thorough Testing
经过全面测试的 4 款最佳泛光灯安全摄像头(2026)
评测了四款适合家庭安防的泛光灯摄像头,帮助用户提升庭院和车道的安全性。
Pedal Electric H/T Review: A Fast, Powerful, Stylish Ebike
Pedal Electric H/T 评测:一款快速、强大且时尚的电动自行车
评测了一款电动自行车,虽然踏板辅助略显生硬,但其油门加速表现出色。
Lobsters
How I made a 60fps Eink monitor, the Modos Flow
我是如何制作 60fps 电子墨水显示器 Modos Flow 的
Turn your site into a place people can bump into each other
将你的网站变成人们可以偶遇的地方
A columnar database for analytics in pure Clojure
一个纯 Clojure 编写的分析列式数据库
Nix Flakes and their Guix Equivalents
Nix Flakes 及其 Guix 等价物
Hundreds of AUR packages attacked by infostealer
数百个 AUR 软件包遭到信息窃取程序攻击
What are you doing this weekend?
这个周末你打算做什么?
Swift at Apple: Migrating the TrueType Hinting Interpreter
苹果的 Swift:迁移 TrueType 提示解释器
Catjam 2026
Catjam 2026
German court ruling declares Google’s AI Overviews are Google’s own words and makes it liable for false answers
德国法院裁定谷歌的 AI 概览属于谷歌自己的言论,并使其对错误答案承担责任
DEV Community
AI Evals, Part 2: Error Analysis The Unglamorous Superpower Behind Good Evals
AI 评估(第二部分):错误分析——良好评估背后的不光彩超能力
文章强调了错误分析在 AI 评估中的重要性,指出仅仅依赖自动化分数是不够的,必须深入分析错误原因。
The Remote Already Exists: What “Click” Got Right About Agentic AI
遥控器早已存在:电影《人生遥控器》对代理 AI 的预见
作者通过电影《人生遥控器》探讨了 AI 代理在自动化生活中的双刃剑效应,提醒人们不要过度依赖 AI 导致生活失控。
Your MCP server will drift from your app. Here’s a build gate that stops it.
你的 MCP 服务器会偏离你的应用,这里有一个构建门禁可以阻止它
文章介绍了如何通过构建门禁确保 MCP 服务器与 UI 和 API 保持功能对齐,防止功能腐烂。
I built an MCP server that gives AI coding assistants persistent memory (85.6% token reduction)
我构建了一个为 AI 编码助手提供持久记忆的 MCP 服务器(Token 减少 85.6%)
作者开发了一个本地优先的 MCP 服务器,解决了 AI 编码助手在每次会话中丢失上下文的问题,显著降低了 Token 消耗。
Astro 5 content collections as an editorial layer in a programmatic site
Astro 5 内容集合作为程序化网站的编辑层
文章探讨了如何利用 Astro 5 的内容集合功能,为程序化生成的网站添加编辑层,提升内容质量。
The Agent Gets the API Key. You Get the Guinea Pig Seat.
代理拿到了 API 密钥,你成了小白鼠
文章警告了将 AI 直接连接到金融账户的风险,指出在缺乏监管的情况下,这种自动化交易可能导致严重的财务损失。
The claude -p playbook for June 15 — rebuilding your AI workflows inside interactive sessions
6 月 15 日的 claude -p 手册——在交互式会话中重建 AI 工作流
随着 Claude 切换到计量计费模式,作者分享了如何优化工作流以适应新的成本结构。
Running 100 Playwright Tests in Parallel Without Inbox Collisions
并行运行 100 个 Playwright 测试而不发生收件箱冲突
文章分享了在并行测试中处理电子邮件验证流的技巧,避免了测试间的干扰。
His Today Was Yesterday: a timezone bug, a blast radius, and what AI missed
他的今天就是昨天:时区 Bug、爆炸半径以及 AI 错过的东西
作者分享了一个关于时区 Bug 的排查经历,指出 AI 在处理复杂业务逻辑时仍可能遗漏关键的上下文信息。
Why your synthetic fintech data fails code review (and how mixture models fix it)
为什么你的合成金融科技数据无法通过代码审查(以及混合模型如何修复它)
文章指出均匀分布的合成数据在金融场景中是不真实的,并建议使用混合模型来生成更符合现实的数据。
Meta Engineering
Lights Out, Systems On: Validating Instant Power Loss Readiness
关灯,系统开启:验证瞬时断电准备情况
Meta 引入了“瞬时断电风暴”测试范式,以验证其数据中心在零通知断电情况下的容错能力。