2026-06-10

今日要点


Hacker News

Claude Fable 5

Anthropic 发布了其最新的 Claude Fable 5 模型系统卡。该文档详细介绍了该模型的设计理念、能力边界以及在安全性方面的考量,旨在为开发者和研究人员提供透明的性能评估参考。

Read more →


Making Graphics Like it’s 1993

作者分享了其个人项目“Catlantean 3D”的开发历程。该项目旨在利用 90 年代初的经典图形技术,结合现代编译器,打造一款完整的、可发行的第一人称射击游戏,并计划于明年在 Steam 上线。

Read more →


Microsoft’s open source tools were hacked to steal passwords of AI developers

微软近期切断了数十个托管在 GitHub 上的开源项目访问权限,原因是黑客成功入侵了这些项目,并在代码中植入了窃取密码的恶意软件。受影响的项目多与 Azure 云服务及 AI 开发工具相关,引发了开发者社区对供应链安全的广泛担忧。

Read more →


Cleaning up after AI rockstar developers

文章探讨了在团队中处理“摇滚明星”开发者遗留问题的挑战。这些开发者往往引入了大量前沿但复杂的架构和工具,导致团队在他们离开后难以维护。作者建议通过规范化流程和文档化来降低这种技术债务。

Read more →


Albania Is Not for Sale: Kushner’s $4B Resort Triggers ‘Flamingo Revolution’

阿尔巴尼亚的“火烈鸟革命”正在考验政府在保护外国投资者利益与维护国家主权之间的平衡。阿尔巴尼亚反腐败检察官冻结了与贾里德·库什纳支持的豪华度假村项目相关的土地开发公司银行账户,引发了关于外国投资透明度的激烈讨论。

Read more →


FCC wants to kill burner phones by forcing telecoms to get all customers’ IDs

美国联邦通信委员会(FCC)计划要求电信运营商强制获取所有客户的身份信息,这将使购买无需实名认证的“一次性手机”(burner phones)变得几乎不可能。此举引发了隐私倡导者、记者及家庭暴力幸存者对个人隐私和安全保护的强烈担忧。

Read more →


Apple decided not to roll out Siri in EU after denied request for exemption

由于未能获得欧盟监管机构的豁免,苹果公司决定不在欧盟地区推出其最新的 AI 版 Siri。欧盟委员会指出,苹果的 AI 工具未能完全符合《数字市场法案》的相关规定,导致欧洲用户暂时无法体验这一升级。

Read more →


GentleOS – Classic operating system with a lovely retro GUI

GentleOS 是一款专为 32 位复古 PC 设计的业余操作系统。其目标是提供一个简单的平台,让用户可以在裸机上运行图形化交互应用,最低仅需 i386 CPU 和 4MB 内存即可运行。

Read more →


Facebook is paying people overseas promoting Alberta separatism

报道称 Facebook 正在向海外人员支付费用,以推广阿尔伯塔省的分离主义运动。这一发现引发了关于社交媒体平台在干预地方政治和传播虚假信息方面责任的讨论。

Read more →


CEOs Who Think AI Replaces Their Employees Are Just Bad CEOs

文章批评了那些盲目认为 AI 可以完全取代员工的首席执行官。作者认为,优秀的领导者应该将 AI 视为增强员工能力的工具,而不是裁员的借口,过度依赖 AI 替代人力往往反映了管理层的短视。

Read more →


We Think the SpaceX IPO Is Overvalued

分析师对 SpaceX 的首次公开募股(IPO)估值表示怀疑,认为市场对其增长潜力的预期过高,且忽略了航天行业固有的高风险和资本密集型特征。

Read more →


GPT-2: Too Dangerous To Release (2019)

回顾了 2019 年 OpenAI 因担心恶意应用而决定不公开发布 GPT-2 完整模型的历史。这一决策被视为 AI 领域负责任披露原则的早期实验,对比今日 AI 的广泛普及,具有重要的历史意义。

Read more →


Job: Head of Stonehenge

巨石阵(Stonehenge)正在招聘负责人。该职位强调遗产保护的重要性,旨在通过管理这一历史遗迹,连接过去与现在,为社区带来积极影响。

Read more →


System Card: Claude Fable 5 and Claude Mythos 5 [pdf]

Anthropic 公布了 Claude Fable 5 和 Mythos 5 的系统卡文档,详细阐述了这两款模型的架构差异、训练数据来源以及在不同应用场景下的安全合规性说明。

Read more →


Federal judge blocks H1B visa $100K fee

一名联邦法官裁定阻止特朗普政府对新 H-1B 签证征收 10 万美元费用的政策。该裁决被认为将挽救阿拉斯加州数百个教育岗位,避免了因高额签证费用导致的人才流失。

Read more →


TechCrunch

GM joins race to build batteries for AI data centers and the grid

通用汽车正在开发一种全新的钠离子电池化学技术,旨在为 AI 数据中心和电网提供能源存储解决方案。此举是通用汽车在能源转型领域的重要布局,旨在利用其电池技术优势解决 AI 算力带来的电力缺口。

Read more →


Hey, Siri, here’s what I actually want from AI

作者探讨了对个人 AI 助理的真实需求,反思了在过度依赖 AI 的情况下,人类是否会丧失独立思考和处理日常事务的能力,并呼吁 AI 应该更具人性化和辅助性。

Read more →


Anthropic’s Fable 5 can make weirdly fun video games with the click of a button

Anthropic 的 Claude Fable 5 模型因其强大的代码生成能力,被认为将成为“氛围编码者”(vibe coders)的新宠,能够通过简单的提示词快速生成有趣的网页游戏。

Read more →


Can tech companies learn to love cheaper AI models?

文章分析了 AI 经济学的转变,指出如果更廉价的模型能够处理同等质量的 AI 工作负载,将彻底改变行业成本结构,促使企业从追求模型规模转向追求性价比。

Read more →


WWDC 2026: Everything announced on Siri AI, iOS 27, Apple Intelligence, and more

苹果在 WWDC 2026 上发布了 iOS 27 和 macOS 27,核心亮点是深度集成了 AI 的 Siri 助手。苹果展示了其在隐私保护前提下,如何通过本地和云端协同提升用户体验。

Read more →


CISA gives US federal agencies three days to fix a VPN bug under attack by a ransomware gang

美国网络安全与基础设施安全局(CISA)要求联邦机构在三天内修复一个正被勒索软件团伙利用的 VPN 漏洞。该漏洞影响了多个政府部门使用的 Check Point 产品,安全形势严峻。

Read more →


Anthropic’s Claude Fable 5 is a version of Mythos the public can access today

Anthropic 正式向公众发布 Claude Fable 5,这是首个可公开访问的 Mythos 级模型。为了确保安全,该模型内置了防护栏,限制了其在生物学和网络安全等高风险领域的响应能力。

Read more →


Rivian starts deliveries of its all-important R2 SUV

Rivian 正式开始交付其关键车型 R2 SUV。CEO RJ Scaringe 将其视为公司迄今为止最重要的产品发布,旨在通过更具竞争力的价格和性能打开大众市场。

Read more →


Apple’s foldable iPhone could be just around the corner

iOS 27 的开发者测试版代码中出现了关于设备折叠状态和屏幕角度的引用,暗示苹果可能即将推出折叠屏 iPhone。

Read more →


It’s not FAANG anymore. It’s MANGOS.

随着 SpaceX、Anthropic 和 OpenAI 等巨头即将上市,科技行业正在形成新的权力中心。作者建议用“MANGOS”这一新缩写来取代传统的“FAANG”,以反映当前 AI 和航天产业的崛起。

Read more →


The Verge

Congress just gave DHS another $70 billion

美国国会以微弱优势投票通过了为国土安全部(DHS)提供 700 亿美元拨款的法案,旨在支持特朗普政府的“大规模驱逐”议程。该投票结果呈现出明显的党派分歧。

Read more →


The App Store is going to add subscription bundles soon

苹果宣布 App Store 将支持跨公司的订阅捆绑服务。用户未来可以购买包含不同公司服务的订阅包,类似于目前的流媒体捆绑模式,旨在提升用户订阅体验。

Read more →


GM thinks EVs can help offset AI’s energy suck with vehicle-to-grid tech

通用汽车在旧金山宣布,将激活其电动汽车的“车网互联”(V2G)功能。此举旨在利用电动汽车电池作为分布式储能设备,缓解 AI 数据中心对电网造成的巨大电力压力。

Read more →


Microsoft AI head calls out Anthropic for acting like Claude is conscious

微软 AI 首席执行官 Mustafa Suleyman 批评 Anthropic 在 Claude 的“宪法”中暗示模型具有意识的行为,认为这种做法非常危险,可能会误导用户并导致模型表现出虚假的意识行为。

Read more →


Nintendo is playing things too safe

任天堂在最新的 Direct 展示会上表现得过于保守。尽管 Switch 2 即将迎来第二个假期销售季,但任天堂未能通过足够创新的内容吸引新用户,引发了市场对其战略方向的担忧。

Read more →


Fitbit’s Charge 6 and Ace LTE are now as cheap as the new $100 Air

Fitbit 的 Charge 6 和 Ace LTE 目前价格已降至 100 美元左右,与新款 Air 智能手表持平,为消费者提供了更具性价比的健康追踪选择。

Read more →


苹果公司因未能满足欧盟《数字市场法案》要求,决定不在欧盟推出 AI 版 Siri。苹果此举被视为向欧盟施压,试图让用户将无法使用 AI 功能的责任归咎于欧盟的监管政策。

Read more →


Anthropic releases its first Mythos-class model Claude Fable

Anthropic 发布了 Claude Fable 5,这是其首个广泛发布的 Mythos 级模型。该模型在软件工程和复杂任务处理上表现出色,标志着 Anthropic 在 frontier 模型领域的进一步扩张。

Read more →


SwitchBot’s E Ink Weather Station is already 20 percent off

SwitchBot 刚刚推出的电子墨水屏天气站目前已开启 20% 的折扣优惠,用户可以通过亚马逊优惠券或官网代码以 85 美元的价格购入。

Read more →


Apple is embracing the fantasy of AI photo editing

苹果在 WWDC 2026 上展示了 AI 照片编辑功能,但并未明确区分哪些照片是真实拍摄,哪些是由 AI 生成的。这一做法引发了关于 AI 模糊现实边界的讨论。

Read more →


Ars Technica

SpaceX 的 Starlink 宣布取消一次性硬件购买模式,转而收取每月 10 美元的硬件租赁费,同时将服务价格上调了 5 至 10 美元。

Read more →


Locked in heated rivalry with researcher, Microsoft fixes 0-day they disclosed

微软修复了一个由研究人员 Nightmare Eclipse 披露的零日漏洞。双方此前在漏洞披露问题上存在激烈竞争,此次修复也涵盖了该研究人员披露的另一个相关漏洞。

Read more →


Three key vital signs make up the “urban pulse” of a city

文章探讨了城市作为动态系统的本质,指出城市化是一个“尖峰”、周期性和异步的过程,并提出了衡量城市“脉搏”的三个关键生命体征。

Read more →


Commonwealth Fusion makes the physics case for its 400 MW reactor

Commonwealth Fusion 公司发布了五篇同行评审论文,详细阐述了其 400 兆瓦核聚变反应堆的设计模型和预期输出,为核聚变商业化提供了物理学论证。

Read more →


Paramount accuses Netflix of “scorched-earth campaign” against WBD merger

派拉蒙指责 Netflix 对其与华纳兄弟探索(WBD)的合并案发起了“焦土政策”式的攻击,而 Netflix 则回应称该指控“荒谬”。

Read more →


Anthropic says these topics are too dangerous to let its Fable 5 model talk about

Anthropic 明确了 Claude Fable 5 的安全边界,拒绝回答涉及网络安全、生物学和化学等高风险领域的查询,以防止模型被滥用于制造危险品或进行网络攻击。

Read more →


Google announces Gemini 3.5 Live Translate for instant voice-to-voice translation

谷歌发布了 Gemini 3.5 Live Translate,支持近乎实时的语音到语音翻译,能够保留说话者的语调、节奏和音高,并内置 SynthID 水印以确保安全性。

Read more →


NASA assigns crew for Artemis III, sets aggressive timeline for flying it

NASA 公布了 Artemis III 任务的宇航员名单,并设定了雄心勃勃的飞行时间表,旨在展示人类重返月球的各种可能性。

Read more →


Screwworms in US: Human risk is low—but they can burrow through your skull

美国境内出现螺旋蝇(Screwworms)风险。虽然对人类的直接威胁较低,但这种寄生虫具有钻入人体组织(包括颅骨)的能力,引发了公共卫生关注。

Read more →


One day after discovery, Meta pulls facial recognition code from its smart glasses

在被发现存在隐私隐患后,Meta 迅速从其智能眼镜中移除了面部识别代码,但并未说明具体原因或未来是否会重新启用。

Read more →


Product Hunt

VC Boom

一个帮助创业者评估融资计划书(Deck)、匹配合适投资人并提高融资成功率的平台。

Read more →


Cove for Mac

一款为工作流程设计的“存档/读取”工具,类似于游戏中的存档功能,帮助用户管理工作状态。

Read more →


OrchestraML

一个将自然语言提示词转化为已部署机器学习模型的工具,支持人工审核流程。

Read more →


Limelight

一款旨在让屏幕录制内容更易于理解和跟随的工具。

Read more →


agentcad

一款开源的 CAD 设计工具,专门为 AI 编码代理设计。

Read more →


Uiverse Design

一个旨在清理 AI 生成网站中冗余代码(slop)的设计工具。

Read more →


ZeroGPU

一个专注于 AI 推理计算效率的中间层工具。

Read more →


Whistle

一款提供个性化健身计划的 AI 教练应用。

Read more →


hora Calendar

一款专为 Mac 用户打造的 Google 日历客户端。

Read more →


agmsg

一个旨在解决 AI 编码代理之间复制粘贴繁琐问题的工具。

Read more →


MIT Technology Review

The Download: whole-body rejuvenation drugs and five things to know about AI

本期简报重点介绍了 David Sinclair 关于全身再生药物的 XPrize 竞赛计划,以及关于 AI 发展的五个核心趋势。

Read more →


Learning to lead in a hybrid human-AI enterprise

随着 AI 代理在企业中的采用率预计在两年内增长 300%,领导团队正在重新思考如何管理人类与 AI 协作的混合型劳动力。

Read more →


David Sinclair plans to test whole-body rejuvenation drugs in the XPrize competition

长寿科学家 David Sinclair 计划在 1.01 亿美元的 XPrize 竞赛中测试一种口服“重编程”药物,旨在实现全身细胞再生,让人类年轻 10 岁。

Read more →


Five things you need to know about AI

作者在 SXSW London 大会上分享了当前 AI 领域最重要的五个趋势,涵盖了从技术突破到社会影响的多个维度。

Read more →


The Download: how the World Cup ball will fly and OpenAI’s “super app”

本期简报讨论了世界杯足球的空气动力学设计,以及 OpenAI 正在开发的“超级应用”愿景。

Read more →


Why this year’s World Cup ball will fly as far

分析了今年世界杯足球在美、加、墨三国举办背景下的技术创新,探讨了球体设计对飞行轨迹的影响。

Read more →


The Download: AI hacking beyond Mythos, and chatbots’ impact on our brains

本期简报探讨了 AI 安全性问题,特别是 Meta AI 代理被利用的案例,以及聊天机器人对人类大脑认知模式的潜在影响。

Read more →


Are AI chatbots making us lose control of our brains?

心理学家 Gloria Mark 探讨了人类与数字技术交互的 30 年研究,分析了 AI 聊天机器人如何改变我们的注意力分配和认知习惯。

Read more →


The Meta hack shows there’s more to AI security than Mythos

报道指出,黑客利用 Meta 的 AI 客服代理窃取 Instagram 账户,证明了 AI 安全不仅限于模型本身(如 Mythos),更在于系统集成和权限管理。

Read more →


The Download: AI-generated lawsuits and virtual power plants for data centers

本期简报讨论了法院如何应对 AI 生成的诉讼文件,以及虚拟电厂技术在支持 AI 数据中心能源需求方面的潜力。

Read more →


mvanhorn / last30days-skill

一个 AI 代理技能,能够跨 Reddit、X、YouTube 等平台研究主题并合成总结。

Read more →


RyanCodrai / turbovec

一个基于 TurboQuant 构建的向量索引,使用 Rust 编写并提供 Python 绑定。

Read more →


roboflow / supervision

一套可重用的计算机视觉工具库。

Read more →


opencv / opencv

开源计算机视觉库。

Read more →


refactoringhq / tolaria

一个用于管理 Markdown 知识库的桌面应用。

Read more →


aaif-goose / goose

一个开源、可扩展的 AI 代理,支持安装、执行、编辑和测试代码。

Read more →


Andyyyy64 / whichllm

一个帮助用户根据硬件性能找到最适合本地 LLM 的工具。

Read more →


TapXWorld / ChinaTextbook

包含所有小初高及大学 PDF 教材的资源库。

Read more →


x1xhlol / system-prompts-and-models-of-ai-tools

收集了各类 AI 工具(如 Cursor, Devin, Claude Code 等)的系统提示词和内部模型信息。

Read more →


yikart / AiToEarn

一个关于利用 AI 赚钱的项目集合。

Read more →


OpenAI Blog

How engineers at Nextdoor use Codex to build without limits

Nextdoor 的工程师利用 Codex 和 GPT-5.5 解决难以复现的问题,实现跨平台开发,并专注于产品成果。

Read more →


What Codex unlocks for Notion

Notion 利用 Codex 实现规格说明书的一键生成、构建 AI 语音输入功能,并提升小团队的工程效率。

Read more →


Confidential submission of draft S-1 to the SEC

OpenAI 确认已向美国证券交易委员会(SEC)秘密提交 S-1 注册草案,目前尚未确定后续行动的时间表。

Read more →


Built to benefit everyone: our plan

OpenAI 阐述了其 AI 发展愿景,重点关注 AI 的普及、安全性和共享繁荣,致力于确保 AGI 造福全人类。

Read more →


Introducing the OpenAI Economic Research Exchange

OpenAI 启动经济研究交流项目,旨在研究 AI 对就业、生产力和经济的影响,目前已开放研究项目申请。

Read more →


How Endava is redesigning software delivery around AI agents

Endava 正在利用 AI 代理、ChatGPT Enterprise 和 Codex 加速软件交付,实现工作流自动化并构建 AI 原生文化。

Read more →


Dreaming: Better memory for a more helpful ChatGPT

ChatGPT 引入了新的记忆系统,能够更好地记住用户偏好,在不同对话中保持上下文的新鲜感和相关性。

Read more →


Biodefense in the Intelligence Age

OpenAI 提出了在智能时代加强生物防御的行动计划,旨在提升 AI 驱动的生物韧性。

Read more →


Introducing new capabilities to GPT-Rosalind

GPT-Rosalind 增强了生命科学研究能力,包括生物推理、药物化学、基因组分析和实验工作流支持。

Read more →


How Wasmer used Codex to build a Node.js runtime for the edge

Wasmer 利用 Codex 和 GPT-5.5 构建了边缘 Node.js 运行时,将开发速度提升了 10 到 20 倍。

Read more →


Anthropic Blog

Expanding Project Glasswing

Anthropic 将 Project Glasswing 项目扩展至全球 15 个国家的约 150 个新组织。

Read more →


Introducing Claude Opus 4.8

Claude Opus 4.8 升级版发布,在编码、代理任务和专业工作方面表现更强,并具备处理长周期任务的稳定性。

Read more →


Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas”

Anthropic 联合创始人 Chris Olah 对教皇利奥十四世关于 AI 的通谕《Magnifica humanitas》发表了评论。

Read more →


Widening the conversation on frontier AI

Anthropic 过去几个月一直在组织与不同群体的对话,探讨 AI 带来的社会和伦理问题。

Read more →


Introducing the Services Track and Partner Hub of the Claude Partner Network

Anthropic 介绍了 Claude 合作伙伴网络的“服务轨道”和“合作伙伴中心”。

Read more →


What we learned mapping a year’s worth of AI-enabled cyber threats

Anthropic 分享了其对过去一年 AI 驱动的网络威胁进行映射分析后的发现。

Read more →


Anthropic confidentially submits draft S-1 to the SEC

Anthropic 已向 SEC 秘密提交 S-1 注册草案。

Read more →


Anthropic raises $65B in Series H funding at $965B post-money valuation

Anthropic 完成了 650 亿美元的 H 轮融资,投后估值达到 9650 亿美元。

Read more →


Anthropic opens Milan office to support Italian enterprise, research, and developers

Anthropic 在米兰开设了新办公室,以支持意大利的企业、研究机构和开发者。

Read more →


Google AI Blog

The latest AI news we announced in May 2026

汇总了谷歌在 2026 年 5 月发布的各项 AI 更新。

Read more →


5 ways Google Search can level up your thrift and vintage shopping

介绍了谷歌搜索和购物中利用 AI 工具提升二手和复古商品购物体验的五种方法。

Read more →


How we used Gemini to build Google I/O 2026

分享了谷歌员工如何利用 Gemini 模型来策划和制作 Google I/O 2026 大会。

Read more →


Take our I/O 2026 quiz, vibe coded in Google AI Studio

邀请用户参与由 Google AI Studio “氛围编码”生成的 I/O 2026 知识问答。

Read more →


9 demos of Gemini Omni and Gemini 3.5 in action

展示了 Gemini Omni 和 Gemini 3.5 在 Google I/O 2026 上发布的 9 个演示视频。

Read more →


Check out real-life AI prototypes from the Futures Lab

介绍了滑铁卢大学学生在 Futures Lab 开发的 AI 原型,如手语导师等,旨在重塑教育和工作的未来。

Read more →


Catch up on 12 major I/O 2026 moments

回顾了 Google I/O 2026 的 12 个重要时刻,包括 Gemini Omni 和 Gemini 3.5 Flash 的发布。

Read more →


Catch up on the Dialogues stage at Google I/O 2026

回顾了 I/O 2026 对话舞台的精彩内容,探讨了 AI、量子计算和机器人技术的未来。

Read more →


We’re announcing new community investments in Missouri

谷歌宣布在密苏里州进行新的社区投资,支持下一代劳动力培养和能源项目。

Read more →


100 things we announced at I/O 2026

汇总了 Google I/O 2026 上发布的 100 项公告、发布和演示。

Read more →


Hugging Face Blog

Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech

探讨了语音代理处理双语客户的能力,并对前沿自动语音识别(ASR)模型在语码转换语音上的表现进行了基准测试。

Read more →


Introducing North Mini Code: Cohere’s First Model For Developers

介绍了 Cohere 为开发者推出的首款模型 North Mini Code。

Read more →


分享了一个 AI 代理如何通过串联两个 Hugging Face Spaces 构建 3D 巴黎画廊的案例。

Read more →


Migrating Your GitHub CI to Hugging Face Jobs

介绍了如何将 GitHub CI 工作流迁移到 Hugging Face Jobs。

Read more →


The Open Source Community is backing OpenEnv for Agentic RL

开源社区正在支持 OpenEnv 用于代理强化学习(Agentic RL)。

Read more →


Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI

介绍了 Nemotron 3.5 内容安全功能,为全球企业 AI 提供可定制的多模态安全保障。

Read more →


Designing the hf CLI as an agent-optimized way to work with the Hub

介绍了如何将 Hugging Face CLI 设计为一种代理优化的 Hub 交互方式。

Read more →


Direct Preference Optimization Beyond Chatbots

探讨了超越聊天机器人的直接偏好优化(DPO)技术。

Read more →


Adding MCP Tools to Reachy Mini

介绍了如何为 Reachy Mini 机器人添加 MCP 工具。

Read more →


Holo3.1: Fast & Local Computer Use Agents

介绍了 Holo3.1,一种快速且本地化的计算机使用代理。

Read more →


The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

文章论证了理性人并不具备最终“目标”,AI 也不应被赋予目标,并探讨了基于德性伦理的 AI 对齐路径。

Read more →


AGI Is Not Multimodal

文章认为,将语言视为思维模型会导致我们忽视支撑人类智能的具身理解,AGI 的本质不应局限于多模态。

Read more →


Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

探讨了机器学习研究中数学角色的转变,指出工程优先的规模化努力正在取代数学原则驱动的架构设计。

Read more →


What’s Missing From LLM Chatbots: A Sense of Purpose

指出尽管 LLM 能力不断提升,但用户体验并未同步增长,核心缺失在于聊天机器人缺乏“目的感”。

Read more →


We Need Positive Visions for AI Grounded in Wellbeing

呼吁建立以人类福祉为基础的 AI 积极愿景,反思 AI 对社会产生的深远影响。

Read more →


Financial Market Applications of LLMs

探讨了 LLM 在金融市场中的应用,分析了其在处理序列数据方面的潜力。

Read more →


A Brief Overview of Gender Bias in AI

简要概述并讨论了 AI 系统中存在的性别偏见问题。

Read more →


Mamba Explained

解释了 Mamba 模型,这是一种基于状态空间模型(SSM)的 AI 模型,旨在解决 Transformer 在处理长序列时的效率问题。

Read more →


Car-GPT: Could LLMs finally make self-driving cars happen?

探讨了 LLM 在自动驾驶中的应用潜力,分析了其在信任度和关键挑战方面的表现。

Read more →


Do text embeddings perfectly encode text?

介绍了 ‘Vec2text’ 技术,该技术能将嵌入向量还原为文本,强调了嵌入数据安全协议的紧迫性。

Read more →


arXiv CS.AI

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

提出了一种基于经验感知代理工作流的病理学多源证据裁决系统,旨在解决计算病理学中补丁级推理的幻觉问题。

Read more →


OmniMem: Perturbation-aware Memory Compression for Streaming Audio-Visual LLMs

提出了一种名为 OmniMem 的内存高效流式框架,专门用于解决音频-视觉 LLM 在长视频推理中的 KV 缓存线性增长问题。

Read more →


Syll: Open-Source Personal Automation with Cross-Surface Execution

介绍了 Syll,一个开源、自托管的多模态代理框架,旨在统一 MCP/GUI 接口,实现跨表面执行的个人自动化。

Read more →


A case study of evaluating AI agents on a neuroscience data-to-discovery pipeline

通过神经科学数据发现流水线的案例研究,评估了 AI 代理在自动化科学研究软件开发瓶颈方面的表现。

Read more →


Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning

探讨了在连续潜在推理中引入持久内存的可能性,旨在扩展 CoCoNuT 范式,提升 LLM 在数学和多跳规划任务中的表现。

Read more →


Automatic Extraction of Structured Information from Brain MRI Reports Using an Open-Weight Large Language Model

研究了利用开源 LLM 从荷兰语脑部 MRI 报告中自动提取结构化信息的可行性。

Read more →


Some hypotheses on how chatbots work in problem-solving-driven conversations. Large Language Models as confirmation of the Innovation Illusion

从聚合动力学和认知语言学角度,探讨了聊天机器人在问题解决对话中的本质,并提出了“创新幻觉”的观点。

Read more →


Land cover and flood type govern the detection limits of satellite-based flood mapping across diverse global flood events

研究了土地覆盖和洪水类型如何影响全球洪水事件中卫星洪水测绘的检测极限。

Read more →


arXiv CS.CL

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

介绍了 PolyFact 数据集,旨在通过一致性驱动的强化学习改善 LLM 在跨语言事实召回方面的表现。

Read more →


Re-Centering Humans in LLM Personalization

研究了 LLM 个性化系统在真实用户场景下的表现差距,呼吁在个性化评估中重新以人为中心。

Read more →


UnpredictaBench: A Benchmark for Evaluating Distributional Randomness in LLMs

介绍了 UnpredictaBench 基准测试,用于评估 LLM 在经济模拟等场景下捕捉底层分布随机性的能力。

Read more →


How Language Models Fail: Token-Level Signatures of Committed and Persistent Reasoning Failures

表征了 LLM 推理失败的两种过程,并通过标记级不确定性信号识别了这些失败的特征。

Read more →


CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

介绍了 CAF-Gen,一个用于丰富自然语言文本中论证结构的多代理系统。

Read more →


The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

提出了“搭便车假设”(Piggyback Hypothesis),解释了 LLM 在微调窄任务时产生的广泛涌现失准现象。

Read more →


What Do People Actually Want From AI? Mapping Preference Plurality

探讨了 RLHF 方法在处理冲突偏好时的局限性,并尝试映射人类对 AI 的多元化偏好。

Read more →


介绍了 HKJudge 数据集,这是首个针对香港法院判决的句子级专家标注语料库。

Read more →


WIRED

Great White Sharks Have Been in the Mediterranean Sea for Millions of Years—but Sightings Are Incredibly Rare

报道了地中海大白鲨的罕见目击事件,并探讨了其对保护策略的价值。

Read more →


GM Wants Your Electric Car to Power Your House—and Your Neighborhood

通用汽车正式激活了其电动汽车的“车网互联”(V2G)功能,允许用户利用车辆为家庭和社区供电。

Read more →


MacOS 27 Golden Gate: Top New Features

介绍了 macOS 27 的新功能,重点是 Siri 的重新引入及其在桌面端的全局访问能力。

Read more →


The Top New Features in Apple’s iOS 27 and iPadOS 27

详细介绍了 iOS 27 和 iPadOS 27 的核心升级,特别是 Siri 的 AI 能力提升。

Read more →


Anthropic Offers Mythos Upgrade for Cyber Partners and a ‘Safe’ Version for the Rest of You

Anthropic 发布了 Claude Mythos 5 给受信任组织,并向公众发布了 Claude Fable 5,后者限制了网络攻击相关功能。

Read more →


长寿初创公司启动了 ER-100 细胞再生疗法的首次人体临床试验,旨在逆转与年龄相关的视力丧失。

Read more →


Rivian R2 2026: Specs, Price, Availability

详细介绍了 Rivian R2 的规格、价格和上市信息,分析了其在电动汽车市场的竞争力。

Read more →


The Smart Bird Feeders Everyone’s Talking About (and Actually Buying) (2026)

介绍了当前流行的智能喂鸟器,这些设备配备了摄像头和连接应用,让用户能观察和学习身边的鸟类。

Read more →


Amazon Ember Artline Review: A Stylish Art Television

评测了亚马逊 Ember Artline 艺术电视,认为其设计时尚且性价比极高,足以挑战三星 Frame Pro。

Read more →


The Untold Story of the Google Buses That Took Over San Francisco

回顾了十年前谷歌通勤巴士在旧金山引发的抗议事件,探讨了其对城市交通和社区的长期影响。

Read more →


Lobsters

Test-case Reducers Are Underappreciated Debugging Tools

文章认为测试用例缩减器(Test-case Reducers)是调试过程中被低估的工具。

Read more →


The Decline of Search Engines is an Opportunity

探讨了搜索引擎衰落带来的新机遇。

Read more →


CSS: Unavoidable Bad Parts

讨论了 CSS 中不可避免的“糟糕部分”。

Read more →


An open letter to office suite users, just before the Euro-Office announcement

文档基金会发布的一封致办公套件用户的公开信。

Read more →


Are We Harold Bloom?

探讨了文学批评家 Harold Bloom 的视角在当下的意义。

Read more →


What Yahoo killed when it bought Maktoob

回顾了雅虎收购 Maktoob 后带来的影响。

Read more →


Datatype — variable font that turns text into charts

介绍了一种可以将文本转化为图表的可变字体。

Read more →


Now what?

探讨了在当前技术环境下“接下来该做什么”的问题。

Read more →


DEV Community

AI Usage Statistics 2026: The Structural Shift Behind Adoption, Work, and Hiring

分析了 2026 年 AI 的使用统计数据,指出 AI 已成为组织内部的结构性层,正在重塑工作分配、决策和招聘流程。

Read more →


The Last Computation: A Game About Alan Turing’s Final June

一款关于艾伦·图灵生命最后时刻的游戏,作为 June Solstice Game Jam 的参赛作品。

Read more →


AI image generation with OpenAI API

介绍了如何使用 OpenAI API 进行图像生成,并提供了 Node.js 的实现示例。

Read more →


Field Test #020b — Next.js Root Ownership Refinement

探讨了 Next.js 根所有权问题的修复方案,特别是针对 Turbopack 模块解析的优化。

Read more →


I Was Tired of Writing Commits Like “final_final_v7_ACTUAL_FINAL”

探讨了开发者对 GitHub 贡献图的看法,认为其更多是一种“氛围指标”而非生产力衡量标准。

Read more →


How I built a three-tier content quality ladder for programmatic directory ETL

分享了作者如何为程序化目录网站构建三级内容质量阶梯,以提升自动化内容的质量。

Read more →


Static site search for Astro in 2026: why I picked Pagefind over Algolia and Lunr

分享了作者在 Astro 静态网站中选择 Pagefind 作为搜索方案的理由。

Read more →


How I built pairwise AI model compare pages with Claude Haiku and a budget cap

分享了作者如何利用 Claude Haiku 构建 AI 模型两两对比页面,并有效控制成本。

Read more →


The Capability Curve Has No Memory

探讨了 AI 能力的快速增长及其带来的“递归自我改进”风险,并引用了 Anthropic 关于暂停高级 AI 开发的建议。

Read more →


It Worked on My Machine (Literally)

分享了作者为 TRMNL 电子墨水屏设备编写自定义插件的经历。

Read more →


Meta Engineering

Lights Out, Systems On: Validating Instant Power Loss Readiness

介绍了 Meta 的“瞬时断电风暴”测试范式,旨在验证数据中心在零通知断电情况下的系统韧性。

Read more →


SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems

介绍了 SilverTorch,一种统一的推荐系统检索架构,在计算效率和吞吐量上表现优异。

Read more →


Reel Friends: Building Social Discovery that Scales to Billions

探讨了 Meta 如何构建能够扩展至数十亿用户的社交发现功能(如 Friend Bubbles)。

Read more →


Migrating Data Ingestion Systems at Meta Scale

分享了 Meta 在大规模数据摄取系统迁移过程中的经验和解决方案。

Read more →


Labyrinth 1.1: Making End-to-End Encrypted Backups Even More Reliable

介绍了 Labyrinth 1.1,增强了 Messenger 端到端加密备份的可靠性。

Read more →


How Meta Is Strengthening End-to-End Encrypted Backups

介绍了 Meta 如何利用 HSM(硬件安全模块)加强 WhatsApp 和 Messenger 的端到端加密备份。

Read more →


Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

介绍了 Facebook 群组搜索的现代化改造,采用了混合检索架构以提升社区内容发现效率。

Read more →


Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

分享了 Meta 如何利用 AI 代理平台优化基础设施性能,实现容量效率提升。

Read more →


Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

分享了 Meta 在后量子密码学(PQC)迁移过程中的框架、经验和教训。

Read more →


DeepMind Blog

Fluid, natural voice translation with Gemini 3.5 Live Translate

介绍了 Gemini 3.5 Live Translate,为 Google AI Studio、Translate 和 Meet 提供近乎实时的自然语音翻译。

Read more →


Introducing Gemma 4 12B: a unified, encoder-free multimodal model

介绍了 Gemma 4 12B,一款统一的、无编码器的多模态模型。

Read more →


Powering the future of robotics in Europe

探讨了 DeepMind 如何助力欧洲机器人技术的未来发展。

Read more →


Measuring the impact of learning with AI in Sierra Leone and beyond

分享了在塞拉利昂等地进行的随机对照试验结果,证明了 Gemini 的引导式学习功能对提升学习参与度的潜力。

Read more →


We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks

谷歌在亚太地区启动 DeepMind 加速器项目,旨在利用 AI 解决环境风险问题。

Read more →


Fast-tracking genetic leads to reverse cellular aging

生物学家利用 Co-Scientist 发现了能够成功使人类细胞恢复活力的关键因子。

Read more →


Simulate real-world places with Project Genie and Street View

介绍了 Project Genie 与街景数据的结合,支持在全球范围内模拟真实世界地点。

Read more →


Introducing Gemini Omni

介绍了 Gemini Omni 模型。

Read more →


Introducing Google Antigravity 2.0

介绍了 Google Antigravity 2.0 技术。

Read more →


Gemini for Science: AI experiments and tools for a new era of discovery

介绍了 Gemini for Science 系列工具,旨在扩展科学探索的规模和精度。

Read more →


Microsoft AI Blog

A conversation with Kevin Scott: What’s next in AI

微软 AI 负责人 Kevin Scott 探讨了 AI 的未来发展方向。

Read more →


From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative

介绍了品牌如何利用微软 AI 提升生产力和创造力。

Read more →


Microsoft open sources its ‘farm of the future’ toolkit

微软开源了其“未来农场”工具包。

Read more →


How data and AI will transform contact centres for financial services

探讨了数据和 AI 如何转型金融服务行业的联络中心。

Read more →


AI-equipped drones study dolphins on the edge of extinction

介绍了利用 AI 无人机研究濒危海豚的案例。

Read more →


Online math tutoring service uses AI to help boost students’ skills and confidence

介绍了在线数学辅导服务如何利用 AI 提升学生的技能和信心。

Read more →


AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan

介绍了 AI-Mimi 如何为日本听障用户构建包容性的电视体验。

Read more →


Microsoft’s framework for building AI systems responsibly

介绍了微软负责任地构建 AI 系统的框架。

Read more →


Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade

介绍了新加坡开发的亚洲首款 AI 移动应用,用于识别鲨鱼和鳐鱼鳍,以打击非法野生动物贸易。

Read more →


The opportunity at home – can AI drive innovation in personal assistant devices and sign language?

探讨了 AI 在个人助理设备和手语创新方面的潜力。

Read more →


VentureBeat AI

Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.

谷歌在 25 年来首次重新设计了搜索框,标志着从传统搜索范式向 AI 驱动的交互模式的重大转变。

Read more →


Railway secures $100 million to challenge AWS with AI-native cloud infrastructure

Railway 融资 1 亿美元,旨在通过 AI 原生云基础设施挑战 AWS。

Read more →


Claude Code costs up to $200 a month. Goose does the same thing for free.

对比了 Claude Code 的高昂定价与开源替代品 Goose 的免费优势,引发了开发者对 AI 编码工具成本的讨论。

Read more →


Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews

Listen Labs 在通过病毒式广告牌招聘活动融资 6900 万美元后,旨在扩展其 AI 客户访谈业务。

Read more →


Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI

Salesforce 推出了全新的 Slackbot AI 代理,旨在在职场 AI 领域与微软和谷歌竞争。

Read more →


Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required

Anthropic 推出了 Cowork,一款无需编码即可在本地文件中工作的 Claude 桌面代理。

[Read more →](https://venturebeat.com/technology/anthropic-launches-cowork

生成二维码中...

请点击右上角 ···

选择 发送给朋友收藏