2026-05-29

今日要点


Hacker News

Can we have the day off?

AI 正在引发全球白领工作方式的革命,从生产力提升到社交与学习模式的重塑。然而,这种技术带来的“解放”是否真的能让我们获得更多休息时间,还是仅仅意味着我们需要处理更多的工作,成为了当前讨论的焦点。

Read more →

Claude Opus 4.8

Anthropic 发布了 Claude Opus 4.8,在基准测试中表现更优,并增强了作为协作伙伴的能力。新版本允许用户控制 AI 在任务中投入的精力,旨在提供更精准的辅助。

Read more →

Disagreement among frontier LLMs on real-world fact-checks

一项研究显示,在 1000 个现实世界的事实核查案例中,前沿大模型在 67% 的案例中无法达成共识。这表明即使是顶尖的 LLM,在处理复杂事实判断时仍存在显著的观点分歧或不确定性。

Read more →

FBI Arrests CIA Official with $40M in Gold Bars in His Home

FBI 近期逮捕了一名 CIA 官员,在其家中搜出价值 4000 万美元的金条。此案引发了公众对政府官员腐败及资金来源的广泛关注。

Read more →

Bricks and Minifigs Stole a Man’s $200k Lego Collection

二手乐高商店 Bricks and Minifigs 被指控窃取了一名收藏家价值 20 万美元的乐高藏品,该事件在收藏界引发了关于二手交易安全与信任的讨论。

Read more →

Show HN: Hallucinate – Massively Multiplayer Online Rave

这是一个名为“Hallucinate”的展示项目,旨在创建一个大型多人在线狂欢(Rave)体验,结合了实时生成技术与社交互动。

Read more →

Citing ‘severe’ math deficits, UC faculty demand a return to SAT tests for STEM

加州大学(UC)超过 600 名教职员工(以伯克利分校数学系为首)联名要求恢复 STEM 专业申请者的标准化考试(SAT)要求。他们指出,过去六年的免试政策导致学生数学基础严重下滑,难以应对大学课程。

Read more →

AMD pulls a bait-and-switch on Linux users with Vivado licensing changes

AMD 被指在 Vivado 软件的 Linux 授权上采取了“诱饵式营销”策略,在用户群体深度依赖该工具后,悄然更改了授权条款,引发了开源社区和开发者的强烈不满。

Read more →

Google employee charged with $1M Polymarket insider trading bet on search term

一名 Google 信息安全工程师 Michele Spagnuolo 因涉嫌利用内部机密信息在 Polymarket 上进行内幕交易被联邦检察官起诉。他通过预测歌手 d4vd 的搜索趋势获利 120 万美元。

Read more →

EU fines Temu €200M for allowing sale of illegal products

欧盟委员会对中国电商平台 Temu 处以 2 亿欧元罚款,理由是该平台未能有效识别并阻止非法产品(如危险玩具和劣质充电器)的销售,未能履行其作为平台的监管责任。

Read more →

I analysed 20 years of my chats

作者通过分析自己 20 年来的 120 万条聊天记录,试图构建一个结构化的个人生活档案。这一过程不仅让他重新审视了友谊的半衰期和情感周期,也为个人数据管理提供了独特的视角。

Read more →

New York passes pied-a-terre tax

纽约州立法机构通过了一项针对非主要居所(第二套房)的税收政策。该税收将使价值超过 100 万美元的豪华公寓业主的房产税翻倍,旨在填补纽约市的预算缺口。

Read more →

Just Use Postgres for Durable Workflows

文章探讨了利用 PostgreSQL 实现持久化工作流的方案。通过定期将程序进度检查点保存到数据库,开发者可以确保程序在崩溃后能够从最后一步恢复,从而构建更可靠的系统。

Read more →

Show HN: Continue? Y/N: A 60-second game about AI agent permission fatigue

这是一个 60 秒的短游戏,旨在讽刺当前 AI 代理在执行任务时频繁请求用户授权所带来的“权限疲劳”现象。

Read more →

Anthropic raises $65B in Series H funding at $965B post-money valuation

Anthropic 完成了由 Altimeter Capital 等机构领投的 650 亿美元 H 轮融资,投后估值高达 9650 亿美元。这标志着 Anthropic 在企业级 AI 部署领域的领先地位,并为其即将到来的 IPO 铺平了道路。

Read more →


TechCrunch

The internet is being rebuilt for machines

随着 AI 代理从实验走向生产,AWS 和 Cloudflare 等云基础设施提供商正在重新设计网络架构,以适应未来以机器生成流量为主的互联网,而非传统的人类用户流量。

Read more →

Slate Auto will announce pricing and take preorders for its EV on June 24

贝索斯支持的电动汽车初创公司 Slate Auto 宣布将于 6 月 24 日公布其首款车型的定价并开启预订,该车型预计将于今年年底开始交付。

Read more →

Asana acquires no-code agent-builder StackAI

Asana 宣布收购无代码 AI 代理构建平台 StackAI,旨在将其集成到 Asana 的 AI 工作流工具套件中,进一步增强其企业协作平台的自动化能力。

Read more →

Bluesky embraces long-form content to counter X Articles

社交平台 Bluesky 在最新更新中引入了长文发布功能,旨在与 X 平台的“X Articles”竞争,吸引更多深度内容创作者。

Read more →

Hackers are trying to steal Signal users’ backups in new wave of phishing attacks

黑客正通过新型钓鱼攻击诱骗 Signal 用户泄露其秘密恢复密钥,从而获取用户在线备份中的历史聊天记录。Signal 用户需警惕此类针对备份安全的攻击。

Read more →

Anthropic raises $65 billion, nears $1T valuation ahead of IPO

Anthropic 完成 650 亿美元融资,估值接近 1 万亿美元。这可能是该公司在 IPO 前的最后一轮私募融资,显示了资本市场对 AI 基础设施的极高热情。

Read more →

Just like gold and oil, we’ll soon be able to trade AI token futures

大型交易所正在设计围绕 AI 代币的衍生品。AI 计算能力正逐渐被视为一种原材料,类似于电力或带宽,未来 AI 代币期货交易将成为常态。

Read more →

H1 secures $40M from CVS, proving SaaS startups can still attract investment

医疗数据 SaaS 初创公司 H1 获得 CVS 4000 万美元投资。CEO Ariel Katz 表示,尽管 AI 可以复制通用工作流 SaaS,但 H1 拥有的独特医生数据资产具有不可替代的壁垒。

Read more →

A security lapse at prison pay phone service Pay Tel publicly exposed over 300K callers’ driver’s licenses

监狱电话服务商 Pay Tel 发生安全漏洞,导致超过 30 万名通话者的驾照等敏感身份信息及囚犯通信记录被公开暴露。目前该漏洞已被修复。

Read more →

Why Paris may be the most important AI city outside Silicon Valley

欧洲初创生态系统日益成熟,巴黎正成为硅谷之外最重要的 AI 中心。越来越多的欧洲创始人选择在本土扩张,而非立即迁往美国。

Read more →


The Verge

Nintendo’s newest WarioWare is a weirdo smartphone app

任天堂发布了一款名为 WarioWare 的智能手机应用。尽管任天堂近年来在移动游戏领域表现谨慎,但这款充满怪诞风格的应用依然引发了玩家的关注。

Read more →

Microsoft 365 Copilot gets a speed boost and cleaner design

微软推出了 Microsoft 365 Copilot 的重构版本,不仅设计更简洁,加载速度也提升了一倍,并提供更结构化、易于扫描的响应内容。

Read more →

Amazon’s last-gen Paperwhite is on sale for less than the entry-level Kindle

亚马逊 2021 款 Kindle Paperwhite 正在促销,价格甚至低于入门级 Kindle。由于其具备防水功能,对于泳池或海滩阅读场景来说,这依然是极具性价比的选择。

Read more →

Motorola’s last-gen Razr Ultra is almost half off

摩托罗拉 2025 款 Razr Ultra 折叠屏手机目前在百思买售价降至 699.99 美元,相比 2026 款的高昂定价,这款机型在性能与价格平衡上更具吸引力。

Read more →

The line between games and movies keeps getting blurrier

游戏《007 First Light》通过将教程与叙事深度融合,模糊了游戏与电影的界限,改变了传统游戏教学枯燥乏味的现状。

Read more →

Claude’s new model is more ‘honest’ when it messes up

Anthropic 发布 Claude Opus 4.8,重点强调了模型的“诚实度”。新模型被训练以避免在无法支持的情况下自信地做出断言,从而减少 AI 常见的“幻觉”问题。

Read more →

Here’s where you can preorder the new Oura Ring 5

Oura Ring 5 开启预订,将于 6 月 4 日发布。新款戒指体积缩小了 40%,并增强了 AI 健康教练功能,可在亚马逊和沃尔玛等渠道购买。

Read more →

A $2,000 AI-generated film will make its debut at Tribeca

AI 生成电影《Dreams of Violets》即将在翠贝卡电影节首映。这部 75 分钟的电影仅耗资 2000 美元制作,完全由 AI 生成人物和图像,讲述了伊朗抗议事件的虚构故事。

Read more →

Call of Duty: Warzone is dropping PS4 and Xbox One support later this year

动视宣布《使命召唤:战区》将在今年晚些时候停止对 PS4 和 Xbox One 的支持。玩家需升级至 PS5 或 Xbox Series S/X 才能继续游玩。

Read more →

YouTube takes baby steps to being a real podcast app

YouTube 为 Premium 订阅用户推出了“移动模式”,通过音频优先的布局、简化的播放按钮和章节时间轴,提升了播客收听体验。

Read more →


Ars Technica

LLMs believe false statements even after explicit warnings that they’re false

研究发现,即使在明确警告错误信息的情况下,大模型仍倾向于自信地将错误陈述视为事实。微调测试显示,模型存在将错误信息“内化”并坚持表达的偏见。

Read more →

Fed up with vibe coders, dev sneaks data-nuking prompt injection into their code

一名开发者在 jqwik 库中植入了一个数据删除的提示注入(Prompt Injection),旨在惩罚那些过度依赖 AI 自动生成代码而不进行审查的“氛围编程者”。

Read more →

US healthcare still stupidly expensive, with pathetic outcomes, study finds

研究显示,美国医疗保健系统依然极其昂贵且效果不佳。尽管存在多种改进策略,但美国并未采取有效措施进行改革。

Read more →

Researchers develop a new process to get lithium out of rocks

研究人员开发了一种从岩石中提取锂的新工艺。如果该技术能够规模化,将有助于实现锂资源来源的多元化,降低电池生产成本。

Read more →

FBI says Google engineer used internal search data to win $1.2M on Polymarket

FBI 指控一名 Google 工程师利用内部搜索数据在 Polymarket 上进行内幕交易,获利 120 万美元。该案凸显了科技公司内部数据安全与员工合规的严峻挑战。

Read more →

A respectable port of Age of Empires II: Definitive Edition invades macOS

《帝国时代 II:决定版》正式登陆 macOS。虽然该移植版本质量稳健且支持所有 DLC,但遗憾的是不支持跨平台联机。

Read more →

Apple working to cram massive Gemini model into iPhone to power new Siri

苹果正在努力将 Gemini 大模型压缩至 iPhone 本地运行,以驱动新一代 Siri。分析认为,为了保证性能,云端协同处理可能仍是不可避免的方案。

Read more →

Amazon turns to Jeff Bezos’ other company to do some heavy lifting

亚马逊正在寻求新的发射服务提供商,但由于 ULA 的 Vulcan 火箭仍处于停飞状态,亚马逊不得不转向贝索斯的另一家公司(蓝色起源)来承担重型发射任务。

Read more →

How pigeons exploit magnetic fields for navigation

研究发现,鸽子肝脏中富含铁的免疫细胞可能充当了磁场传感器,作为其内部指南针,帮助它们在飞行中进行导航。

Read more →

Intel makes a bid for handheld gaming PCs with new Arc G3 processors

英特尔发布了 Arc G3 处理器,旨在进军手持游戏 PC 市场。其集成的 Arc B390 GPU 在笔记本电脑上表现出色,有望为掌机提供更强的图形性能。

Read more →


Product Hunt

Pancake

Pancake 是一个 Slack 内部的“OpenClaw”工具,旨在通过自动化流程使公司运营更加自主。

Read more →

Kim Personal Health Assistant

Kim 是 Apple Health 的智能层,旨在为用户提供更深度的个人健康分析与建议。

Read more →

Parastore

Parastore 利用 LLM 驱动的合成消费者来模拟真实商店环境,帮助商家进行市场测试。

Read more →

Pitch Agent

Pitch Agent 是一款演示文稿生成工具,能够在几秒钟内生成符合品牌调性的专业演示文稿。

Read more →

Buffer API

Buffer API 提供了一个统一的接口,支持将内容发布到所有主流社交平台。

Read more →

Revolte

Revolte 是一款专为软件工程设计的 AI 工具,旨在提升开发效率与代码质量。

Read more →

Memori

Memori 专注于从代理的执行轨迹中提取持久化记忆,而不仅仅是基于对话历史。

Read more →

Robinhood Agentic Trading

Robinhood 推出的代理交易功能,允许用户设置 AI 代理自动执行交易策略。

Read more →

SoMerch

SoMerch 为分布式团队提供端到端的周边商品定制与分发服务。

Read more →

Compartment

Compartment 是一个开源运行时环境,专门用于管理团队内部的软件工具。

Read more →


MIT Technology Review

How a new extraction process could unlock the world’s lithium

研究人员在《科学》杂志发表了一种新型锂提取工艺,该方法比现有技术更环保且成本更低。初创公司 Rock Zero 正致力于将其商业化,以缓解电动汽车电池原材料的短缺。

Read more →

The Download: climate tech goes public and the AI Hype Index returns

本期简报关注气候科技公司的 IPO 浪潮,以及 AI 炒作指数的回归。随着 Solv Energy 和 X-energy 等公司上市,气候科技正成为资本市场的新宠。

Read more →

Climate tech companies are going public. What’s next?

今年美国能源公司 IPO 频现,Solv Energy 和 X-energy 等公司上市后表现强劲。这标志着气候科技行业正从早期的风险投资阶段迈向成熟的公开市场。

Read more →

The AI Hype Index: AI gets booed in graduation season

AI 炒作指数显示,公众对 AI 的态度正在发生微妙变化。前 Google CEO Eric Schmidt 在亚利桑那大学毕业典礼上谈论 AI 时遭到学生嘘声,反映出年轻一代对 AI 叙事的怀疑。

Read more →

The Download: keeping up with AI, and the future of IVF

本期简报探讨了 AI 发展的快节奏以及 IVF(体外受精)技术的未来,旨在帮助读者在信息过载的时代保持对前沿科技的关注。

Read more →

Rethinking organizational design in the age of agentic AI

尽管 85% 的组织希望在三年内实现“代理化”,但 76% 的组织承认其基础设施和流程尚不支持这一转型。企业需要重新思考组织架构以适应 AI 代理的普及。

Read more →

The Download: puncturing the AI jobs panic

本期简报对“AI 将导致大规模失业”的恐慌进行了现实核查。尽管科技行业裁员不断,但目前尚无证据表明 AI 对白领就业市场产生了大规模的负面影响。

Read more →

A reality check on the AI jobs hysteria

文章指出,虽然 AI 正在改变工作方式,但关于“AI 毁灭白领工作”的叙事被过度夸大了。在辞职或改变职业规划前,应理性看待 AI 对生产力的实际影响。

Read more →

It’s time to address the looming crisis in entry-level work.

AI 尚未导致大规模失业,但它正在悄然削弱入门级工作的价值。这种“第一级台阶”的缺失可能对年轻人才的职业发展产生深远影响。

Read more →

The Download: coding’s future, the ‘Steroid Olympics,’ and AI-driven science

本期简报回顾了 Anthropic 的开发者活动,探讨了 AI 驱动的编程未来、类固醇奥运会以及 AI 在科学发现中的应用。

Read more →


harry0703 / MoneyPrinterTurbo

利用 AI 大模型,一键生成高清短视频。

Read more →

affaan-m / ECC

代理性能优化系统,为 Claude Code、Cursor 等提供技能、记忆与研究支持。

Read more →

Leonxlnx / taste-skill

赋予 AI 更好的“品味”,防止生成平庸、通用的内容。

Read more →

hardikpandya / stop-slop

用于移除 AI 生成文本中“AI 味”的技能文件。

Read more →

twentyhq / twenty

专为 AI 设计的 Salesforce 开源替代品。

Read more →

DigitalPlatDev / FreeDomain

为所有人提供免费域名的平台。

Read more →

byoungd / English-level-up-tips

离谱的英语学习指南,提供进阶学习技巧。

Read more →

microsoft / markitdown

Python 工具,用于将各类文件和 Office 文档转换为 Markdown 格式。

Read more →

obra / superpowers

代理技能框架与软件开发方法论。

Read more →

revfactory / harness

元技能框架,用于设计特定领域的代理团队并定义其专业技能。

Read more →


OpenAI Blog

OpenAI’s Frontier Governance Framework

OpenAI 发布了前沿治理框架,旨在确保其 AI 安全、安保和风险管理实践与欧盟及加州的监管要求保持一致。

Read more →

Cisco and OpenAI redefine enterprise engineering with Codex

思科与 OpenAI 合作,利用 Codex 扩展 AI 原生开发,加速 AI 防御工作并自动化缺陷修复。

Read more →

Building self-improving tax agents with Codex

OpenAI 与 Thrive、Crete 合作,利用 Codex 构建了自改进税务代理,实现了税务申报自动化并提高了准确性。

Read more →

Election information and safeguards in 2026

为应对 2026 年全球选举,OpenAI 致力于帮助公众获取准确信息,支持网络防御者,并提高 AI 透明度。

Read more →

Warp’s big bet on building open source with GPT-5.5

Warp 利用 GPT-5.5 协调本地、云端和开源开发工作流中的编码代理。

Read more →

OpenAI, Grupo Folha and Grupo UOL announce strategic content partnership

OpenAI 与巴西媒体集团 Grupo Folha 和 Grupo UOL 达成战略合作,将可信的新闻内容引入 ChatGPT。

Read more →

OpenAI named a Leader in enterprise coding agents by Gartner

OpenAI 被 Gartner 评为 2026 年企业 AI 编码代理领域的领导者,Codex 因其创新性和企业级部署能力受到认可。

Read more →

How Virgin Atlantic ships faster with Codex

维珍大西洋航空利用 Codex 加速移动应用开发,在固定期限内实现了近乎 100% 的单元测试覆盖率和零 P1 级缺陷。

Read more →

AdventHealth advances whole-person care with OpenAI

AdventHealth 利用 ChatGPT for Healthcare 简化工作流,减少行政负担,将更多时间回归到患者护理中。

Read more →

The next phase of OpenAI’s Education for Countries

OpenAI 推进“国家教育计划”,通过新的合作伙伴关系、教师培训和工具,改善全球学习成果。

Read more →


Anthropic Blog

Introducing Claude Design by Anthropic Labs

Anthropic Labs 推出 Claude Design,允许用户与 Claude 协作创建 polished 的视觉作品,如设计稿、原型、幻灯片等。

Read more →

Claude is a space to think

Anthropic 承诺 Claude 将保持无广告状态,认为广告激励与构建真正有用的 AI 助手目标不兼容。

Read more →

Anthropic opens Milan office to support Italian enterprise, research, and developers

Anthropic 在米兰开设办事处,以支持意大利的企业、研究机构和开发者。

Read more →

Anthropic appoints KiYoung Choi as Representative Director of Korea ahead of Seoul office opening

Anthropic 任命 KiYoung Choi 为韩国代表董事,为首尔办事处的开设做准备。

Read more →

Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas”

Anthropic 联合创始人 Chris Olah 对教皇利奥十四世的通谕《Magnifica humanitas》发表了评论。

Read more →

Widening the conversation on frontier AI

Anthropic 致力于扩大关于前沿 AI 的对话,促进多方参与。

Read more →

KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance

毕马威(KPMG)与 Anthropic 达成战略联盟,将 Claude 集成到其 27.6 万名员工的核心业务中。

Read more →

Anthropic acquires Stainless

Anthropic 宣布收购 Stainless。

Read more →


Google AI Blog

Catch up on 12 major I/O 2026 moments

回顾 Google I/O 2026 的 12 个关键时刻,包括 Gemini Omni 和 Gemini 3.5 Flash 的发布。

Read more →

Catch up on the Dialogues stage at Google I/O 2026.

回顾 I/O 2026 对话舞台,领导者们讨论了 AI、量子计算、机器人技术和创造力的未来。

Read more →

We’re announcing new community investments in Missouri.

Google 宣布在密苏里州进行新的社区投资,旨在构建下一代劳动力并支持能源项目。

Read more →

100 things we announced at I/O 2026

Google I/O 2026 的 100 项公告汇总。

Read more →

A new experiment brings better group meetings to Google Beam

Google Beam 的一项新实验,通过逼真的音视频效果,使混合会议更具包容性和连接感。

Read more →

I/O 2026

Google I/O 2026 全面回顾,展示了如何让 AI 对每个人都更有帮助。

Read more →

How AI Mode is changing the way people search in the U.S.

AI Mode 发布一年后,用户搜索习惯已从关键词转向自然语言查询。

Read more →

New ways to create and get things done in Google Workspace

Google Workspace 引入 Gmail、Docs 和 Keep 的语音功能,以及新设计工具 Google Pics 和 AI Inbox 更新。

Read more →

I/O 2026: Welcome to the agentic Gemini era

Google I/O 宣布进入代理化 Gemini 时代,展示了如何通过 Gemini 提高生产力。

Read more →

Gemini 3.5: frontier intelligence with action

Google 发布 Gemini 3.5 系列模型,结合了前沿智能与执行能力。

Read more →


Hugging Face Blog

ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks

Artificial Analysis 和 IBM 发布了首个针对企业 IT 任务的代理基准测试 ITBench-AA,前沿模型得分均低于 50%。

Read more →

Reachy Mini goes fully local

Reachy Mini 机器人实现完全本地化运行。

Read more →

Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL

介绍 TRL 中的 Delta Weight Sync 技术,用于高效同步万亿参数模型。

Read more →

Harness, Scaffold, and the AI Agent Terms Worth Getting Right

探讨 AI 代理领域中 Harness、Scaffold 等术语的准确定义。

Read more →

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

介绍 Nemotron-Labs 扩散语言模型,旨在实现极速文本生成。

Read more →

Specialization Beats Scale: A Strategic Variable Most AI Procurement Decisions Overlook

文章指出,专业化优于规模化,这是大多数 AI 采购决策中被忽视的战略变量。

Read more →

OlmoEarth v1.1: A more efficient family of Earth observation models

发布更高效的地球观测模型系列 OlmoEarth v1.1。

Read more →

Introducing the Ettin Reranker Family

介绍 Ettin 重排序模型系列。

Read more →

PaddleOCR 3.5: Running OCR and Document Parsing Tasks with a Transformers Backend

PaddleOCR 3.5 支持使用 Transformers 后端运行 OCR 和文档解析任务。

Read more →

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context

发布 Granite Embedding Multilingual R2,支持 32K 上下文,是 100M 参数以下检索质量最好的开源模型。

Read more →


The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

文章论证了理性的人不应有最终“目标”,AI 也不应有。人类行为的理性在于将行动与实践对齐,而非追求单一目标。

Read more →

AGI Is Not Multimodal

文章指出,将语言作为思维模型会导致我们忽视构成人类智能的具身理解。AGI 不应仅仅是多模态的。

Read more →

Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

过去十年,机器学习研究从数学驱动转向了计算密集型和工程优先的规模化路径。

Read more →

What’s Missing From LLM Chatbots: A Sense of Purpose

尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升。文章认为,AI 聊天机器人缺乏“目的感”。

Read more →

We Need Positive Visions for AI Grounded in Wellbeing

我们需要基于人类福祉的 AI 积极愿景,而非仅仅关注技术冲击。

Read more →

Financial Market Applications of LLMs

探讨了 LLM 在金融市场中的应用,特别是其在处理序列数据方面的潜力。

Read more →

A Brief Overview of Gender Bias in AI

简要概述并讨论了 AI 中的性别偏见问题。

Read more →

Mamba Explained

解释了 Mamba 模型,这是一种基于状态空间模型(SSM)的 AI 模型,是 Transformer 的有力替代者。

Read more →

Car-GPT: Could LLMs finally make self-driving cars happen?

探讨 LLM 在自动驾驶中的应用潜力及面临的挑战。

Read more →

Do text embeddings perfectly encode text?

文章指出,Vec2text 可以将嵌入还原为文本,强调了嵌入数据安全协议的紧迫性。

Read more →


arXiv CS.AI

Identifying and Understanding Human Values in Text: A Tailorable LLM-based Architecture

提出了一种基于 LLM 的可定制架构,用于识别和理解文本中的人类价值观,以实现更符合伦理的决策机制。

Read more →

Soro: A Lightweight Foundation Model and Chatbot for Tajik

发布 Soro,这是一个专为塔吉克语设计的轻量级基础模型和聊天机器人,适用于计算和连接受限的环境。

Read more →

On the Origin of Synthetic Information by Means of Steganographic Inheritance

探讨合成信息的起源,类比生物进化,提出隐写继承的概念。

Read more →

DynaSchedBench: Calibrated Dynamic Scheduling Benchmarks and Observability Paradox in LLM-based Scheduling Agents

提出 DynaSchedBench,用于解决 LLM 调度代理在动态柔性作业车间调度问题中的基准过拟合问题。

Read more →

Why LLMs Fail at Causal Discovery and How Interventional Agents Escape

分析了 LLM 在因果发现中失败的原因,并探讨了干预代理如何克服这些局限。

Read more →

RULER: Representation-Level Verification of Machine Unlearning

提出 RULER,一种用于机器遗忘验证的表示级方法,解决了现有输出级验证的局限性。

Read more →

LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation

提出 LaneRoPE,一种用于协作并行推理和生成的旋转位置编码技术。

Read more →

Discovery Agents for Real-Time Analytics: Toward Proactive Insight Systems

提出用于实时分析的发现代理,旨在构建主动洞察系统,解决传统反应式分析的局限。

Read more →


arXiv CS.CL

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

提出 ICG,通过 MLLM 提示和个性化偏好对齐来改进封面图像生成。

Read more →

LCO: LLM-based Constraint Optimization for Safer Agentic LLMs in Real-world Tasks

提出 LCO,一种基于 LLM 的约束优化方法,用于提高现实任务中代理 LLM 的安全性,防止奖励黑客行为。

Read more →

Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models

提出一种在提示驱动的 TTS 模型中实现细粒度、话语内说话风格控制的方法。

Read more →

RAG-Coding: Enhancing LLM Medical Coding with Structured External Knowledge

提出 RAG-Coding,一种利用结构化外部知识增强 LLM 医学编码的代理方法。

Read more →

OralAgent: Integrating Reasoning, Tools, and Knowledge for Interactive Dental Image Analysis

提出 OralAgent,集成推理、工具和知识,用于交互式牙科图像分析。

Read more →

BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking

提出 BioELX,一种通过别名检索和 LLM 排序实现的跨语言生物医学实体链接方法。

Read more →

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

探讨如何通过合成数据缩放和偏好对齐,弥合低资源口语模型在稳定性和表达能力之间的差距。

Read more →

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

提出一种将自回归(AR)模型高效适配为扩散模型的方法,利用严格因果和弹性视界。

Read more →


WIRED

The $6 Billion Chinese Startup Trying to Build Hands for Every Robot

中国初创公司 LinkerBot 估值 60 亿美元,致力于制造低成本(600 美元)的灵巧机器人手,旨在成为人形机器人和自动化工厂的标准。

Read more →

Meta Copies Snapchat’s Homework Again With ‘Plus’ Features for Instagram and Facebook

Meta 即将推出 Instagram Plus 和 Facebook Plus 订阅服务,再次被指模仿 Snapchat 的商业模式。

Read more →

The Pentagon Knew Enemies Could Track Troops’ Phones for Years. Now They Are

五角大楼长期以来已知晓士兵手机位置数据可能被敌方追踪,但未能采取有效措施,导致士兵在战争中成为目标。

Read more →

Here Comes Ojai, Waymo’s New Chinese-Made Robotaxi

Waymo 推出中国制造的 Ojai 自动驾驶出租车,将于未来几周在加州和亚利桑那州投入运营。

Read more →

Oura’s New Ring 5 Is Smaller and Lighter—and Adds an AI Health Coach

Oura Ring 5 更轻薄,并增加了 AI 健康教练功能,提供主动健康监测。

Read more →

Cotopaxi Allpa 35L Travel Pack Del Día Dark: Sustainable and Chic

Cotopaxi 推出由废料制成的可持续旅行包,既环保又时尚。

Read more →

New Moms Are Returning to Coding Jobs Radically Reshaped by AI

重返职场的母亲们发现,软件开发工作已被 AI 彻底重塑,她们正面临一个几乎陌生的工作环境。

Read more →

Canon EOS R6 Mark III Review: A Serious Upgrade

佳能 EOS R6 Mark III 评测:凭借更高的分辨率和极速性能,这款全画幅无反相机表现远超同类产品。

Read more →

These Ebola Researchers Are Stuck in US Due to Trump’s Funding Cuts

由于特朗普政府的资金削减,埃博拉研究人员被困在美国,无法继续其在海外的传染病研究。

Read more →

Amazon Thinks the Future of Data Centers Depends on a Technical Problem It Just Solved

亚马逊声称在数据中心网络技术上取得突破,大幅加速了云基础设施中的信息流,认为这将决定数据中心的未来。

Read more →


Lobsters

Why Gentoo?

讨论 Gentoo Linux 的优势与选择理由。

Read more →

Garnix is shutting down

Garnix 宣布关闭。

Read more →

What’s cooking on SourceHut? Q2 2026

SourceHut 2026 年第二季度开发动态。

Read more →

Announcing Rust 1.96.0

Rust 1.96.0 版本发布公告。

Read more →

Nitpicking the shell history scene in ‘Tron: Legacy’

对电影《创:战纪》中 Shell 历史记录场景的细节考究。

Read more →

GNOME 2.20 but its Web Components

使用 Web Components 重构 GNOME 2.20 界面。

Read more →

Protestware for coding agents

针对编码代理的“抗议软件”。

Read more →

A Love Letter to Neovim

Neovim 的情书。

Read more →

jjc: Non-interactive hunk-level operations for Jujutsu

Jujutsu 的非交互式 hunk 级操作工具 jjc。

Read more →

Interview with Zig creator Andrew Kelley

Zig 语言创始人 Andrew Kelley 访谈。

Read more →


DEV Community

Why I chose MCP over RAG for live infrastructure auditing

作者在分布式硬件基础设施审计项目中,选择使用 MCP(Model Context Protocol)而非 RAG,以实现更精准的实时审计。

Read more →

I built a premium AI Dashboard UI Template with clean file separation. Offering it 100% FREE!

作者分享了一个生产就绪的 AI 仪表板 UI 模板,强调了清晰的文件分离架构,而非混乱的单文件 AI 输出。

Read more →

Build Power BI Columns That Adapt to Each User

介绍 Power BI 中基于用户上下文的计算列设计,使数据分析更具个性化。

Read more →

How hard can it be to build a CI/CD system?

作者分享了自己从零构建 CI/CD 系统的经历,探讨了其中的挑战与乐趣。

Read more →

Is it common to crave for a Super Accessible ASI without giving up Human Creativity?

探讨开发者对超级人工智能(ASI)的渴望,以及如何在利用 AI 的同时保持人类创造力。

Read more →

I Built a Delhi Metro Route Planner In React with GSAP

作者使用 React 和 GSAP 构建了一个免费的德里地铁路线规划器,解决了用户在交互体验上的痛点。

Read more →

173 Undocumented Security Findings in TerraGoat: What Standard IaC Scanners Miss (and Why Post-Quantum Matters)

文章揭示了 TerraGoat 中 173 个未记录的安全漏洞,探讨了标准 IaC 扫描器的局限性及后量子安全的重要性。

Read more →

The Dark Art of Veltrix Configuration: How I Learned to Stop Worrying and Love the Metrics

分享了在 Veltrix 系统中优化 Treasure Hunt Engine 的经验,强调了指标监控在生产环境中的重要性。

Read more →

Why I built the HuggingFace for RL agents — and why RL needs one

作者构建了强化学习(RL)代理的“HuggingFace”,旨在解决 RL 领域计算资源受限的问题。

Read more →

TRM Grew ChatGPT Referrals 8,337% in 90 Days. I Copied Their 4 LLMO Pillars Onto 3 Indie Sites. Only 1 Moved the Needle.

作者尝试复制某 SEO 机构的 LLMO(大模型优化)策略,结果发现效果并不如预期,强调了策略执行的复杂性。

Read more →


Meta Engineering

SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems

Meta 推出 SilverTorch,一种将所有检索组件统一为单一架构的推荐系统,吞吐量提升 23.7 倍,计算成本效率提升 20.9 倍。

Read more →

Reel Friends: Building Social Discovery that Scales to Billions

探讨 Meta 如何构建可扩展至数十亿用户的社交发现功能“Reel Friends”。

Read more →

Migrating Data Ingestion Systems at Meta Scale

分享 Meta 在大规模数据摄取系统迁移中的经验与解决方案。

Read more →

Labyrinth 1.1: Making End-to-End Encrypted Backups Even More Reliable

Meta 推出 Labyrinth 1.1,增强了 Messenger 端到端加密备份的可靠性。

Read more →

How Meta Is Strengthening End-to-End Encrypted Backups

介绍 Meta 如何利用 HSM(硬件安全模块)加强 WhatsApp 和 Messenger 的端到端加密备份。

Read more →

Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

Meta 改造了 Facebook 群组搜索,采用混合检索架构和自动化模型评估,提升了社区内容的发现效率。

Read more →

Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

Meta 利用 AI 代理平台自动化基础设施性能优化,节省电力并释放工程师时间。

Read more →

Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

分享 Meta 在后量子密码学(PQC)迁移中的框架与经验,帮助其他组织增强抗量子攻击能力。

Read more →

Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases

分享 Meta 如何通过构建双向同步机制,摆脱 WebRTC 内部版本与上游脱节的“分叉陷阱”。

Read more →


DeepMind Blog

We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks

Google DeepMind 在亚太地区启动加速器项目,旨在利用 AI 应对环境风险。

Read more →

Fast-tracking genetic leads to reverse cellular aging

生物学家利用 Co-Scientist 发现逆转人类细胞衰老的新遗传因子。

Read more →

Simulate real-world places with Project Genie and Street View

Project Genie 结合 Street View,支持在全球范围内模拟真实世界地点。

Read more →

Introducing Gemini Omni

介绍 Gemini Omni 模型。

Read more →

Introducing Google Antigravity 2.0

介绍 Google Antigravity 2.0。

Read more →

Gemini for Science: AI experiments and tools for a new era of discovery

发布 Gemini for Science 工具集,旨在扩展科学探索的规模与精度。

Read more →

Making it easier to understand how content was created and edited

Google 扩展工具,帮助用户了解网络内容的创建与编辑过程。

Read more →

Strengthening Singapore’s AI Future: A New National Partnership

Google DeepMind 与新加坡达成国家级合作伙伴关系,在健康、教育和可持续发展领域应用前沿 AI。

Read more →

Finding the molecular switches behind new infectious diseases

研究人员利用 Co-Scientist 识别新兴传染病的遗传触发因素。

Read more →

Opening new paths in aging research

Calico Life Sciences 利用 Co-Scientist 连接分散的研究发现,生成衰老研究的新线索。

Read more →


Microsoft AI Blog

A conversation with Kevin Scott: What’s next in AI

与 Kevin Scott 对话,探讨 AI 的未来发展。

Read more →

From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative

探讨品牌如何利用微软 AI 提升生产力与创造力。

Read more →

Microsoft open sources its ‘farm of the future’ toolkit

微软开源其“未来农场”工具包。

Read more →

How data and AI will transform contact centres for financial services

探讨数据与 AI 如何转型金融服务行业的联络中心。

Read more →

AI-equipped drones study dolphins on the edge of extinction

AI 无人机研究濒危海豚。

Read more →

Online math tutoring service uses AI to help boost students’ skills and confidence

在线数学辅导服务利用 AI 提升学生的技能与信心。

Read more →

AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan

AI-Mimi 为日本听障用户构建包容性电视体验。

Read more →

Microsoft’s framework for building AI systems responsibly

微软负责任地构建 AI 系统的框架。

Read more →

Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade

新加坡开发亚洲首个 AI 鲨鱼和鳐鱼鳍识别应用,以打击非法野生动物贸易。

Read more →

The opportunity at home – can AI drive innovation in personal assistant devices and sign language?

探讨 AI 在个人助理设备和手语创新中的机会。

Read more →


VentureBeat AI

Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.

Google 在 I/O 大会上宣布彻底重构搜索框,标志着 25 年来搜索范式的重大转变,从关键词转向 AI 驱动的自然语言交互。

Read more →

Railway secures $100 million to challenge AWS with AI-native cloud infrastructure

云平台 Railway 完成 1 亿美元 B 轮融资,旨在通过 AI 原生基础设施挑战 AWS。

Read more →

Claude Code costs up to $200 a month. Goose does the same thing for free.

文章对比了 Anthropic 的 Claude Code 与免费替代品 Goose,指出 AI 编码工具的高昂成本正引发开发者社区的“反叛”。

Read more →

Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews

Listen Labs 完成 6900 万美元融资,此前曾通过病毒式广告牌招聘活动成功吸引人才。

Read more →

Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI

Salesforce 发布重构后的 Slackbot AI 代理,旨在在职场 AI 竞争中对抗微软和 Google。

Read more →

Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required

Anthropic 发布 Cowork,这是一款无需编码即可在本地文件上工作的 Claude Desktop 代理,团队仅用一周半时间开发完成。

Read more →

Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research 发布 NousCoder-14B,这是一款高性能开源编码模型,旨在与 proprietary 系统竞争。

Read more →


arXiv CS.LG

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

提出个性化观测归一化方法,用于解决异构模拟环境下的联邦强化学习问题。

Read more →

IGADA-IoT: IoT Sensor Energy Optimization in Wireless Sensor Networks Driven by Automatic Data Augmentation

提出 IGADA-IoT,利用自动数据增强优化无线传感器网络中的 IoT 传感器能耗。

Read more →

A Simple State Space Model Excels at Multivariate Time Series Classification

提出一种简单的状态空间模型,在多元时间序列分类任务中表现优异。

Read more →

$E^3$-Agent: An Executable and Evolving Agent for Resource Management of Edge Generative Inference

提出 $E^3$-Agent,一种用于边缘生成推理资源管理的可执行且进化的代理。

Read more →

Tackling Multimodal Learning Challenges with Mixture-of-Expert: A Survey

对利用混合专家(MoE)模型解决多模态学习挑战进行了系统综述。

Read more →

Metric-Aware PCA as a Linear Instance of Geometric Deep Learning

将度量感知 PCA 视为几何深度学习的线性实例。

[Read more →](/news/2026-0

生成二维码中...

请点击右上角 ···

选择 发送给朋友收藏