2026-06-09

今日要点


Hacker News

Dopamine Fracking

多巴胺压裂:一种对休闲或复杂活动进行过度资源投入(如资金、算法优化、群体意见聚合等)的行为,旨在不计代价地榨取最纯粹、最集中的多巴胺快感。

Read more →


Show HN: Performative-UI – A react component library of design tropes

这是一个基于 React 的组件库,专门收集并实现了各种设计套路(tropes),旨在帮助开发者快速构建具有特定视觉风格的界面。

Read more →


Stop the Apple Music app from launching

针对 macOS 用户常遇到的 Apple Music 自动启动问题,该工具(Music Decoy)允许用户配置媒体播放键的行为,使其在按下播放键时启动其他音乐应用(如 Spotify),从而绕过系统默认的 Apple Music。

Read more →


Anti-social: It’s fads, not friends, which now dominate social media feeds

社交媒体平台正经历从“朋友间沟通”向“短视频娱乐中心”的转型。文章探讨了这种以增加用户停留时间和广告收入为核心的商业模式,以及由此引发的消费者反弹。

Read more →


MiMo-v2.5-Pro-UltraSpeed: 1T model with 1000 tokens per second

MiMo-v2.5-Pro-UltraSpeed 是一款拥有 1 万亿参数的 AI 模型,其推理速度达到了惊人的每秒 1000 个 token。文章指出,AI 推理速度的提升正在重新定义智能的边界,使模型从等待工具转变为人类能力的延伸。

Read more →


A Farmer Donated Land to Turn into a Park. The City Is Building a Data Center

德克萨斯州泰勒市的一块土地曾由农场主于 1999 年以象征性费用捐赠给城市,条件是必须用作公共公园。然而,该市在 2025 年将其出售给数据中心开发商 Blueprint,引发了关于公共土地用途与商业利益冲突的争议。

Read more →


DeepSeek V4 Pro beats GPT-5.5 Pro on precision

DeepSeek V4 Pro 在精度测试中以 38.0 对 33.0 的比分击败了 GPT-5.5 Pro。测试显示,DeepSeek 在处理复杂约束(如 Python 日志重写)时表现得更加严谨和可靠,而 GPT-5.5 则倾向于过度发挥。

Read more →


How much of Thermo Fisher’s antibody data has been manipulated?

研究人员指出,截至 2026 年 6 月,在 Thermo Fisher Scientific 的在线抗体目录中发现了超过 450 张存在图像操纵迹象的验证数据。该发现由 Sholto David 等人整理并发布在 Zenodo 上。

Read more →


The Cypherpunk Library

这是一个个人整理的公共领域书籍收藏库,旨在提供免费的阅读资源。作者强调该书架完全公开,并建议用户通过 Anna’s Archive 或 LibGen 获取更多资源。

Read more →


xAI is looking more like a datacentre REIT than a frontier lab

xAI 在与 Anthropic 和 Google 达成容量租赁合作后,其角色正逐渐从前沿 AI 实验室转变为数据中心房地产投资信托(REIT)。随着 xAI 与 SpaceX 的合并,其业务重心似乎正向基础设施租赁倾斜。

Read more →


AI is slowing down

文章分析了 AI 行业的发展现状,指出尽管技术在进步,但 AI 泡沫的财务分析显示出增长放缓的迹象。作者通过对 NVIDIA、Anthropic 和 OpenAI 的财务深度剖析,探讨了 AI 行业未来的可持续性。

Read more →


Siri AI

苹果宣布了新一代 Apple Intelligence 和 Siri AI,强调其深度集成于应用中、基于用户上下文且具备高度隐私保护。Siri AI 的英文版本预计将于今年晚些时候推出。

Read more →


The Smallest Brain You Can Build: A Perceptron in Python

文章通过在 Python 中从零构建一个感知机(Perceptron),向读者展示了神经网络最基础的运作原理。这是一个简单的“输入-输出”模型,却是现代所有复杂神经网络的基石。

Read more →


1k Data Breaches Later, the Disclosure Lag Is Worse

Have I Been Pwned 平台记录了第 1000 起数据泄露事件。作者反思了在 GDPR 等隐私法规实施 12 年后,数据泄露披露延迟问题为何依然严重,并质疑了当前安全披露机制的有效性。

Read more →


Apple reveals new AI architecture built around Google Gemini models

苹果宣布对其 Apple Intelligence 平台进行重大架构升级,新系统基于与 Google 合作开发的模型技术(Gemini 系列)。这一举措旨在提升苹果设备的 AI 处理能力,并更好地适应端侧运行需求。

Read more →


TechCrunch

As OpenAI files for IPO, Sam Altman’s eye-scanning company is doing layoffs, report says

在 OpenAI 申请 IPO 之际,Sam Altman 旗下的身份验证公司 Tools for Humanity 却因营收困难面临裁员。

Read more →


Apple’s WWDC AI demos looked more real after $250M false ad settlement

在支付了 2.5 亿美元的虚假广告和解金后,苹果在 WWDC 2026 上的 AI 演示显得更加务实和真实,避免了过度夸大功能。

Read more →


OpenAI files confidentially for IPO, following Anthropic

继 Anthropic 上周秘密提交 IPO 申请后,OpenAI 也正式向 SEC 提交了 S-1 文件,两大 AI 巨头的上市竞争进入白热化阶段。

Read more →


Apple plays catch-up at WWDC

苹果在 WWDC 上重点展示了软件性能修复和功能改进,随后才推出 AI 驱动的 Siri。这表明苹果希望将 AI 定位为提升整体用户体验的一部分,而非单一卖点。

Read more →


Apple bets cheaper AI will woo small developers

为了吸引小型开发者,苹果宣布对下载量低于 200 万次的开发者免除云端 AI API 的使用费用,以降低 AI 应用的开发门槛。

Read more →


Waymo bought Apple’s self-driving car proving ground for $220M

Waymo 以 2.2 亿美元收购了位于亚利桑那州的一处 5500 英亩的自动驾驶测试场,该场地此前由苹果关联的空壳公司持有。

Read more →


Microsoft’s open source tools were hacked to steal passwords of AI developers

微软因 GitHub 存储库遭到黑客攻击,导致 Azure 和 AI 开发工具的密码被窃取,目前已关闭数十个相关存储库。

Read more →


WWDC 2026: Everything announced on Siri AI, iOS 27, Apple Intelligence and more

WWDC 2026 汇总:苹果发布了 iOS 27、Apple Intelligence 以及全面升级的 Siri AI,重点在于个性化与深度集成。

Read more →


Pentagon says Alibaba, Baidu, BYD, and Unitree support China’s military

五角大楼更新了名单,指控阿里巴巴、百度、比亚迪和宇树科技支持中国军方。该名单此前曾被短暂撤回。

Read more →


Apple just taught your iPhone to finish your sentences, your photos, and your workflows

苹果在 iOS 27 中引入了 AI 驱动的自动补全、照片处理和工作流自动化功能,进一步提升了 iPhone 的智能化水平。

Read more →


The Verge

Apple is using AI to fix Safari’s extension problem

苹果利用 AI 简化了 Safari 扩展程序的开发流程,允许用户通过“vibe-coding”(自然语言描述)来创建自己的扩展,以解决 Safari 扩展库长期匮乏的问题。

Read more →


Where was tvOS 27 at WWDC?

尽管苹果在 WWDC 上展示了各平台的 27 版本系统,但 tvOS 27 在主题演讲中几乎未被提及,引发了外界对 Apple TV 产品线未来的猜测。

Read more →


Apple’s new parental controls are for keeping Apple out of trouble

苹果在 WWDC 上推出的儿童安全功能,既是为了帮助家长管理屏幕时间,也被视为在监管压力下针对 Meta 等竞争对手的防御性举措。

Read more →


OpenAI files for IPO, following Anthropic

OpenAI 正式向 SEC 提交了 S-1 申请,紧随 Anthropic 的步伐,标志着 AI 行业进入了公开上市的新阶段。

Read more →


44 things coming to your Apple devices that you might have missed

除了 AI 之外,苹果在 WWDC 上还发布了许多细小的功能更新。本文汇总了 44 个被主题演讲忽略的实用改进。

Read more →


Apple drops support for a long list of Apple Watches with latest OS updates

watchOS 27 和 iPadOS 27 提高了硬件门槛,苹果此次淘汰了比往年更多的旧款设备,包括 Apple Watch Series 8。

Read more →


Apple announces watchOS 27, now with Siri AI

watchOS 27 正式发布,引入了 Siri AI、动态应用网格以及更先进的健康追踪功能,但仅支持较新的 Apple Watch 型号。

Read more →


Apple WWDC 2026: The 7 biggest announcements

WWDC 2026 七大看点:从 AI 升级的 Siri 到各平台的系统更新,苹果展示了其在 AI 时代的战略布局。

Read more →


WWDC 2026 bonus live blog: Tech Talk with Craig Federighi

The Verge 参与了苹果软件工程高级副总裁 Craig Federighi 的技术深度解析会,探讨了 Apple Intelligence 背后的架构细节。

Read more →


Cameras get an Apple Intelligence boost in Apple Home

iOS 27 将 Apple Intelligence 引入 HomeKit 安全视频,支持 AI 自动生成监控画面的视频描述。

Read more →


Ars Technica

macOS 27 requires Apple Silicon, as Apple draws down the Intel Mac era

macOS 27 将仅支持 Apple Silicon 芯片,标志着苹果正式结束对 Intel Mac 的支持。

Read more →


iOS 27 and iPadOS 27 don’t drop support for any iPhones—and just a few iPads

iOS 27 对 iPhone 的兼容性保持良好,仅有少量旧款 iPad 被移出支持列表。

Read more →


Meta alleges NSO violated spyware injunction with new WhatsApp attacks

Meta 指控 NSO Group 违反了间谍软件禁令,通过新的 WhatsApp 攻击手段进行钓鱼,并要求法院对其进行制裁。

Read more →


The fastest humans in the galaxy just got a spiffy patch to prove it

Artemis II 任务组员因飞行速度极快,获得了特殊的“Mach 39”徽章,以纪念其在太空中的卓越表现。

Read more →


Say hi to “Siri AI”—Apple announces new, more “conversational” voice assistant

苹果发布了更具对话能力的“Siri AI”,该功能将于今年秋季推出,并结合了 Google 提供的 AI 模型支持。

Read more →


Gemini 3.5 and Antigravity come to Google NotebookLM

Google NotebookLM 迎来重大升级,引入了 Gemini 3.5 和 Antigravity 技术,目前仅面向 AI Ultra 和企业用户开放。

Read more →


Your empty cuppa could capture carbon

研究发现,聚苯乙烯(泡沫塑料)可以被升级改造为碳海绵材料,用于捕获二氧化碳。

Read more →


For the 2nd time in weeks, Microsoft packages laced with credential stealer

微软的开源包再次被发现植入了凭据窃取程序,一旦被 AI 代理打开,73 个恶意包将自动执行复制攻击。

Read more →


Apple’s iOS 27, macOS 27 Golden Gate, and other updates focus on refinement

苹果的 iOS 27 和 macOS 27 “Golden Gate” 更新侧重于系统性能优化和 Liquid Glass 界面微调。

Read more →


Man jailed for a month despite Flock showing he was 5 miles from crime scene

一名男子因警方无视 Flock 摄像头的时间戳证据而被错误监禁一个月,引发了对执法部门滥用监控技术的质疑。

Read more →


Product Hunt

Honen

为任何公司提供自动化教学与学习的基础设施。

Read more →


Browse.sh

为 AI 代理提供自动化网页操作的“肌肉记忆”工具。

Read more →


Vaani

为创作者、品牌和工作室提供的唇形同步 AI 配音工具。

Read more →


Tamadoggo

一款带有 AI 洞察功能的宠物生活日志应用。

Read more →


Claude Artifact Player

无需浏览器或云端,在本地运行 Claude AI 生成的 Artifacts。

Read more →


The Virtual OS Museum

在桌面上重温复古操作系统的虚拟博物馆。

Read more →


Supaste

macOS 平台的剪贴板管理器。

Read more →


NTSC-RS

开源的模拟电视和 VHS 伪影视频仿真工具。

Read more →


Sigma File Manager

免费、开源、跨平台的现代化文件管理器。

Read more →


Dreambeans by Google Labs

根据你的 Google 应用使用习惯,个性化生成每日 AI 故事。

Read more →


MIT Technology Review

The Download: how the World Cup ball will fly and OpenAI’s “super app”

今日简报:探讨了世界杯足球的空气动力学设计,以及 OpenAI 迈向“超级应用”的战略布局。

Read more →


Why this year’s World Cup ball may not fly as far

分析了 2026 年世界杯足球的物理特性,指出其设计可能导致飞行距离不如以往的球款。

Read more →


The Download: AI hacking beyond Mythos, and chatbots’ impact on our brains

今日简报:讨论了 Meta AI 被黑客利用的案例,以及 AI 聊天机器人对人类大脑认知模式的潜在影响。

Read more →


Are AI chatbots making us lose control of our brains?

心理学家 Gloria Mark 探讨了人类与数字技术交互的 30 年演变,分析了 AI 聊天机器人如何改变我们的注意力与思维方式。

Read more →


The Meta hack shows there’s more to AI security than Mythos

Meta 的 AI 客服代理被黑客利用窃取 Instagram 账号,揭示了 AI 安全不仅在于模型本身,更在于其与外部系统的集成逻辑。

Read more →


The Download: AI-generated lawsuits and virtual power plants for data centers

今日简报:关注 AI 生成的诉讼案件激增,以及虚拟电厂(VPP)如何为数据中心提供能源支持。

Read more →


How courts are coping with a flood of AI-generated lawsuits

法官们正面临 AI 生成的法律文书激增的挑战,探讨了司法系统如何应对这一技术带来的文书处理压力。

Read more →


How virtual power plants could provide energy for data centers

Google 签署协议支持虚拟电厂(VPP),旨在通过优化电力使用来缓解数据中心对电网的巨大压力。

Read more →


The Download: Trump’s new AI order, and smart glasses for warfare

今日简报:解读特朗普签署的 AI 新行政令,以及智能眼镜在军事领域的应用前景。

Read more →


The Download: AI can run your admin department now

今日简报:探讨小型企业如何利用 AI 自动化处理会计、设计和市场研究等行政工作。

Read more →


mvanhorn / last30days-skill

一个 AI 代理技能,可跨 Reddit、X、YouTube 等平台研究主题并生成总结。

Read more →


RyanCodrai / turbovec

基于 TurboQuant 构建的向量索引,使用 Rust 编写并提供 Python 绑定。

Read more →


google / skills

Google 产品和技术的代理技能库。

Read more →


refactoringhq / tolaria

用于管理 Markdown 知识库的桌面应用。

Read more →


Panniantong / Agent-Reach

赋予 AI 代理“眼睛”以搜索 Twitter、Reddit 等平台,零 API 费用。

Read more →


danielmiessler / Personal_AI_Infrastructure

用于放大人类能力的代理 AI 基础设施。

Read more →


santifer / career-ops

基于 Claude Code 构建的 AI 求职系统,支持 14 种技能模式和 PDF 生成。

Read more →


phuryn / pm-skills

产品经理技能市场,包含 100 多种代理技能和插件。

Read more →


openai / plugins

OpenAI 插件库。

Read more →


Andyyyy64 / whichllm

根据真实硬件性能对本地 LLM 进行排名的工具。

Read more →


OpenAI Blog

Confidential submission of draft S-1 to the SEC

OpenAI 确认已向 SEC 秘密提交 S-1 文件,目前尚未确定后续上市时间表。

Read more →


Built to benefit everyone: our plan

OpenAI 发布愿景规划,强调在实现 AGI 的过程中确保访问权、安全性和共享繁荣。

Read more →


Introducing the OpenAI Economic Research Exchange

OpenAI 启动经济研究交流项目,旨在研究 AI 对就业、生产力和经济的影响。

Read more →


How Endava is redesigning software delivery around AI agents

Endava 通过集成 AI 代理和 ChatGPT Enterprise,实现了软件交付流程的自动化与 AI 原生文化转型。

Read more →


Dreaming: Better memory for a more helpful ChatGPT

ChatGPT 引入了新的记忆系统,使其能更好地记住用户偏好,并在不同对话中保持上下文的一致性。

Read more →


Biodefense in the Intelligence Age

OpenAI 发布了关于 AI 驱动的生物韧性行动计划。

Read more →


Introducing new capabilities to GPT-Rosalind

GPT-Rosalind 升级,增强了生物推理、药物化学和基因组分析能力。

Read more →


How Wasmer used Codex to build a Node.js runtime for the edge

Wasmer 利用 Codex 和 GPT-5.5 构建了边缘 Node.js 运行时,开发效率提升 10-20 倍。

Read more →


A blueprint for democratic governance of frontier AI

OpenAI 提出了一份关于前沿 AI 民主治理的蓝图,建议建立联邦安全与国家安全框架。

Read more →


OpenAI public policy agenda

OpenAI 公布了其公共政策议程,涵盖安全、青少年保护和劳动力转型等领域。

Read more →


Anthropic Blog

Introducing Claude Opus 4.8

Claude Opus 4.8 发布,在编码、代理任务和专业工作方面表现更强,并具备处理长周期任务的稳定性。

Read more →


Expanding Project Glasswing

Anthropic 将 Project Glasswing 扩展至全球 150 个新组织。

Read more →


Anthropic co-founder Chris Olah’s remarks on Pope Leo XIV’s encyclical “Magnifica humanitas”

Anthropic 联合创始人 Chris Olah 对教皇关于 AI 的通谕发表评论。

Read more →


Widening the conversation on frontier AI

Anthropic 组织了多场对话,探讨 AI 带来的社会与传统问题。

Read more →


An update on our election safeguards

Anthropic 解释了其为确保 Claude 在全球选举中发挥积极作用所采取的保障措施。

Read more →


Introducing the Services Track and Partner Hub of the Claude Partner Network

Anthropic 推出 Claude 合作伙伴网络的“服务轨道”和“合作伙伴中心”。

Read more →


What we learned mapping a year’s worth of AI-enabled cyber threats

Anthropic 分享了过去一年 AI 驱动的网络威胁分析报告。

Read more →


Anthropic confidentially submits draft S-1 to the SEC

Anthropic 已向 SEC 秘密提交 S-1 文件。

Read more →


Anthropic raises $65B in Series H funding at $965B post-money valuation

Anthropic 完成 650 亿美元 H 轮融资,估值达到 9650 亿美元。

Read more →


Anthropic opens Milan office to support Italian enterprise, research, and developers

Anthropic 在米兰开设新办公室,以支持意大利的企业、研究和开发者。

Read more →


Google AI Blog

The latest AI news we announced in May 2026

Google 汇总了 2026 年 5 月的 AI 更新。

Read more →


5 ways Google Search can level up your thrift and vintage shopping

Google 搜索利用 AI 工具帮助用户发现二手和复古商品。

Read more →


How we used Gemini to build Google I/O 2026

Google 团队分享了如何利用 Gemini 辅助筹备和制作 Google I/O 2026。

Read more →


Take our I/O 2026 quiz, vibe coded in Google AI Studio.

使用 Google AI Studio 制作的 I/O 2026 知识问答。

Read more →


9 demos of Gemini Omni and Gemini 3.5 in action

展示 Gemini Omni 和 Gemini 3.5 能力的 9 个演示视频。

Read more →


Check out real-life AI prototypes from the Futures Lab.

滑铁卢大学学生开发的 AI 原型,如手语导师,旨在重塑教育与工作。

Read more →


Catch up on 12 major I/O 2026 moments

回顾 Google I/O 2026 的 12 个高光时刻,包括 Gemini Omni 和 Gemini 3.5 Flash。

Read more →


Catch up on the Dialogues stage at Google I/O 2026.

Google I/O 2026 对话舞台回顾,探讨 AI、量子计算和机器人技术的未来。

Read more →


We’re announcing new community investments in Missouri.

Google 宣布在密苏里州进行社区投资,支持下一代劳动力培养和能源项目。

Read more →


100 things we announced at I/O 2026

Google I/O 2026 的 100 项公告汇总。

Read more →


Hugging Face Blog

The Open Source Community is backing OpenEnv for Agentic RL

开源社区支持 OpenEnv 用于代理强化学习。

Read more →


Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI

Nemotron 3.5 内容安全:为全球企业 AI 提供可定制的多模态安全方案。

Read more →


EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios

EVA-Bench 数据 2.0 发布,涵盖 3 个领域、121 个工具和 213 个场景。

Read more →


Designing the hf CLI as an agent-optimized way to work with the Hub

设计 hf CLI,使其成为与 Hugging Face Hub 交互的代理优化方式。

Read more →


Direct Preference Optimization Beyond Chatbots

超越聊天机器人的直接偏好优化(DPO)。

Read more →


Adding MCP Tools to Reachy Mini

为 Reachy Mini 机器人添加 MCP 工具支持。

Read more →


Holo3.1: Fast & Local Computer Use Agents

Holo3.1:快速且本地化的计算机使用代理。

Read more →


Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

JetBrains 推出 Mellum2:一款 12B 参数的混合专家模型。

Read more →


Beyond LLMs: Why Scalable Enterprise AI Adoption Depends on Agent Logic

超越 LLM:为何可扩展的企业 AI 采用取决于代理逻辑。

Read more →


Profiling in PyTorch (Part 1): A Beginner’s Guide to torch.profiler

PyTorch 性能分析(第一部分):torch.profiler 初学者指南。

Read more →


The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

探讨理性 AI 不应拥有“目标”,而应将行动与实践对齐的德性伦理观点。

Read more →


AGI Is Not Multimodal

文章认为,将语言作为思维模型会导致我们忽视人类智能中隐含的具身理解。

Read more →


Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

探讨了机器学习研究中数学角色的转变,从数学原则架构转向计算密集型工程。

Read more →


What’s Missing From LLM Chatbots: A Sense of Purpose

探讨了 LLM 聊天机器人在基准测试中表现优异,但用户体验并未同步提升的原因——缺乏目的感。

Read more →


We Need Positive Visions for AI Grounded in Wellbeing

呼吁建立以人类福祉为基础的 AI 积极愿景。

Read more →


Financial Market Applications of LLMs

探讨了 LLM 在金融市场建模和序列处理中的应用。

Read more →


A Brief Overview of Gender Bias in AI

关于 AI 中性别偏见的简要概述与讨论。

Read more →


Mamba Explained

解释了 Mamba 模型,一种基于状态空间模型(SSM)的 Transformer 替代方案。

Read more →


Car-GPT: Could LLMs finally make self-driving cars happen?

探讨 LLM 在自动驾驶中的应用潜力及面临的挑战。

Read more →


Do text embeddings perfectly encode text?

探讨了 Vec2text 技术,强调了嵌入数据安全协议的必要性。

Read more →


arXiv CS.AI

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

将公平性形式化为对称性操作,以检测和减轻机器学习系统中的偏见。

Read more →


DiBS: Diffusion-Informed Branch Selection

提出 DiBS 方法,利用扩散模型解决数独等约束满足问题。

Read more →


SafeGene: Reusable Adapters for Transferable Safety Alignment

提出 SafeGene,通过可重用适配器解决 LLM 微调后的安全性下降问题。

Read more →


Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

提出 Lean4Agent,为 AI 代理的工作流提供形式化建模与验证方法。

Read more →


CrowdMath: A Dataset of Crowdsourced Mathematical Research Discussions

发布 CrowdMath 数据集,捕捉协作式开放数学问题解决过程。

Read more →


Attack Selection in Agentic AI Control Evaluations Meaningfully Decreases Safety

研究发现,战略性攻击选择会显著降低 AI 代理控制评估的安全性。

Read more →


CARVE-Q: Quantum-Proposed, Classically Certified Interactive Driving Repair

提出 CARVE-Q,利用量子计算辅助自动驾驶中的交互修复。

Read more →


Position: Don’t Just “Fix it in Post”: A Science of AI Must Study Training Dynamics

主张 AI 科学必须研究训练动态,而非仅将模型视为静态对象。

Read more →


arXiv CS.CL

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

通过一致性驱动的强化学习提高 LLM 的跨语言事实召回能力。

Read more →


Re-Centering Humans in LLM Personalization

研究 LLM 个性化系统在真实用户场景下的性能差距。

Read more →


UnpredictaBench: A Benchmark for Evaluating Distributional Randomness in LLMs

引入 UnpredictaBench,评估 LLM 捕捉底层分布随机性的能力。

Read more →


How Language Models Fail: Token-Level Signatures of Committed and Persistent Reasoning Failures

分析 LLM 推理失败的 token 级特征,区分两种不同的失败过程。

Read more →


CAF-Gen: A Multi-Agent System for Enriching Argumentation Structures

提出 CAF-Gen,一种用于丰富论证结构的多代理系统。

Read more →


The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

提出“搭便车假设”,解释并缓解 LLM 微调过程中的涌现性失准问题。

Read more →


What Do People Actually Want From AI? Mapping Preference Plurality

探讨如何通过映射偏好多元性来改进 RLHF,解决偏好冲突问题。

Read more →


发布 HKJudge 数据集,用于分析香港法院的判决逻辑与推理过程。

Read more →


WIRED

OpenAI Confidentially Files for IPO on the Heels of SpaceX and Anthropic

OpenAI 秘密提交 IPO 申请,紧随 Anthropic 之后。

Read more →


Polymarket and Kalshi Say Influencer Partners Can’t Deny Election Results, Actually

Polymarket 和 Kalshi 要求网红合作伙伴删除否认选举结果的付费内容。

Read more →


Everything Apple Announced at WWDC 2026

WWDC 2026 汇总:Siri AI、iOS 增强功能及 Google Gemini 合作细节。

Read more →


Apple’s iPhone Camera App Is Getting an AI Upgrade in iOS 27

iOS 27 中,Siri 被嵌入相机应用,照片应用也增加了更多 AI 编辑工具。

Read more →


Apple’s New Siri AI Is Ready to Get Personal

苹果发布新一代 Siri AI,强调个性化体验与 Google Gemini 的深度集成。

Read more →


The UK Is Betting on a Billion-Dollar AI Supercomputer to Kick Its Addiction to US Tech

英国政府投资 10 亿美元建设 AI 超级计算机,旨在扶持本土芯片初创企业。

Read more →


Meta Deletes Face-Recognition System From Its Smart Glasses App After WIRED Report

在 WIRED 报道后,Meta 从其智能眼镜应用中删除了人脸识别系统。

Read more →


Apple WWDC 2026 Live Blog: All the Updates, as They Happen

WWDC 2026 实时博客:全程跟踪 iOS、macOS 等系统更新。

Read more →


Watch Duty Is Adding Flood Alerts to Its Wildfire App

野火追踪应用 Watch Duty 增加洪水预警功能。

Read more →


Lenovo IdeaPad Slim 5x Review: The Best Laptop Under $1,000

联想 IdeaPad Slim 5x 评测:850 美元价位段的最佳笔记本电脑。

Read more →


Lobsters

WWDC 2026

关于 WWDC 2026 的讨论。

Read more →


Premature Optimization is Fun Sometimes (2025)

关于过早优化的讨论。

Read more →


GentleOS - A pair of hobby OSes for vintage 32-bit and 16-bit PCs

为复古 32 位和 16 位 PC 开发的业余操作系统。

Read more →


I wish Deno would keep doing what it does best

关于 Deno 发展方向的讨论。

Read more →


HTMX Is So Cool I Rolled My Own (2024)

关于 HTMX 的讨论。

Read more →


Forgejo monthly report - May 2026

Forgejo 2026 年 5 月月报。

Read more →


In Defense of YAML

为 YAML 辩护的讨论。

Read more →


Vulnerability and malware checks in uv

关于 uv 工具中漏洞和恶意软件检查的讨论。

Read more →


This Month in Redox - May 2026 - Redox - Your Next(Gen) OS

Redox OS 2026 年 5 月进展。

Read more →


How much do amd64 microarchitecture levels help in Go?

探讨 amd64 微架构级别对 Go 语言性能的影响。

Read more →


DEV Community

TypeScript for JavaScript Developers: The Complete Practical Guide (2026)

TypeScript 实用指南:帮助开发者从 JS 过渡到 TS,提升代码质量。

Read more →


Spring Cloud Gateway WebFlux 4.0.6

关于 Spring Cloud Gateway WebFlux 动态路由配置的讨论。

Read more →


Github “Finish-Up-A-Thon” Challenge Winner Announcement Delayed & General Challenge Timeline Updates

GitHub “Finish-Up-A-Thon” 挑战赛获奖名单公布延迟及时间表更新。

Read more →


Building Custom Recognizers

如何为 Presidio 构建自定义 PII(个人身份信息)识别器。

Read more →


Are You Talking to a Bot? Why AI Identity is Harder Than You Think

探讨 AI 身份识别的挑战:用户在与系统交互时需要明确知道对方是人还是 AI。

Read more →


Three post-deploy checks I run after every Cloudflare Pages build

作者分享了在 Cloudflare Pages 部署后运行的三项检查,以避免生产环境故障。

Read more →


Why I’m betting on AI-curated directories when Google AI Overviews answer the same queries

探讨在 Google AI 概览普及的背景下,AI 策划目录网站的生存价值。

Read more →


Advanced: Network Mocking, Visual & Accessibility (Playwright + TypeScript, Ch.22)

Playwright + TypeScript 进阶课程:网络模拟、视觉与可访问性测试。

Read more →


Tired of Hcaptcha?

分享了一个解决 Hcaptcha 验证码问题的开源仓库。

Read more →


I built 73 free construction calculators with Next.js — and learned the hard way that Google won’t index a new site just because it exists

作者分享了构建 73 个建筑计算器网站的经验,强调了 SEO 和用户体验的重要性。

Read more →


Meta Engineering

Lights Out, Systems On: Validating Instant Power Loss Readiness

Meta 引入“瞬时断电风暴”测试范式,以验证数据中心在突发断电情况下的系统韧性。

Read more →


SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems

Meta 推出 SilverTorch,一种统一的推荐系统检索架构,计算效率提升 20 倍以上。

Read more →


Reel Friends: Building Social Discovery that Scales to Billions

探讨 Meta 如何构建支持数十亿用户的“Reel Friends”社交发现功能。

Read more →


Migrating Data Ingestion Systems at Meta Scale

Meta 分享了其大规模数据摄取系统迁移的经验,以提升系统可靠性。

Read more →


Labyrinth 1.1: Making End-to-End Encrypted Backups Even More Reliable

Meta 推出 Labyrinth 1.1,增强了 Messenger 端到端加密备份的可靠性。

Read more →


How Meta Is Strengthening End-to-End Encrypted Backups

介绍 Meta 基于 HSM 的备份密钥库,为 WhatsApp 和 Messenger 提供加密保护。

Read more →


Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

Meta 升级 Facebook 群组搜索,采用混合检索架构以提升社区内容发现效率。

Read more →


Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

Meta 利用 AI 代理平台自动化基础设施性能优化,节省电力并释放工程师时间。

Read more →


Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

Meta 分享后量子密码学(PQC)迁移的框架与经验。

Read more →


DeepMind Blog

We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks

Google DeepMind 在亚太地区启动加速器项目,旨在应对环境风险。

Read more →


Fast-tracking genetic leads to reverse cellular aging

生物学家利用 Co-Scientist 发现逆转细胞衰老的新遗传因子。

Read more →


Simulate real-world places with Project Genie and Street View

Project Genie 结合 Street View,支持模拟真实世界场景。

Read more →


Introducing Gemini Omni

Google 推出 Gemini Omni 模型。

Read more →


Introducing Google Antigravity 2.0

Google 推出 Antigravity 2.0。

Read more →


Gemini for Science: AI experiments and tools for a new era of discovery

Gemini for Science:为科学发现提供 AI 实验与工具。

Read more →


Making it easier to understand how content was created and edited

Google 扩展工具,帮助用户识别内容的创建与编辑方式。

Read more →


Strengthening Singapore’s AI Future: A New National Partnership

Google DeepMind 与新加坡建立国家级合作伙伴关系,应用前沿 AI 解决健康与可持续发展挑战。

Read more →


Finding the molecular switches behind new infectious diseases

利用 Co-Scientist 识别新发传染病的遗传触发因素。

Read more →


Opening new paths in aging research

Calico Life Sciences 利用 Co-Scientist 在衰老研究中生成新线索。

Read more →


Microsoft AI Blog

A conversation with Kevin Scott: What’s next in AI

与 Kevin Scott 对话:探讨 AI 的未来发展。

Read more →


From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative

品牌如何利用 Microsoft AI 提升生产力与创造力。

Read more →


Microsoft open sources its ‘farm of the future’ toolkit

微软开源其“未来农场”工具包。

Read more →


How data and AI will transform contact centres for financial services

数据与 AI 如何转型金融服务行业的联络中心。

Read more →


AI-equipped drones study dolphins on the edge of extinction

AI 无人机研究濒危海豚。

Read more →


Online math tutoring service uses AI to help boost students’ skills and confidence

在线数学辅导服务利用 AI 提升学生的技能与信心。

Read more →


AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan

AI-Mimi 为日本听障用户构建包容性电视体验。

Read more →


Microsoft’s framework for building AI systems responsibly

微软负责任的 AI 系统构建框架。

Read more →


Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade

新加坡开发亚洲首个 AI 鲨鱼鳍识别应用,打击非法野生动物贸易。

Read more →


The opportunity at home – can AI drive innovation in personal assistant devices and sign language?

探讨 AI 在个人助理设备和手语创新中的机会。

Read more →


VentureBeat AI

Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.

Google 25 年来首次重新设计搜索框,标志着搜索范式的重大转变。

Read more →


Railway secures $100 million to challenge AWS with AI-native cloud infrastructure

Railway 融资 1 亿美元,旨在通过 AI 原生云基础设施挑战 AWS。

Read more →


Claude Code costs up to $200 a month. Goose does the same thing for free.

Claude Code 价格昂贵,而 Goose 提供了免费的替代方案。

Read more →


Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews

Listen Labs 融资 6900 万美元,此前曾通过病毒式广告牌招聘活动引发关注。

Read more →


Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI

Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域与微软和 Google 竞争。

Read more →


Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required

Anthropic 推出 Cowork,无需编码即可在本地文件上运行的 Claude 桌面代理。

Read more →


Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research 发布开源编码模型 NousCoder-14B,性能媲美大型专有系统。

Read more →


arXiv CS.LG

Elmes*: Automated Construction of Fine-Grained Evaluation Rubrics for Large Language Models in Long-Tail Educational Scenarios

提出 Elmes*,用于自动构建 LLM 在长尾教育场景下的细粒度评估准则。

Read more →


FAIR-Calib: Frontier-Aware Instability-Reweighted Calibration for Post-Training Quantization of Diffusion Large Language Models

提出 FAIR-Calib,用于扩散 LLM 的训练后量化校准。

Read more →


Multi-Scale Feature Attention Network for Polymer Classification using THz Dual-Comb Spectroscopy

提出多尺度特征注意力网络,用于太赫兹光谱下的聚合物分类。

Read more →


MacArena: Benchmarking Computer Use Agents on an Online macOS Environment

发布 MacArena 基准测试,用于评估 macOS 环境下的计算机使用代理。

Read more →


WAV: Multi-Resolution Block Residual Routing for Deep Decoder-Only Transformers

提出 WAV 方法,用于深度 Decoder-Only Transformer 的多分辨率块残差路由。

Read more →


Are you sure? A Comprehensive and Comprehensible Survey of Uncertainty Quantification in Symbolic Regression

关于符号回归中不确定性量化(UQ)的全面综述。

Read more →


Generative Models Erode Human Temporal Learning Through Market Selection

论证生成模型如何通过市场选择侵蚀人类的时间学习能力。

Read more →


Skip a Layer or Loop It? Learning Program-of-Layers in LLMs

提出动态层程序(PoLar)方法,允许 LLM 在推理时灵活跳过或循环层。

Read more →


arXiv CS.CV

Applying Deep Learning for cockpit segmentation in the context of mixed reality

将深度学习应用于混合现实环境下的驾驶舱分割。

Read more →


GOPAgen: Motion-Aware and Efficient Agentic Long-Video Understanding with Structural Memory and Hierarchical Reasoning

提出 GOPAgen,一种具备结构化记忆和分层推理的运动感知长视频理解方法。

Read more →


Attention-Guided Autoencoder Fusion for Insulator Defect Detection Using UAV Transmission-Line Imaging

提出 AE-YOLO,用于无人机输电线路图像中的绝缘子缺陷检测。

Read more →


WorldBench: A Challenging and Visually Diverse Multimodal Reasoning Benchmark

发布 WorldBench,一个具有挑战性且视觉

生成二维码中...

请点击右上角 ···

选择 发送给朋友收藏