2026-04-24

今日要点


Hacker News

I am building a cloud

Read more →

GPT-5.5

OpenAI 发布了最新的 GPT-5.5 模型。作为 GPT 系列的最新迭代,该模型在多项基准测试中表现出色,进一步强化了 OpenAI 在大语言模型领域的领先地位。

Read more →

Palantir employees are starting to wonder if they’re the bad guys

Palantir 的员工开始质疑公司在道德和民权方面的立场。随着公司成为美国政府移民执法系统的技术支柱,员工们对于其技术被用于追踪和驱逐移民的行为感到不安,内部对于公司是否在扮演“反派”角色的讨论日益激烈。

Read more →

Bitwarden CLI compromised in ongoing Checkmarx supply chain campaign

Bitwarden CLI 2026.4.0 版本在 Checkmarx 供应链攻击中被攻破。攻击者利用了 Bitwarden CI/CD 流水线中的 GitHub Action 漏洞,植入了恶意代码。Socket 研究人员提醒开发者注意此类开源包的安全性。

Read more →

An update on recent Claude Code quality reports

Anthropic 发布了关于 Claude Code 质量问题的调查报告。团队确认近期用户反馈的性能下降源于 Claude Code、Agent SDK 和 Claude C 三个组件的变更,目前已针对这些问题进行了修复和优化。

Read more →

If America’s so rich, how’d it get so sad?

文章探讨了美国社会幸福感下降的现象。引用芝加哥大学经济学家 Sam Peltzman 的研究,指出自新冠疫情以来,美国人口的自我报告幸福感出现了历史上前所未有的急剧下降,引发了对社会繁荣与心理健康之间关系的深思。

Read more →

Investigation uncovers two sophisticated telecom surveillance campaigns

Citizen Lab 的调查揭露了两个复杂的电信监控活动。监控供应商被发现滥用对电信运营商的访问权限,非法追踪用户的手机位置信息,引发了对个人隐私和电信基础设施安全性的严重担忧。

Read more →

Meta to cut 10% of jobs

Meta 计划裁减 10% 的员工,涉及约 8,000 个岗位。此外,公司还将停止招聘目前空缺的 6,000 个职位。这一举措反映了 Meta 在当前经济环境下对运营效率的重新评估。

Read more →

French government agency confirms breach as hacker offers to sell data

法国国家安全证件局(ANTS)确认发生数据泄露事件。一名威胁行为者声称攻击了该机构并窃取了公民数据,目前正在网上兜售这些信息,法国政府已介入调查。

Read more →

Arch Linux Now Has a Bit-for-Bit Reproducible Docker Image

Arch Linux 宣布推出位对位(bit-for-bit)可重现的 Docker 镜像。继此前 WSL 镜像实现该里程碑后,用户现在可以通过新的“repro”标签获取这一高度透明且可验证的镜像版本。

Read more →

‘Hairdryer used to trick weather sensor’ to win Polymarket bet

一名用户被指控使用吹风机干扰天气传感器,从而在 Polymarket 的天气预测赌局中获利 3.4 万美元。这一事件凸显了预测市场在面对物理世界操纵时的脆弱性。

Read more →

Show HN: Honker – Postgres NOTIFY/LISTEN Semantics for SQLite

Honker 是一个 SQLite 扩展,为 SQLite 带来了类似 Postgres 的 NOTIFY/LISTEN 语义。它支持持久化发布/订阅、任务队列和事件流,无需客户端轮询或额外的代理服务,极大简化了轻量级应用的实时通信需求。

Read more →

To Protect and Swerve: NYPD Cop Has 547 Speeding Tickets

一名纽约警察在过去几年中因超速和闯红灯被交通摄像头记录了 547 次违规,仅 2025 年就收到 187 张罚单。该报道引发了公众对于执法人员是否应享有交通豁免权的激烈讨论。

Read more →

Raylib v6.0

Raylib 发布了 6.0 版本,这是该项目历史上规模最大的一次更新。得益于社区贡献者的支持,新版本带来了大量功能增强和性能改进,进一步巩固了其作为游戏开发库的地位。

Read more →

Our newsroom AI policy

Ars Technica 公布了其新闻编辑室的 AI 使用政策。该文档详细说明了编辑部如何使用以及如何避免使用生成式 AI,旨在向读者提供透明度,确保新闻报道的准确性和人类编辑的专业标准。

Read more →


TechCrunch

Redwood Materials loses COO amid layoffs, restructuring

Redwood Materials 在重组过程中失去了首席运营官 Chris Lister,同时至少有三名副总裁离职。公司正经历大规模裁员和业务调整,以应对行业挑战。

Read more →

These are the countries moving to ban social media for children

全球多个国家正采取行动禁止儿童使用社交媒体。继澳大利亚在 2025 年底率先实施禁令后,各国旨在通过此举减少网络欺凌、成瘾及接触不良信息的风险。

Read more →

Bret Taylor’s Sierra buys YC-backed AI startup Fragment

由 Bret Taylor 创立的 AI 客服代理初创公司 Sierra 宣布收购 YC 支持的法国 AI 初创公司 Fragment,旨在进一步增强其 AI 代理的技术实力。

Read more →

Instagram tests a new ‘Instants’ app for sharing disappearing photos

Instagram 正在测试一款名为“Instants”的新应用,专注于分享阅后即焚的照片。这些照片仅能查看一次,并在 24 小时后消失,旨在提供更私密的社交体验。

Read more →

Meet Noscroll, an AI bot that does your doomscrolling for you

Noscroll 是一款旨在解决“末日刷屏”(doomscrolling)问题的 AI 机器人。它能代替用户阅读互联网内容,从而减少用户在社交媒体上无意义刷屏的时间。

Read more →

Trump’s pick to run US cyber agency CISA asks to drop out

特朗普提名的 CISA(美国网络安全和基础设施安全局)局长人选 Sean Plankey 申请退出提名。该机构在经历了一年的临时领导混乱后,此次提名撤回进一步加剧了其领导层的不确定性。

Read more →

Don’t stop hiring humans — stop hiring the wrong humans, Artisan’s founder says

Artisan 的创始人强调,尽管公司曾发起“停止雇佣人类”的营销活动,但核心观点在于企业应专注于组建正确的团队,而非盲目扩张,AI 应当是辅助而非完全替代。

Read more →

OpenAI releases GPT-5.5, bringing company one step closer to an AI ‘super app’

OpenAI 发布了 GPT-5.5,该模型在多个类别中展现了更强的能力。此举被视为 OpenAI 向打造 AI “超级应用”迈出的关键一步,旨在提供更全面、更智能的集成服务。

Read more →

Bluesky now supports better-quality photos

Bluesky 社交平台现已支持更高质量的照片上传,最大文件限制提升至 2MB,分辨率支持最高 4000 x 4000 像素,提升了用户的视觉分享体验。

Read more →


The Verge

US arrests soldier who allegedly made $400k on Maduro Polymarket bets

美国当局逮捕了一名士兵 Gannon Ken Van Dyke,指控其利用内幕信息在 Polymarket 上针对委内瑞拉总统马杜罗被捕事件进行投注,非法获利超过 40 万美元。

Read more →

Leak reveals new Xbox Game Pass ‘Starter Edition’ that’s part of Discord Nitro

泄露信息显示,微软即将推出 Xbox Game Pass “入门版”,该版本将作为 Discord Nitro 订阅的一部分提供,包含 50 多款游戏,旨在通过跨平台合作吸引更多玩家。

Read more →

Claude is connecting directly to your personal apps like Spotify, Uber Eats, and TurboTax

Anthropic 的 Claude AI 现已支持连接 Spotify、Uber Eats、TurboTax 等个人应用。这一扩展标志着 Claude 从工作助手向全能个人生活助手的转型。

Read more →

Brendan Carr’s war on wokeness targets inclusive children’s television

FCC 主席 Brendan Carr 正在针对儿童电视节目中的性别包容性内容发起审查,要求公众就电视分级系统是否应限制涉及性别认同的内容发表意见,引发了关于审查制度的争议。

Read more →

Sonos’ big sale on refurbished speakers is about to end

Sonos 官方翻新音箱的促销活动即将结束。尽管部分热门型号已售罄,但仍有部分黑白配色的音箱在售,对于寻求高性价比音频设备的用户来说是最后的机会。

Read more →

Meta is laying off 10 percent of its staff

Meta 确认将于 5 月裁员 10%,约 8,000 名员工将受到影响。公司还将关闭部分未完成的招聘项目,这是 Meta 持续精简组织架构的一部分。

Read more →

‘We Are Xbox’: read the memo defining Microsoft’s gaming future

微软 Xbox 新任 CEO Asha Sharma 发布内部备忘录,提出了“Xbox 回归”战略。未来 Xbox 的成功将以日活跃玩家数为核心指标,并重新评估硬件与独占游戏的优先级。

Read more →

Microsoft’s new Xbox chief is ‘reevaluating’ exclusive games

Xbox 新任 CEO Asha Sharma 在全员会议上透露,公司正在重新评估独占游戏策略及窗口期发布模式,旨在通过更灵活的发行策略提升 Xbox 平台的市场竞争力。

Read more →

Democrats want to ban ICE from turning warehouses into detention centers

民主党议员提出法案,旨在禁止美国移民及海关执法局(ICE)将仓库改建为拘留中心。此前 ICE 在盐湖城购买大型仓库用于拘留和处理移民的举动引发了强烈抗议。

Read more →

Spirit is broken

Spirit Airlines 陷入严重的财务困境,自 2019 年以来未实现盈利,并在过去两年内两次申请破产。这家廉价航空公司的未来充满不确定性,可能面临清算或被收购。

Read more →


Ars Technica

US accuses China of “industrial-scale” AI theft. China says it’s “slander.”

美国指控中国进行“工业规模”的 AI 技术窃取,中国对此予以否认并称其为“诽谤”。这一争端可能对即将举行的特朗普-习近平峰会产生影响,美国正考虑实施大规模制裁。

[Read more →](https://arstechnica.com/tech-policy/2026/04/us-accuses-china-of-industrial-scale-ai- theft-china-says-its-slander/)

Carbon nanotube wiring gets closer to competing with copper

研究人员在碳纳米管导线领域取得进展,使其导电性能更接近铜。尽管目前材料仍存在降解问题,但这一突破为未来替代铜线提供了新的可能性。

Read more →

We still don’t have a more precise value for “Big G”

科学家们仍在努力精确测量万有引力常数“Big G”。尽管实验不断改进,但不同实验结果之间的差异依然存在,这对于理解宇宙的基本物理规律至关重要。

Read more →

In a first, a ransomware family is confirmed to be quantum-safe

首次发现勒索软件家族采用了后量子密码学(PQC)技术。虽然目前尚无实际攻击优势,但这一趋势表明网络犯罪分子正在为未来的量子计算威胁做准备。

Read more →

RFK Jr.’s rejection of germ theory debunked in Senate hearing

在参议院听证会上,小罗伯特·肯尼迪对细菌理论的质疑遭到驳斥。专家指出其关于疫苗未能降低儿童死亡率的说法是错误的,并重申了科学共识。

Read more →

Why are the Mac mini and Mac Studio gradually becoming impossible to buy?

苹果的 Mac mini 和 Mac Studio 出现供应短缺,难以购买。分析认为这可能与产品更新、内存短缺或 AI 代理硬件需求激增有关。

Read more →

US Space Command: Russia is now operationalizing co-orbital ASAT weapons

美国太空司令部警告称,俄罗斯正在部署共轨反卫星(ASAT)武器。这些系统能够进入轨道并接近美国的高价值卫星,构成了严重的太空安全威胁。

Read more →

Apple stops weirdly storing data that let cops spy on Signal chats

苹果修复了一个漏洞,停止了对已删除 Signal 聊天记录的异常数据存储。此前该漏洞允许执法部门通过备份数据窥探用户的私密对话,Signal 对此表示欢迎。

Read more →

Eight months early and under budget, the Roman Telescope is ready to launch

罗马太空望远镜提前八个月且在预算内准备就绪。该项目利用了废弃的间谍卫星硬件,旨在通过红外扫描揭示宇宙的奥秘。

Read more →

BMW bumps the 7 Series for 2027, adds all-new battery

宝马发布了 2027 款 7 系轿车,新增了全新的电池技术。新车型提供纯电动、直列六缸发动机及插电式混合动力版本,进一步丰富了产品线。

Read more →


Product Hunt

FocuSee 2.0

FocuSee 2.0 是一款屏幕录制工具,专注于生成高质量的演示和教程视频,帮助用户快速制作专业级的教学内容。

Read more →

Claude Code /ultrareview

Claude Code 的新功能,利用一组并行 AI 代理进行代码审查,旨在提高开发效率和代码质量。

Read more →

Gemini Enterprise Agent Platform

谷歌推出的企业级 AI 代理平台,旨在帮助企业在生产环境中大规模部署和运行 AI 代理。

Read more →

Fabric CLI

Fabric CLI 允许用户直接在终端中进行笔记记录、任务管理和搜索,提升开发者的工作流效率。

Read more →

Reloop Animation Studio

Reloop 动画工作室可以将任何视频创意转化为皮克斯风格、粘土动画或漫画风格,降低了高质量动画制作的门槛。

Read more →

Kollab

Kollab 是一个共享工作空间,允许团队成员与 AI 代理协同工作,共同完成复杂任务。

Read more →

Magic Patterns Agent 2.0

Magic Patterns Agent 2.0 是一款 AI 设计代理,能够帮助用户从创意构思快速过渡到生产环境。

Read more →

ASI:One

ASI:One 是一款具备记忆功能的个人 AI,能够为用户规划任务并自主执行,提供个性化的智能助理服务。

Read more →

Typewise AI Customer Service

Typewise AI 客服系统利用 AI 代理自动化处理跨系统的客户支持请求,提升响应速度和客户满意度。

Read more →

Monid

Monid 是一个专为 AI 代理设计的钱包,集成了代理完成任务所需的所有付费工具,简化了代理的支付流程。

Read more →


MIT Technology Review

The Download: introducing the Nature issue

MIT 科技评论推出“自然”主题专刊,探讨人类活动对自然界的深远影响,从微塑料污染到人工光污染,反思“自然”在现代社会的定义。

Read more →

Will fusion power get cheap? Don’t count on it.

文章分析了核聚变能源的成本问题。尽管核聚变是理想的零排放能源,但研究表明,即使技术成熟,其建设和运营成本可能依然高昂,难以像锂电池那样实现快速降价。

Read more →

The Download: introducing the 10 Things That Matter in AI Right Now

MIT 科技评论发布 AI 领域当前最重要的 10 件事,旨在帮助读者在海量 AI 资讯和炒作中理清头绪,关注真正具有影响力的技术和趋势。

Read more →

AI needs a strong data fabric to deliver business value

文章指出,企业若要从 AI 中获得实际价值,必须构建强大的数据结构(Data Fabric)。随着 AI 在金融、供应链等领域的普及,高质量的数据基础已成为企业竞争的关键。

Read more →

3 things Michelle Kim is into right now

Michelle Kim 分享了她近期关注的三个领域,包括虚拟偶像团体 Isegye Idol,探讨了数字 persona 在娱乐产业中的崛起。

Read more →

One town’s scheme to get rid of its geese

文章讲述了一个加州小镇通过 GPS 追踪器管理加拿大鹅种群的有趣方案,探讨了人类与野生动物在城市环境中的共存挑战。

Read more →

There is no nature anymore

编辑手记探讨了人类对地球的全面影响。作者认为,几乎没有什么是人类未曾触及的,即使在偏远地区也能发现人类活动的痕迹,反思了“自然”概念的消亡。

Read more →

Los Angeles is finally going underground

洛杉矶正在重建其轨道交通系统。作为典型的汽车城市,洛杉矶正通过扩建地铁和轻轨网络,试图改变其依赖汽车的城市交通格局。

Read more →

Roundtables: Unveiling The 10 Things That Matter in AI Right Now

MIT 科技评论在 EmTech AI 大会上直播了关于 AI 关键趋势的圆桌讨论,为订阅者提供了关于 AI 技术、趋势和大胆想法的独家见解。

Read more →

The new word in home construction could be “plastics”

MIT 工程师提出利用塑料废料进行房屋建筑的构想,旨在同时解决塑料污染和木材资源短缺的问题,为可持续建筑提供新思路。

Read more →


huggingface / ml-intern

一个开源的机器学习工程师 AI,能够阅读论文、训练模型并部署机器学习模型。

Read more →

zilliztech / claude-context

为 Claude Code 提供代码搜索 MCP,将整个代码库作为任何编码代理的上下文。

Read more →

HKUDS / RAG-Anything

一个一体化的 RAG(检索增强生成)框架。

Read more →

Z4nzu / hackingtool

一个为黑客准备的一体化黑客工具集。

Read more →

ruvnet / RuView

利用 WiFi 信号进行实时人体姿态估计、生命体征监测和存在检测,无需视频像素。

Read more →

Anil-matcha / Open-Generative-AI

一个无审查、开源的 AI 图像和视频生成工作室,支持 200 多种模型,无内容过滤。

Read more →

Alishahryar1 / free-claude-code

在终端、VSCode 扩展或 Discord 中免费使用 Claude Code 的方案。

Read more →

open-metadata / OpenMetadata

一个统一的元数据平台,用于数据发现、可观测性和治理。

Read more →

microsoft / ai-agents-for-beginners

微软推出的 12 节 AI 代理构建入门课程。

Read more →

PowerShell / PowerShell

适用于所有系统的 PowerShell。

Read more →


OpenAI Blog

GPT-5.5 System Card

GPT-5.5 的系统卡片,详细说明了模型的安全评估和风险控制措施。

Read more →

What is Codex?

介绍 Codex 如何通过自动化任务、连接工具和生成文档来提升工作效率。

Read more →

Automations

学习如何在 Codex 中使用计划和触发器来自动化报告、摘要和重复性工作流。

Read more →

Plugins and skills

介绍如何使用 Codex 插件和技能连接工具、访问数据并执行可重复的工作流。

Read more →

Working with Codex

指导用户如何设置 Codex 工作区、管理项目和文件,并开始完成任务。

Read more →

How to get started with Codex

Codex 入门指南,帮助用户快速上手项目设置和任务执行。

Read more →

Codex settings

介绍如何配置 Codex 设置,包括个性化、详细程度和权限管理。

Read more →

Top 10 uses for Codex at work

探索 Codex 在工作中的 10 个实用场景,涵盖自动化任务和交付物生成。

Read more →

GPT-5.5 Bio Bug Bounty

GPT-5.5 生物安全漏洞赏金计划,挑战寻找生物安全风险的通用越狱方法,最高奖励 2.5 万美元。

Read more →


Anthropic Blog

Introducing Claude Opus 4.7

Anthropic 发布 Claude Opus 4.7,在编码、代理、视觉和多步任务中表现更强,更加严谨和一致。

Read more →

Introducing Claude Design by Anthropic Labs

推出 Claude Design,允许用户与 Claude 协作创建 polished 的视觉作品,如原型、幻灯片和单页文档。

Read more →

Claude is a space to think

Anthropic 承诺 Claude 将保持无广告,认为广告激励与 AI 助手的有用性不兼容。

Read more →

Anthropic’s Long-Term Benefit Trust appoints Vas Narasimhan to Board of Directors

Anthropic 长期利益信托任命 Vas Narasimhan 为董事会成员。

Read more →

Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute

Anthropic 与谷歌和博通扩大合作,获得数千兆瓦的下一代计算资源。

Read more →

Australian government and Anthropic sign MOU for AI safety and research

澳大利亚政府与 Anthropic 签署 AI 安全与研究谅解备忘录。

Read more →

Anthropic invests $100 million into the Claude Partner Network

Anthropic 向 Claude 合作伙伴网络投资 1 亿美元。

Read more →

Introducing The Anthropic Institute

宣布成立 Anthropic 研究所。

Read more →

Sydney will become Anthropic’s fourth office in Asia-Pacific

悉尼将成为 Anthropic 在亚太地区的第四个办公室。

Read more →

Partnering with Mozilla to improve Firefox’s security

与 Mozilla 合作,提升 Firefox 浏览器的安全性。

Read more →


Google AI Blog

Here’s how our TPUs power increasingly demanding AI workloads.

介绍谷歌 TPU 如何通过强大的计算能力支持日益增长的 AI 工作负载。

Read more →

Elevating Austria: Google invests in its first data center in the Alps.

谷歌在奥地利阿尔卑斯山地区投资建设首个数据中心,预计创造 100 个直接就业岗位。

Read more →

We’re launching two specialized TPUs for the agentic era.

谷歌推出两款专为“代理时代”设计的第八代 TPU 芯片。

Read more →

3 new ways Ads Advisor is making Google Ads safer and faster

Ads Advisor 集成三项新的代理安全和政策功能,旨在保护并简化 Google Ads 账户管理。

Read more →

7 ways to travel smarter this summer, with help from Google

谷歌分享 7 个利用 AI 工具规划夏季旅行的技巧,帮助用户寻找优惠并探索目的地。

Read more →

A new way to explore the web with AI Mode in Chrome

Chrome 浏览器推出 AI 模式,改变用户与网页的交互方式。

Read more →

New ways to create personalized images in the Gemini app

Gemini 应用推出新功能,利用个人上下文和 Google Photos 创建个性化图像。

Read more →

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

Gemini 3.1 Flash TTS 现已在谷歌产品中可用,提供下一代富有表现力的 AI 语音。

Read more →

Turn your best AI prompts into one-click tools in Chrome

Chrome 推出“技能”功能,允许用户发现、保存并重用 AI 工作流。

Read more →

Bringing people together at AI for the Economy Forum

谷歌在华盛顿特区举办“AI 经济论坛”,汇集各界人士探讨 AI 对经济的影响。

Read more →


Hugging Face Blog

Gemma 4 VLA Demo on Jetson Orin Nano Super

Gemma 4 VLA 模型在 Jetson Orin Nano Super 上的演示。

Read more →

QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard

QIMMA:一个以质量为先的阿拉伯语 LLM 排行榜。

Read more →

AI and the Future of Cybersecurity: Why Openness Matters

探讨 AI 与网络安全的未来,强调开放性的重要性。

Read more →

Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

Ecom-RLVE:面向电子商务对话代理的自适应可验证环境。

Read more →

The PR you would have opened yourself

关于 Transformers 到 MLX 的转换。

Read more →

Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers

使用 Sentence Transformers 训练和微调多模态嵌入与重排序模型。

Read more →

Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents

深入 VAKRA:分析代理的推理、工具使用及失败模式。

Read more →

Meet HoloTab by HCompany. Your AI browser companion.

介绍 HoloTab,你的 AI 浏览器伴侣。

Read more →

Waypoint-1.5: Higher-Fidelity Interactive Worlds for Everyday GPUs

Waypoint-1.5:为普通 GPU 提供更高保真度的交互世界。

Read more →

Multimodal Embedding & Reranker Models with Sentence Transformers

多模态嵌入与重排序模型。

Read more →


The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

探讨理性人与理性 AI 的目标设定,提出将行动与实践对齐的德性伦理视角。

Read more →

AGI Is Not Multimodal

文章认为,将语言作为思维模型会导致我们忽视具身智能,AGI 不应仅仅是多模态的。

Read more →

Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

探讨数学在现代机器学习研究中的角色转变,从理论驱动转向工程驱动。

Read more →

What’s Missing From LLM Chatbots: A Sense of Purpose

指出 LLM 聊天机器人虽然基准测试分数不断提高,但缺乏真正的“目的感”,用户体验并未同步提升。

Read more →

We Need Positive Visions for AI Grounded in Wellbeing

呼吁建立以人类福祉为基础的 AI 积极愿景,反思 AI 对社会的深远影响。

Read more →

Financial Market Applications of LLMs

探讨 LLM 在金融市场中的应用,分析其在序列建模方面的潜力。

Read more →

A Brief Overview of Gender Bias in AI

简要概述 AI 中的性别偏见问题及其讨论。

Read more →

Mamba Explained

解释 Mamba 模型,作为 Transformer 的替代方案,解决了长序列处理的效率问题。

Read more →

Car-GPT: Could LLMs finally make self-driving cars happen?

探讨 LLM 在自动驾驶中的应用潜力及面临的挑战。

Read more →

Do text embeddings perfectly encode text?

探讨文本嵌入的局限性,指出“Vec2text”技术揭示了嵌入数据的安全风险。

Read more →


arXiv CS.AI

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

研究揭示了 LLM 普遍存在的“工具过度使用”现象,即在不需要时倾向于使用外部工具而非内部知识。

Read more →

AI to Learn 2.0: A Deliverable-Oriented Governance Framework and Maturity Rubric for Opaque AI in Learning-Intensive Domains

提出针对学习密集型领域中不透明 AI 的治理框架和成熟度评估标准。

Read more →

Algorithm Selection with Zero Domain Knowledge via Text Embeddings

提出 ZeroFolio 方法,利用预训练文本嵌入实现无需领域知识的算法选择。

Read more →

Exploring Data Augmentation and Resampling Strategies for Transformer-Based Models to Address Class Imbalance in AI Scoring of Scientific Explanations in NGSS Classroom

研究数据增强和重采样策略,以解决 AI 在科学解释评分中的类别不平衡问题。

Read more →

Explainable AML Triage with LLMs: Evidence Retrieval and Counterfactual Checks

利用 LLM 进行可解释的反洗钱(AML)交易监控,通过证据检索和反事实检查提升审计效率。

Read more →

ThermoQA: A Three-Tier Benchmark for Evaluating Thermodynamic Reasoning in Large Language Models

发布 ThermoQA 基准测试,评估 LLM 在工程热力学推理方面的能力。

Read more →

Automated Detection of Dosing Errors in Clinical Trial Narratives: A Multi-Modal Feature Engineering Approach with LightGBM

提出一种自动化系统,利用多模态特征工程检测临床试验叙述中的给药错误。

Read more →

Inference Headroom Ratio: A Diagnostic and Control Framework for Inference Stability Under Constraint

提出推理余量比(IHR),用于表征约束决策系统中的推理稳定性。

Read more →


arXiv CS.CL

Evidence of Layered Positional and Directional Constraints in the Voynich Manuscript: Implications for Cipher-Like Structure

分析伏尼契手稿的字素序列,揭示了其分层结构,暗示了类似密码的性质。

Read more →

Can We Locate and Prevent Stereotypes in LLMs?

研究 LLM 内部的刻板印象定位,探讨如何预防这些有害偏见。

Read more →

Do Hallucination Neurons Generalize? Evidence from Cross-Domain Transfer in LLMs

研究“幻觉神经元”的泛化能力,证明其在不同领域间具有一致的预测效果。

Read more →

OThink-SRR1: Search, Refine and Reasoning with Reinforced Learning for Large Language Models

提出 OThink-SRR1 框架,通过强化学习优化 LLM 的检索、细化和推理过程。

Read more →

Saying More Than They Know: A Framework for Quantifying Epistemic-Rhetorical Miscalibration in Large Language Models

提出量化 LLM 认知-修辞失调的框架,分析其修辞强度与知识基础的不匹配。

Read more →

TTKV: Temporal-Tiered KV Cache for Long-Context LLM Inference

提出 TTKV 缓存机制,优化长上下文 LLM 推理的内存占用。

Read more →

Hybrid Multi-Phase Page Matching and Multi-Layer Diff Detection for Japanese Building Permit Document Review

提出混合多阶段页面匹配算法,用于日本建筑许可文件的自动化审查。

Read more →

Cognis: Context-Aware Memory for Conversational AI Agents

提出 Cognis 内存架构,为对话 AI 代理提供上下文感知的持久化记忆。

Read more →


WIRED

Newly Deciphered Sabotage Malware May Have Targeted Iran’s Nuclear Program—and Predates Stuxnet

研究人员破解了 2005 年的神秘恶意软件 Fast16,该软件可能早于 Stuxnet,用于破坏伊朗核计划的模拟软件。

Read more →

Rednote Draws a Line Between China and the World

Rednote(小红书)在海外扩张过程中,正采取措施将中国用户与国际受众进行隔离。

Read more →

Apple’s Next Chapter, SpaceX and Cursor Strike a Deal, and Palantir’s Controversial Manifesto

Uncanny Valley 播客讨论了蒂姆·库克在苹果的遗产、SpaceX 与 Cursor 的合作以及 Palantir 的争议性宣言。

Read more →

At ‘AI Coachella,’ Stanford Students Line Up to Learn From Silicon Valley Royalty

斯坦福大学的 CS 153 课程因邀请硅谷大佬授课而走红,引发了校园内外的广泛关注。

Read more →

Lume Cube Edge Light Go Review (2026): Versatile, Portable

Lume Cube Edge Light Go 便携灯评测,称其为功能最强大、用途最广泛的便携照明设备。

Read more →

These New Smart Glasses From Ex-OnePlus Engineers Have a Hidden Cost

前一加工程师开发的智能眼镜存在隐藏成本,AI 功能仅免费一年,后续收费标准尚不明确。

Read more →

The Best Robotic Pool Cleaners of 2026: Beatbot, iGarden, Dreame

2026 年最佳泳池清洁机器人推荐,包括 Beatbot、iGarden 和 Dreame 等品牌。

Read more →

Best Fitbit Models for Beginners, Athletes, and Kids (2026)

2026 年最佳 Fitbit 型号推荐,涵盖初学者、运动员和儿童的不同需求。

Read more →

Best Robot Vacuum of 2026: Shark, Eufy

2026 年最佳扫地机器人推荐,Shark 和 Eufy 表现出色。

Read more →


Lobsters

Who even uses jemalloc in 2026 anyway? (many major projects)

探讨 jemalloc 在 2026 年的使用现状,指出许多大型项目仍在使用该内存分配器。

Read more →

Ubuntu 26.04 LTS Release

Ubuntu 26.04 LTS 版本发布说明。

Read more →

Meshcore.io - Why The Split?

Meshcore.io 解释其项目拆分的原因。

Read more →

How The Heck Does Shazam Work?

深入解析 Shazam 的工作原理。

Read more →

Security issues found within rust-coreutils

Ubuntu 讨论 rust-coreutils 中发现的安全问题。

Read more →

Email could have been X.400 times better

探讨电子邮件协议,认为 X.400 本可以比 SMTP 更好。

Read more →

Borrow-checking without type-checking

探讨在没有类型检查的情况下实现借用检查的可能性。

Read more →

Single-pass palette refinement and ordered dithering

介绍单次调色板细化和有序抖动算法。

Read more →


DEV Community

Anthropic CVP Run 3 — Does Claude’s Safety Stack Scale Down to Haiku 4.5?

测试 Anthropic 的 Claude Haiku 4.5 模型在安全验证程序中的表现,结果显示其安全堆栈在小模型上依然有效。

Read more →

Feature Flags in Go: A Practical Guide with Examples

Go 语言中功能标志(Feature Flags)的实用指南。

Read more →

Feature Flags in Python: Django, FastAPI & Flask Guide

Python(Django, FastAPI, Flask)中功能标志的实现指南。

Read more →

Feature Flag Platform Comparison 2026: An Honest Self-Audit

2026 年功能标志平台对比,包含对自身产品的诚实审计。

Read more →

How to Implement Gradual Rollouts Without Breaking Production

如何实现渐进式发布而不破坏生产环境。

Read more →

Feature Flags at the Edge: What Cloudflare Flagship Means for the Category

探讨 Cloudflare Flagship 的发布对边缘功能标志市场的影响。

Read more →

Como instalar a linguagem de programação Go (Golang)

Go 语言安装指南(葡萄牙语)。

Read more →

Modernizing Data Movement for the AI-Ready Enterprises

为 AI 就绪型企业实现数据移动的现代化。

Read more →

测试文章2Hashnode专属

Hashnode 专属测试文章。

Read more →

We built a free live-scores widget you can drop into any website in 30 seconds

开发了一个免费的实时比分小部件,可快速嵌入任何网站。

Read more →


Meta Engineering

Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

Meta 升级了 Facebook 群组搜索功能,采用混合检索架构和自动化模型评估,提升社区内容发现效率。

Read more →

Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

介绍 Meta 的容量效率计划,利用统一的 AI 代理平台自动化修复基础设施性能问题。

Read more →

Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

分享 Meta 在后量子密码学(PQC)迁移中的经验,提出 PQC 迁移级别框架。

Read more →

Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases

Meta 如何通过双栈架构解决 WebRTC 内部版本与上游脱节的问题。

Read more →

Trust But Canary: Configuration Safety at Scale

Meta Tech 播客讨论配置发布的安全保障机制,包括金丝雀发布和渐进式部署。

Read more →

How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

Meta 利用 AI 代理映射大规模数据流水线中的“部落知识”,提升 AI 编码助手的理解能力。

Read more →

KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

介绍 Meta 的排名工程师代理,能够自主设计、执行和分析排名模型实验。

Read more →

Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta 扩展广告推荐模型至 LLM 规模,通过自适应排名模型提升广告投放效果。

Read more →

AI for American-Produced Cement and Concrete

Meta 发布新的 AI 模型,帮助美国建筑行业设计高质量、可持续的混凝土混合物。

Read more →


DeepMind Blog

Decoupled DiLoCo: A new frontier for resilient, distributed AI training

介绍 Decoupled DiLoCo,一种用于弹性分布式 AI 训练的新方法。

Read more →

Partnering with industry leaders to accelerate AI transformation

DeepMind 与全球咨询公司合作,将前沿 AI 技术带给全球组织。

Read more →

Gemini 3.1 Flash TTS: the next generation of expressive AI speech

介绍 Gemini 3.1 Flash TTS,提供精确的音频标签控制,实现富有表现力的语音生成。

Read more →

Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning

Gemini Robotics-ER 1.6 增强了空间推理和多视图理解能力,助力自主机器人任务。

Read more →

Gemma 4: Byte for byte, the most capable open models

发布 Gemma 4,这是目前最智能的开源模型,专为高级推理和代理工作流设计。

Read more →

Gemini 3.1 Flash Live: Making audio AI more natural and reliable

Gemini 3.1 Flash Live 改进了语音交互的精度和延迟,使 AI 语音更自然、可靠。

Read more →

Protecting people from harmful manipulation

DeepMind 研究 AI 在金融和健康领域的有害操纵风险,并制定新的安全措施。

Read more →

Lyria 3 Pro: Create longer tracks in more

推出 Lyria 3 Pro,支持生成更长的音乐轨道,并具备结构感知能力。

Read more →

Measuring progress toward AGI: A cognitive framework

引入衡量 AGI 进展的认知框架,并启动 Kaggle 黑客马拉松以构建相关评估。

Read more →

From games to biology and beyond: 10 years of AlphaGo’s impact

回顾 AlphaGo 十年历程,探讨其如何催化科学发现并铺平通往 AGI 的道路。

Read more →


Microsoft AI Blog

A conversation with Kevin Scott: What’s next in AI

与 Kevin Scott 对话,探讨 AI 的未来发展方向。

Read more →

From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative

探讨品牌如何利用微软 AI 提升生产力和创造力。

Read more →

Microsoft open sources its ‘farm of the future’ toolkit

微软开源其“未来农场”工具包。

Read more →

How data and AI will transform contact centres for financial services

探讨数据和 AI 如何转型金融服务行业的联络中心。

Read more →

AI-equipped drones study dolphins on the edge of extinction

利用 AI 无人机研究濒临灭绝的海豚。

Read more →

Online math tutoring service uses AI to help boost students’ skills and confidence

在线数学辅导服务利用 AI 提升学生的技能和信心。

Read more →

AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan

AI-Mimi 为日本听障用户构建包容性的电视体验。

Read more →

Microsoft’s framework for building AI systems responsibly

微软负责任地构建 AI 系统的框架。

Read more →

Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade

新加坡开发亚洲首个 AI 移动应用,用于识别鲨鱼和鳐鱼鳍,打击非法野生动物贸易。

Read more →

The opportunity at home – can AI drive innovation in personal assistant devices and sign language?

探讨 AI 在个人助理设备和手语创新方面的机会。

Read more →


VentureBeat AI

Railway secures $100 million to challenge AWS with AI-native cloud infrastructure

Railway 融资 1 亿美元,旨在通过 AI 原生云基础设施挑战 AWS。

Read more →

Claude Code costs up to $200 a month. Goose does the same thing for free.

对比 Claude Code 的高昂费用与免费替代品 Goose。

Read more →

Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews

Listen Labs 融资 6900 万美元,此前曾通过病毒式广告牌招聘活动引发关注。

Read more →

Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI

Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域与微软和谷歌竞争。

Read more →

Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required

Anthropic 推出 Cowork,一款无需编码即可在本地文件上工作的 Claude 桌面代理。

Read more →

Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research 发布开源编码模型 NousCoder-14B,性能强劲。

Read more →

The creator of Claude Code just revealed his workflow, and developers are losing their minds

Claude Code 的创建者分享其工作流,引发开发者社区热议。

Read more →


arXiv CS.LG

WorkflowGen: an adaptive workflow generation mechanism driven by trajectory experience

提出 WorkflowGen,一种基于轨迹经验的自适应工作流生成机制。

Read more →

Transparent Screening for LLM Inference and Training Impacts

提出透明筛选框架,用于评估 LLM 推理和训练的影响。

Read more →

Accelerating PayPal’s Commerce Agent with Speculative Decoding: An Empirical Study on EAGLE3 with Fine-Tuned Nemotron Models

研究利用推测解码加速 PayPal 商业代理的推理过程。

Read more →

On-Meter Graph Machine Learning: A Case Study of PV Power Forecasting for Grid Edge Intelligence

研究图机器学习在电表边缘智能中的应用,用于光伏发电预测。

Read more →

Expert Upcycling: Shifting the Compute-Efficient Frontier of Mixture-of-Experts

提出专家升级(Expert Upcycling)方法