2026-04-29

今日要点


Hacker News

Ghostty is leaving GitHub

Ghostty 宣布将离开 GitHub。作者作为 GitHub 的资深用户,在过去 18 年中几乎每天都在使用该平台,此次决定离开显得颇为感伤。

Read more →


Your phone is about to stop being yours

文章指出,从 2026 年 9 月起,Google 将强制执行一项更新,要求所有 Android 应用开发者必须在 Google 注册、签署合同并提交政府身份证明,否则应用将被封锁。此举被认为将彻底改变 Android 设备的开放性。

Read more →


Localsend: An open-source cross-platform alternative to AirDrop

LocalSend 是一款免费、开源的跨平台文件传输工具,旨在提供 AirDrop 的替代方案。它支持多种语言,并允许用户在不同设备间轻松共享文件。

Read more →


UAE to leave OPEC

阿联酋正式宣布退出石油输出国组织(OPEC)。这一决定标志着该国在近 60 年的成员身份后,将寻求更独立的能源政策。

Read more →


Before GitHub

作者回顾了在 GitHub 出现之前的开源软件托管经历,包括使用 SourceForge、Trac 安装包以及 Subversion 仓库的往事,探讨了开源托管平台的演变。

Read more →


GTFOBins

GTFOBins 是一个精选的 Unix 类可执行文件列表,这些文件常被用于绕过本地安全限制、提升权限或在受限环境中执行非法操作,是安全研究人员的重要参考工具。

Read more →


An update on GitHub availability

GitHub 官方针对近期两次服务中断事件发布了说明,向用户致歉,并详细介绍了公司为提高平台可靠性所采取的改进措施。

Read more →


VibeVoice: Open-source frontier voice AI

VibeVoice 是一个开源的前沿语音 AI 项目,旨在提供高质量的语音交互能力。

Read more →


Period tracking app, Flo, found to be selling user data to Meta

经期追踪应用 Flo 被曝向 Meta 出售用户数据,引发了关于健康类应用隐私保护的严重质疑。

Read more →


UAE Leaves OPEC

阿联酋退出 OPEC 的新闻引发了市场关注,路透社报道了该组织的官方声明。

Read more →


Who owns the code Claude Code wrote?

文章探讨了 AI 代理(如 Claude Code、Cursor)生成的代码版权归属问题。指出这些代码可能面临版权不可主张、雇主所有权或开源许可证污染等法律风险。

Read more →


GitHub RCE Vulnerability: CVE-2026-3854 Breakdown

Wiz Research 披露了 GitHub 内部 git 基础设施中的一个严重远程代码执行(RCE)漏洞(CVE-2026-3854),攻击者可通过注入漏洞在后端服务器执行任意命令。

Read more →


Google and Pentagon reportedly agree on deal for ‘any lawful’ use of AI

据报道,Google 与五角大楼达成了一项关于 AI 使用的协议,允许政府在“任何合法”范围内使用 Google 的 AI 技术,且 Google 似乎无法否决政府的具体用途。

Read more →


Claude.ai unavailable and elevated errors on the API

Claude.ai 平台近期出现服务不可用及 API 错误率升高的情况,官方正在处理相关事故。

Read more →


OpenAI CEO’s Identity Verification Company Announced Fake Bruno Mars Partnership

OpenAI CEO 关联的身份验证公司被曝宣布了与 Bruno Mars 的虚假合作伙伴关系,引发舆论哗然。

Read more →


TechCrunch

How one venture firm is investing in an increasingly fragmented world

地缘政治动荡使得风险投资面临挑战,Kompas VC 正在通过专注于物理世界相关的初创企业来开辟新的投资利基市场。

Read more →


At his OpenAI trial, Musk relitigates an old friendship

在针对 OpenAI 的审判中,马斯克在宣誓后首次公开详细讲述了他与 Sam Altman 之间破裂的友谊,试图通过法庭重塑公众对 OpenAI 成立初衷的认知。

Read more →


Amazon is already offering new OpenAI products on AWS

在微软放弃 OpenAI 独家权利后,AWS 迅速宣布提供包括新代理服务在内的一系列 OpenAI 模型产品。

Read more →


Amazon launches an AI-powered audio Q&A experience on product pages

亚马逊推出“加入聊天”功能,允许用户通过语音向 AI 提问,并获得关于产品的音频回答。

Read more →


Match Group invests $100M in Sniffies, a cruising app for gay men

Match Group 投资 1 亿美元于男同性恋社交应用 Sniffies,试图通过该平台重新激发移动用户对在线浪漫社交的兴趣。

Read more →


Google expands Pentagon’s access to its AI after Anthropic’s refusal

在 Anthropic 拒绝将 AI 用于国内大规模监控和自主武器后,Google 与美国国防部签署了新的 AI 合作合同。

Read more →


Paragon is not collaborating with Italian authorities probing spyware attacks, report says

尽管曾承诺配合调查,但以色列间谍软件制造商 Paragon 据称并未回应意大利当局关于针对记者和活动人士的黑客攻击调查请求。

Read more →


US Supreme Court appears split over controversial use of ‘geofence’ search warrants

美国最高法院正在审理关于“地理围栏”搜查令的案件,法官们对是否允许警方通过搜索科技巨头数据库来识别犯罪嫌疑人存在分歧。

Read more →


Australia forces Big Tech firms to pay for news or face a 2.25% tax

澳大利亚强制大型科技公司为新闻内容付费,否则将面临 2.25% 的税收。通过与媒体机构达成协议,科技公司可降低税率。

Read more →


Lovable launches its vibe-coding app on iOS and Android

Lovable 在 iOS 和 Android 平台推出了其“氛围编码”(vibe-coding)应用,旨在让开发者能够随时随地进行 Web 应用开发。

Read more →


The Verge

It’s primetime for conspiracy theorist video creators

白宫记者晚宴因枪击事件中断后,阴谋论视频创作者迅速涌现,声称这是一场“假旗行动”,反映了当前网络环境下虚假信息传播的严峻态势。

Read more →


Elon Musk appeared more petty than prepared

在 Musk v. Altman 的庭审中,马斯克作为首位证人出庭。报道称他表现得有些心不在焉且准备不足,与此前在诽谤案中展现的魅力判若两人。

Read more →


James Comey indicted over Instagram seashell photo that allegedly threatened Trump

美国司法部再次起诉前 FBI 局长詹姆斯·科米,理由是他去年在 Instagram 上发布的一张贝壳照片被指威胁到了唐纳德·特朗普总统。

Read more →


Elon Musk tells the jury that all he wants to do is save humanity

在庭审中,马斯克将自己定位为“人类救星”,详细讲述了从南非成长到前往加拿大求学的经历,以此强调他创立 OpenAI 的初衷。

Read more →


泰勒·斯威夫特正加大法律力度打击 AI 模仿者,近期提交了多项商标申请,试图保护自己的形象和声音免受 AI 滥用。

Read more →


Now YouTube TV lets you multiview any channel you want

YouTube TV 宣布推出“完全可定制”的多画面观看功能,用户可以自由组合最多四个直播流,打造个性化的观看体验。

Read more →


The FCC is going after the broadcast licenses of Disney-owned ABC stations

美国联邦通信委员会(FCC)要求迪士尼旗下的 ABC 电视台提前申请广播执照续期,此举被视为对迪士尼 DEI(多元、公平与包容)政策调查的一部分。

Read more →


Live updates from Elon Musk and Sam Altman’s court battle over the future of OpenAI

关于 OpenAI 未来命运的庭审正在进行中,马斯克指控 OpenAI 放弃了造福人类的初衷,转而追求利润。

Read more →


Elon Musk takes the stand in high-profile trial against OpenAI

马斯克正式开始在针对 Sam Altman 和 Greg Brockman 的诉讼中作证,回顾了 OpenAI 早期创立时的分歧。

Read more →


You can get dragged into a police investigation by proximity alone — for now

最高法院正在审理 Chatrie v. United States 案,探讨警方使用“地理围栏”搜查令寻找嫌疑人的合法性,这可能对所有手机用户的隐私产生深远影响。

Read more →


Ars Technica

Anti-Trump Instagram pic of seashells now enough to indict ex-FBI directors

针对前 FBI 局长因一张贝壳照片被起诉的事件,文章评论称这简直是一场闹剧。

Read more →


Flesh-eating bacteria devour man’s arm and leg in just three days

一名男子在短短三天内被食肉细菌吞噬了手臂和腿部,医生描述其肢体出现变色和爆裂现象。

Read more →


FCC orders review of ABC licenses after Kimmel joke offends Trump and first lady

在吉米·坎摩尔(Jimmy Kimmel)开玩笑称梅拉尼娅为“准遗孀”后,FCC 下令审查 ABC 电视台的执照。

Read more →


Drone pilot makes US rescind no-fly zones around unmarked, moving ICE vehicles

一名无人机飞行员成功促使美国联邦航空管理局(FAA)修改了针对 ICE(移民及海关执法局)无标记车辆周围的禁飞区规定。

Read more →


Humanoid robots start sorting luggage in Tokyo airport test amid labor shortage

东京羽田机场正在测试使用人形机器人进行行李分拣和机舱清洁,以应对严重的劳动力短缺问题。

Read more →


GitHub will start charging Copilot users based on their actual AI usage

GitHub 宣布将根据实际 AI 使用量对 Copilot 用户收费,以应对不断攀升的推理成本。

Read more →


Electrical current might be the key to a better cup of coffee

俄勒冈大学的科学家利用电池测试工具测量咖啡的风味特征,发现电流可能是提升咖啡口感的关键。

Read more →


The great American data center divide

文章探讨了美国农村社区对 AI 基础设施建设的抵触情绪,以及数据中心带来的社会与环境争议。

Read more →


A billion miles in less than a decade: GM’s Super Cruise reaches a milestone

通用汽车的 Super Cruise 驾驶辅助系统在不到十年内实现了 10 亿英里的行驶里程,该系统目前仅限于在地理围栏覆盖的高速公路上使用。

Read more →


Start with the sensors, then design the rest: How Zoox built its robotaxi

文章介绍了 Zoox 如何通过“先设计传感器,再设计车身”的理念,打造出具有双向行驶优势的自动驾驶出租车。

Read more →


Product Hunt

Brila

基于真实 Google 地图评论生成的一页式网站工具。

Read more →


Fathom 3.0

AI 会议纪要工具,现已实现无机器人化,并集成至 ChatGPT 和 Claude 等平台。

Read more →


ProdShort

将会议内容转化为可直接发布的短视频和社交媒体帖子的工具。

Read more →


Jupid

使用 Claude Code 协助进行税务申报的工具。

Read more →


Velo

通过视频消息分享任何内容的平台。

Read more →

Dune

支持上下文感知的 Mac 键盘,用于自动化工作流和会议管理。

Read more →


NovaVoice

智能听写与 AI 助手,支持通过语音控制应用程序。

Read more →


Figma for Agents

连接设计系统的 AI 代理设计工具。

Read more →


Claude Code Routines

通过智能例程实现 Claude Code 任务的自动化。

Read more →


Offsite

构建人类与 AI 代理协作团队,并实时监控其工作流程的平台。

Read more →


MIT Technology Review

今日简报重点关注马斯克与 Altman 的法律对决,以及 AI 行业面临的盈利难题。

Read more →


Elon Musk and Sam Altman are going to court over OpenAI’s future

马斯克与 Sam Altman 的法律纠纷进入庭审阶段,这可能决定 OpenAI 是否能继续作为营利性企业存在,甚至可能导致管理层变动。

Read more →


The missing step between hype and profit

文章探讨了 AI 行业从炒作到盈利之间缺失的关键环节,分析了为何当前 AI 落地面临巨大挑战。

Read more →


Rebuilding the data stack for AI

企业在部署 AI 时发现,最大的障碍在于数据状态。文章指出,AI 规模化应用需要更扎实的数据基础设施。

Read more →


The Download: DeepSeek’s latest AI breakthrough, and the race to build world models

简报介绍了 DeepSeek V4 模型的突破,以及全球范围内构建“世界模型”的竞争。

Read more →


Three reasons why DeepSeek’s new model matters

DeepSeek V4 凭借更长的上下文处理能力和高效设计,成为开源 AI 领域的重要里程碑。

Read more →


The Download: supercharged scams and studying AI healthcare

简报讨论了 AI 驱动的诈骗升级以及 AI 在医疗保健领域的应用研究。

Read more →


Health-care AI is here. We don’t know if it actually helps patients.

尽管 AI 在医疗领域应用广泛,但目前尚无确凿证据表明其能显著改善患者预后。

Read more →


The Download: introducing the Nature issue

本期简报介绍了关于“自然”的专题,探讨了人类活动对自然环境的深远影响。

Read more →


Will fusion power get cheap? Don’t count on it.

研究表明,即便核聚变技术实现商业化,其成本也未必会像电池技术那样迅速下降。

Read more →


mattpocock / skills

为专业工程师准备的技能集,直接源自作者的 .claude 目录。

Read more →


abhigyanpatwari / GitNexus

GitNexus:零服务器代码智能引擎,在浏览器中运行,可创建知识图谱并内置 Graph RAG 代理,适合代码探索。

Read more →


ComposioHQ / awesome-codex-skills

精选的 Codex 实用技能列表,用于自动化 Codex CLI 和 API 工作流。

Read more →


davila7 / claude-code-templates

用于配置和监控 Claude Code 的 CLI 工具。

Read more →


HunxByts / GhostTrack

用于追踪位置或手机号码的工具。

Read more →


fspecii / ace-step-ui

开源 Suno 替代方案的专业 UI,支持 ACE-Step 1.5 AI 音乐生成,免费且无限制。

Read more →


public-apis / public-apis

免费 API 的集合列表。

Read more →


CJackHwang / ds2api

Deepseek 转 API 中间件,支持多账号轮询、Docker 部署,兼容 Google、Claude 和 OpenAI API 格式。

Read more →


Alishahryar1 / free-claude-code

在终端、VSCode 扩展或 Discord 中免费使用 claude-code 的工具。

Read more →


OpenAI Blog

OpenAI models, Codex, and Managed Agents come to AWS

OpenAI GPT 模型、Codex 和托管代理现已登陆 AWS,助力企业在 AWS 环境中构建安全 AI。

Read more →


Our commitment to community safety

OpenAI 介绍了其通过模型防护、滥用检测和政策执行来保护 ChatGPT 社区安全的承诺。

Read more →


OpenAI available at FedRAMP Moderate

OpenAI 现已获得 FedRAMP Moderate 授权,支持美国联邦机构安全采用 ChatGPT 企业版和 API。

Read more →


The next phase of the Microsoft OpenAI partnership

OpenAI 与微软宣布修订合作协议,简化合作流程,增加长期清晰度,并支持 AI 的持续创新。

Read more →


An open-source spec for orchestration: Symphony

OpenAI 推出开源编排规范 Symphony,旨在将问题追踪系统转化为始终在线的代理系统,提升工程效率。

Read more →


Choco automates food distribution with AI agents

Choco 利用 OpenAI API 简化食品分销流程,提升生产力并实现业务增长。

Read more →


Our principles

Sam Altman 分享了指导 OpenAI 工作的五项原则,旨在确保 AGI 造福全人类。

Read more →


GPT-5.5 System Card

GPT-5.5 的系统卡片。

Read more →


Introducing GPT-5.5

OpenAI 推出 GPT-5.5,这是目前最智能的模型,在编码、研究和数据分析等复杂任务中表现更出色。

Read more →


What is Codex?

介绍 Codex 如何通过自动化任务、连接工具和生成文档来提升工作效率。

Read more →


Anthropic Blog

Introducing Claude Opus 4.7

Anthropic 推出 Claude Opus 4.7,在编码、代理任务、视觉处理和多步任务中表现更强,一致性更高。

Read more →


Introducing Claude Design by Anthropic Labs

Anthropic Labs 推出 Claude Design,允许用户与 Claude 协作创建演示文稿、原型和设计稿。

Read more →


Claude is a space to think

Anthropic 承诺 Claude 将保持无广告,认为广告激励与提供真正有用的 AI 助手目标不符。

Read more →


Claude for Creative Work

Claude 在创意工作领域的应用介绍。

Read more →


Anthropic names Theo Hourmouzis General Manager of Australia & New Zealand and officially opens Sydney office

Anthropic 任命 Theo Hourmouzis 为澳新地区总经理,并正式开设悉尼办公室。

Read more →


An update on our election safeguards

关于选举安全保障措施的更新。

Read more →


Anthropic and NEC collaborate to build Japan’s largest AI engineering workforce

Anthropic 与 NEC 合作,旨在构建日本最大的 AI 工程人才队伍。

Read more →


Anthropic and Amazon expand collaboration for up to 5 gigawatts of new compute

Anthropic 与亚马逊扩大合作,计划增加高达 5 吉瓦的计算能力。

Read more →


Anthropic’s Long-Term Benefit Trust appoints Vas Narasimhan to Board of Directors

Anthropic 长期利益信托任命 Vas Narasimhan 为董事会成员。

Read more →


Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute

Anthropic 扩大与 Google 和 Broadcom 的合作,以获取下一代计算能力。

Read more →


Google AI Blog

Celebrating 20 years of Google Translate: Fun facts, tips and new features to try

Google 庆祝翻译服务 20 周年,分享了从 2006 年 AI 实验到支持近 250 种语言的历程。

Read more →


Join the new AI Agents Vibe Coding Course from Google and Kaggle

Google 与 Kaggle 联合推出 5 天 AI 代理强化课程,现已开放注册。

Read more →


8 Gemini tips for organizing your space (and life)

利用 Gemini 的 AI 能力整理家庭和数字空间,包括清洁计划和收件箱清理等技巧。

Read more →


Here’s how our TPUs power increasingly demanding AI workloads.

视频展示了 Google 的 TPU 如何为日益增长的 AI 工作负载提供动力。

Read more →


Elevating Austria: Google invests in its first data center in the Alps.

Google 宣布在奥地利 Kronstorf 建设其首个阿尔卑斯山数据中心,预计创造 100 个直接就业岗位。

Read more →


We’re launching two specialized TPUs for the agentic era.

Google 推出第八代 TPU,包含两款专为代理时代设计的芯片。

Read more →


3 new ways Ads Advisor is making Google Ads safer and faster

Ads Advisor 引入三项代理安全与政策功能,旨在保护并简化 Google Ads 账户管理。

Read more →


7 ways to travel smarter this summer, with help from Google

Google 分享了 7 个利用 AI 工具规划夏季旅行的技巧。

Read more →


A new way to explore the web with AI Mode in Chrome

Chrome 浏览器推出 AI 模式升级,改变用户与网页的交互方式。

Read more →


New ways to create personalized images in the Gemini app

Gemini 应用中的 Nano Banana 2 模型现可结合个人上下文和 Google 相册,创建独特的个性化图像。

Read more →


Hugging Face Blog

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

NVIDIA 推出 Nemotron 3 Nano Omni,支持文档、音频和视频代理的长上下文多模态智能。

Read more →


How to build scalable web apps with OpenAI’s Privacy Filter

介绍如何利用 OpenAI 的隐私过滤器构建可扩展的 Web 应用。

Read more →


DeepSeek-V4: a million-token context that agents can actually use

DeepSeek-V4 具备百万 token 上下文处理能力,可供 AI 代理实际使用。

Read more →


How to Use Transformers.js in a Chrome Extension

介绍如何在 Chrome 扩展中使用 Transformers.js。

Read more →


QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard

QIMMA:首个以质量为先的阿拉伯语大语言模型排行榜。

Read more →


AI and the Future of Cybersecurity: Why Openness Matters

探讨 AI 与网络安全的未来,强调开源在其中的重要性。

Read more →


Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

Ecom-RLVE:面向电子商务对话代理的自适应可验证环境。

Read more →


The PR you would have opened yourself

介绍自动生成 Pull Request 的相关技术。

Read more →


Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers

介绍如何使用 Sentence Transformers 训练和微调多模态嵌入与重排序模型。

Read more →


Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents

深入解析 VAKRA:探讨 AI 代理的推理、工具使用及故障模式。

Read more →


The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

文章探讨了 AI 对齐问题,认为理性的人和 AI 不应仅仅基于“目标”行事,而应基于实践和美德伦理。

Read more →


AGI Is Not Multimodal

文章反驳了 AGI 必然是多模态的观点,强调了人类智能中具身理解的重要性。

Read more →


Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

探讨了机器学习研究中数学角色的转变,指出计算密集型工程努力正逐渐取代数学原理架构设计。

Read more →


What’s Missing From LLM Chatbots: A Sense of Purpose

指出当前 LLM 聊天机器人虽然基准测试分数不断提高,但缺乏真正的“目的感”,导致用户体验提升有限。

Read more →


We Need Positive Visions for AI Grounded in Wellbeing

呼吁建立以人类福祉为基础的 AI 积极愿景,而非仅仅关注技术冲击。

Read more →


Financial Market Applications of LLMs

探讨了 LLM 在金融市场中的应用,分析了其在处理序列数据方面的潜力。

Read more →


A Brief Overview of Gender Bias in AI

简要概述并讨论了 AI 系统中存在的性别偏见问题。

Read more →


Mamba Explained

解释了 Mamba 模型,这是一种基于状态空间模型(SSM)的 AI 模型,旨在解决 Transformer 处理长序列时的低效问题。

Read more →


Car-GPT: Could LLMs finally make self-driving cars happen?

探讨 LLM 在自动驾驶中的应用潜力,以及其面临的信任与挑战。

Read more →


Do text embeddings perfectly encode text?

文章指出 Vec2text 技术可以将嵌入还原为文本,强调了嵌入数据安全协议的紧迫性。

Read more →


arXiv CS.AI

An Intelligent Fault Diagnosis Method for General Aviation Aircraft Based on Multi-Fidelity Digital Twin and FMEA Knowledge Enhancement

提出一种基于多保真数字孪生和 FMEA 知识增强的通用航空飞机智能故障诊断框架。

Read more →


PExA: Parallel Exploration Agent for Complex Text-to-SQL

提出 PExA,一种用于复杂 Text-to-SQL 任务的并行探索代理,旨在平衡延迟与性能。

Read more →


The Power of Power Law: Asymmetry Enables Compositional Reasoning

研究发现自然语言数据遵循幂律分布,这种不对称性实际上有助于模型学习组合推理能力。

Read more →


On the Existence of an Inverse Solution for Preference-Based Reductions in Argumentation

探讨了基于偏好的论证框架(PAF)中逆解的存在性。

Read more →


Towards Causally Interpretable Wi-Fi CSI-Based Human Activity Recognition with Discrete Latent Compression and LTL Rule Extraction

提出一种基于 Wi-Fi CSI 的因果可解释人类活动识别方法。

Read more →


FormalScience: Scalable Human-in-the-Loop Autoformalisation of Science with Agentic Code Generation in Lean

提出 FormalScience,一种利用代理代码生成实现科学推理自动形式化的可扩展人机协作系统。

Read more →


A Systematic Approach for Large Language Models Debugging

提出一种用于大语言模型调试的系统化方法,以应对其不透明和概率性带来的挑战。

Read more →


A Decoupled Human-in-the-Loop System for Controlled Autonomy in Agentic Workflows

提出一种解耦的人机协作系统,用于实现代理工作流中的受控自主性。

Read more →


arXiv CS.CL

Elderly-Contextual Data Augmentation via Speech Synthesis for Elderly ASR

提出一种通过语音合成进行数据增强的方法,以解决老年人语音识别(EASR)中的数据稀缺问题。

Read more →


Large Language Models Explore by Latent Distilling

提出 Exploratory Sampling(ESamp),一种通过潜在蒸馏进行语义探索的解码方法。

Read more →


GAIA-v2-LILT: Multilingual Adaptation of Agent Benchmark beyond Translation

GAIA-v2-LILT:超越机器翻译的多语言代理基准测试适配。

Read more →


ADE: Adaptive Dictionary Embeddings — Scaling Multi-Anchor Representations to Large Language Models

提出自适应字典嵌入(ADE),用于将多锚点表示扩展至大语言模型。

Read more →


Independent-Component-Based Encoding Models of Brain Activity During Story Comprehension

提出基于独立成分分析的脑活动编码模型,用于故事理解过程中的神经活动研究。

Read more →


BenchGuard: Who Guards the Benchmarks? Automated Auditing of LLM Agent Benchmarks

提出 BenchGuard,利用前沿 LLM 对代理基准测试进行自动化审计,以发现基准测试本身的缺陷。

Read more →


Dynamic Decision Learning: Test-Time Evolution for Abnormality Grounding in Rare Diseases

提出动态决策学习(DDL)框架,使冻结的视觉语言模型能够针对罕见病进行异常定位。

Read more →


A Survey on LLM-based Conversational User Simulation

关于基于 LLM 的对话用户模拟技术的综述。

Read more →


WIRED

20% Off LG Promo Code & Coupons | May 2026

LG 促销代码与优惠券,涵盖家电、电视及显示器。

Read more →


OpenAI Really Wants Codex to Shut Up About Goblins

OpenAI 要求其编码代理 Codex 避免讨论地精、小妖精等虚构生物,除非绝对必要。

Read more →


Elon Musk Testifies That He Started OpenAI to Prevent a ‘Terminator Outcome’

马斯克在庭审中作证称,他创立 OpenAI 是为了防止 AI 导致“终结者式”的灾难。

Read more →


Sniffies’ Users Worry About a ‘Straightification’ of the Gay Hookup App

Match Group 投资 Sniffies 引发用户担忧,担心该应用会失去其独特的同性社交属性。

Read more →


‘It’s Undignified’: Hundreds of Workers Training Meta’s AI Could Be Laid Off

Meta 在爱尔兰的承包商面临裁员,超过 700 名 AI 训练人员可能失去工作。

Read more →


The UK’s Answer to Darpa Wants to Rewire the Human Brain

英国的 ARIA 机构拥有 10 亿美元预算,旨在通过脑机接口技术解决癫痫和阿尔茨海默病等问题。

Read more →


Why Sharing a Screenshot Can Get You Jailed in the UAE

文章探讨了阿联酋严苛的在线内容法律,分享截图可能导致监禁。

Read more →


UAE to Exit OPEC After Nearly 60 Years

阿联酋将于 5 月 1 日正式退出 OPEC,此举将允许其在动荡的能源市场中提高产量。

Read more →


Amazon’s Kindle Colorsoft Gets a Dark Mode (2026)

亚马逊的彩色电子阅读器 Kindle Colorsoft 终于支持深色模式。

Read more →


A DOGE Affiliate Is Now in Charge of the US Government’s ID Platform

Greg Hogan 被任命负责 Login.gov,该平台正计划整合驾照和护照信息,引发关于“国家 ID”的讨论。

Read more →


Lobsters

Carrot disclosure: Forgejo

关于 Forgejo 的披露信息。

Read more →


jjj

讨论帖。

Read more →


Ditching GitHub

关于离开 GitHub 的讨论。

Read more →


I Built My Own Hair Electrolysis Machine

作者分享了自己制造脱毛电解机的经历。

Read more →


Using a 1978 terminal in 2026 (DEC VT-100)

探讨在 2026 年使用 1978 年的 DEC VT-100 终端的体验。

Read more →


From GitHub to Codeberg/Forgejo

关于从 GitHub 迁移至 Codeberg/Forgejo 的讨论。

Read more →


Illegal vs Unwanted States

探讨非法状态与不想要状态的区别。

Read more →


DEV Community

When I Tried Doing Everything With AI, It Backfired

作者分享了尝试将 AI 应用于所有工作环节后的反思,指出过度依赖 AI 反而导致了效率下降。

Read more →


Tauri v2 vs Electron After 6 Months of Real Development — My Honest Take

作者对比了 Tauri v2 与 Electron 的开发体验,认为 Tauri 在包体积和性能上具有显著优势。

Read more →


Why We Banned ‘Within the Realm of…’ From Our AI Game Descriptions

文章分享了一个 HTML5 游戏门户网站如何通过修改提示词,修复了被 Google 算法判定为“规模化内容滥用”的问题。

Read more →


Why Most IoT Visibility Stacks Stall at Level 2 (And What Climbing to Level 3 Actually Looks Like in Code)

探讨了 IoT 可视化架构的局限性,并分享了如何从 Level 2 升级到 Level 3 的代码实践。

Read more →


How I Revamped a Local Cram School Website Using AI (Claude, Gemini, and Codex)

作者分享了利用 Claude、Gemini 和 Codex 现代化改造日本农村补习班网站的经历。

Read more →


🚀 From Prompt to Production: Building an AI App with Gemini & Vertex AI (Google Cloud NEXT ’26 Deep Dive)

分享了在 Google Cloud NEXT ‘26 大会后,如何利用 Gemini 和 Vertex AI 在几分钟内构建 AI 应用的实战经验。

Read more →


The Automation Paradox: You Cannot Prompt Your Way Out of an Architecture Problem

指出自动化悖论:提示词无法解决架构层面的根本问题。

Read more →


Best Daily Study Routine for AWS AIF-C01 Exam Preparation

为 AWS Certified AI Practitioner 考试设计的高效每日学习计划。

Read more →


Why Data Quality is Becoming More Important Than Model Size in Modern AI Systems

探讨了为何在现代 AI 系统中,数据质量比模型规模更为重要。

Read more →


Debugging HTTP Requests in ASP.NET Core Across Environments

分享了在 ASP.NET Core 中跨环境调试 HTTP 请求的技巧,以解决开发与生产环境不一致的问题。

Read more →


Meta Engineering

Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

Meta 改造了 Facebook 群组搜索功能,采用混合检索架构和自动化模型评估,提升社区内容发现效率。

Read more →


Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

Meta 分享了其容量效率计划,利用统一的 AI 代理平台自动化发现并修复基础设施性能问题。

Read more →


Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways

Meta 分享了后量子密码学(PQC)迁移的经验,提出了 PQC 迁移等级框架,帮助组织管理迁移复杂性。

Read more →


Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases

Meta 分享了如何通过构建双栈架构,解决 WebRTC 内部版本与上游社区版本脱节的问题。

Read more →


Trust But Canary: Configuration Safety at Scale

Meta 探讨了如何通过金丝雀发布和渐进式部署,确保大规模配置更新的安全性。

Read more →


How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

Meta 利用 AI 代理成功映射了大规模数据流水线中的“部落知识”,提升了代码维护效率。

Read more →


KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

介绍 Meta 的排名工程师代理(Ranking Engineer Agent),该代理可自主设计并执行广告排名模型实验。

Read more →


Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

Meta 推出自适应排名模型,将广告推荐系统扩展至 LLM 规模,以实现更深层的用户意图理解。

Read more →


AI for American-Produced Cement and Concrete

Meta 发布了一款用于设计可持续混凝土配方的新 AI 模型,助力美国建筑行业。

Read more →


DeepMind Blog

Announcing our partnership with the Republic of Korea

Google DeepMind 与韩国政府合作,利用前沿 AI 模型加速科学突破。

Read more →


Decoupled DiLoCo: A new frontier for resilient, distributed AI training

介绍 Decoupled DiLoCo,一种用于弹性分布式 AI 训练的新方法。

Read more →


Partnering with industry leaders to accelerate AI transformation

DeepMind 与全球咨询公司合作,将前沿 AI 能力带给全球组织。

Read more →


Gemini 3.1 Flash TTS: the next generation of expressive AI speech

Gemini 3.1 Flash TTS 引入精细音频标签,提供对 AI 语音生成的精确控制。

Read more →


Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning

Gemini Robotics-ER 1.6 增强了空间推理和多视角理解能力,助力自主机器人任务。

Read more →


Gemma 4: Byte for byte, the most capable open models

Gemma 4:DeepMind 迄今最智能的开源模型,专为高级推理和代理工作流构建。

Read more →


Gemini 3.1 Flash Live: Making audio AI more natural and reliable

Gemini 3.1 Flash Live 改进了语音模型的精度和延迟,使交互更自然流畅。

Read more →


Protecting people from harmful manipulation

DeepMind 研究 AI 在金融和健康领域的有害操纵风险,并制定了新的安全措施。

Read more →


Lyria 3 Pro: Create longer tracks in more

Lyria 3 Pro 允许创建具有结构意识的更长音乐轨道,并集成至更多 Google 产品。

Read more →


Measuring progress toward AGI: A cognitive framework

DeepMind 引入衡量 AGI 进展的认知框架,并启动 Kaggle 黑客松以构建相关评估体系。

Read more →


Microsoft AI Blog

A conversation with Kevin Scott: What’s next in AI

Kevin Scott 探讨 AI 的未来发展方向。

Read more →


From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative

介绍品牌如何利用微软 AI 提升生产力和创造力。

Read more →


Microsoft open sources its ‘farm of the future’ toolkit

微软开源其“未来农场”工具包。

Read more →


How data and AI will transform contact centres for financial services

探讨数据与 AI 如何转型金融服务行业的联络中心。

Read more →


AI-equipped drones study dolphins on the edge of extinction

利用 AI 无人机研究濒危海豚。

Read more →


Online math tutoring service uses AI to help boost students’ skills and confidence

在线数学辅导服务利用 AI 提升学生的技能与信心。

Read more →


AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan

AI-Mimi 为日本听障用户构建包容性的电视体验。

Read more →


Microsoft’s framework for building AI systems responsibly

微软负责任地构建 AI 系统的框架。

Read more →


Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade

新加坡开发亚洲首个 AI 移动应用,用于识别鲨鱼和鳐鱼鳍,以打击非法野生动物贸易。

Read more →


The opportunity at home – can AI drive innovation in personal assistant devices and sign language?

探讨 AI 在个人助理设备和手语创新方面的潜力。

Read more →


VentureBeat AI

Railway secures $100 million to challenge AWS with AI-native cloud infrastructure

Railway 融资 1 亿美元,旨在通过 AI 原生云基础设施挑战 AWS。

Read more →


Claude Code costs up to $200 a month. Goose does the same thing for free.

文章对比了 Anthropic 的 Claude Code(高昂订阅费)与免费替代方案 Goose。

Read more →


Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews

Listen Labs 通过病毒式广告牌招聘活动融资 6900 万美元,用于扩展 AI 客户访谈业务。

Read more →


Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI

Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域与微软和 Google 展开竞争。

Read more →


Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required

Anthropic 推出 Cowork,这是一款无需编码即可在本地文件上工作的 Claude 桌面代理。

Read more →


Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment

Nous Research 发布开源编码模型 NousCoder-14B,旨在与 Claude Code 等闭源系统竞争。

Read more →


The creator of Claude Code just revealed his workflow, and developers are losing their minds

Claude Code 的创建者 Boris Cherny 分享了其个人终端工作流,引发开发者社区热议。

Read more →


arXiv CS.LG

GCA-BULF: A Bottom-Up Framework for Short-Term Load Forecasting Using Grouped Critical Appliances

提出一种基于分组关键电器的短期负荷预测自下而上框架。

Read more →


Automated detection of pediatric congenital heart disease from phonocardiograms using deep and handcrafted feature fusion

提出一种结合深度学习与手工特征融合的儿科先天性心脏病自动检测方法。

Read more →


Comparative Study of Bending Analysis using Physics-Informed Neural Networks and Numerical Dynamic Deflection in Perforated nanobeam

对比研究了物理信息神经网络与数值动态挠度在多孔纳米梁弯曲分析中的应用。

Read more →


Liquid Neural Network Models for Natural Gas Spot Price Time-Series Forecasting

提出用于天然气现货价格时间序列预测的液体神经网络模型。

Read more →


Architecture Determines Observability in Transformers

研究发现 Transformer 的架构和训练配方决定了其内部信号的可观测性。

Read more →


Query-Efficient Quantum Approximate Optimization via Graph-Conditioned Trust Regions

提出一种基于图条件信任域的查询高效量子近似优化方法。

Read more →


Intrinsic Mutual Information as a Modulator for Preference Optimization

提出将内在互信息作为偏好优化的调节器。

Read more →


minAction.net: Energy-First Neural Architecture Design — From Biological Principles to Systematic Validation

提出 minAction.net,一种基于生物学原理的能源优先神经网络架构设计方法。

Read more →


arXiv CS.CV

ESICA: A Scalable Framework for Text-Guided 3D Medical Image Segmentation

提出 ESICA,一种用于文本引导的 3D 医学图像分割的可扩展框架。

Read more →


Learning Illumination Control in Diffusion Models

提出一种在扩散模型中学习光照控制的方法。

Read more →


VibeToken: Scaling 1D Image Tokenizers and Autoregressive Models for Dynamic Resolution Generations

提出 VibeToken,一种用于动态分辨率生成的 1D 图像分词器和自回归模型。

Read more →


Interactive Episodic Memory with User Feedback

提出一种结合用户反馈的交互式情景记忆模型。

Read more →


Agentic AI for Remote Sensing: Technical Challenges and Research Directions

探讨遥感领域代理 AI 的技术挑战与研究方向。

Read more →


Subjective Portrait Region Cropping in Landscape Videos with Temporal Annotation Smoothing

提出一种基于时间标注平滑的横屏视频人像区域裁剪方法。

Read more →


Learning from Noisy Preferences: A Semi-Supervised Learning Approach to Direct Preference Optimization

提出一种针对直接偏好优化(DPO)的半监督学习方法,以处理噪声偏好数据。

Read more →


ViPO: Visual Preference Optimization at Scale

提出 ViPO,一种大规模视觉偏好优化方法。

Read more →


Towards Data Science

Let the AI Do the Experimenting

探讨如何利用自动研究优化预算约束下的营销活动。

Read more →


Correlation Doesn’t Mean Causation! But What Does It Mean?

探讨相关性与因果关系的区别及其含义。

Read more →


The Next Frontier of AI in Production Is Chaos Engineering

指出 AI 生产环境的下一个前沿是混沌工程。

Read more →


PyTorch NaNs Are Silent Killers — So I Built a 3ms Hook to Catch Them at the Exact Layer

作者构建了一个轻量级钩子,用于在 PyTorch 训练中精准捕获 NaN 错误。

Read more →


A Career in Data Is Not Always a Straight Line, and That’s Okay

探讨数据科学职业路径的灵活性,以及过度依赖 AI 代理的风险。

Read more →


How Spreadsheets Quietly Cost Supply Chains Millions

分析电子表格在供应链管理中造成的隐性成本。

Read more →


Comparing Explicit Measures to Calculation Groups in Tabular Models

对比表格模型中的显式度量与计算组。

Read more →


Bytes Speak All Languages: Cross-Script Name Retrieval via Contrastive Learning

介绍通过对比学习实现跨脚本名称检索的方法。

Read more →


I Reduced My Pandas Runtime by 95% — Here’s What I Was Doing Wrong

作者分享了优化 Pandas 代码以提升 95% 运行效率的经验。

Read more →


Causal Inference Is Different in Business

探讨商业环境下的因果推断与学术研究的区别。

Read more →


生成二维码中...

请点击右上角 ···

选择 发送给朋友收藏