2026-04-29
今日要点
- OpenAI 与微软合作调整:双方达成修订协议,简化合作关系并增加长期透明度,同时 OpenAI 的 GPT 模型及代理服务正式登陆 AWS。
- AI 行业法律与监管风暴:Elon Musk 与 Sam Altman 关于 OpenAI 未来使命的诉讼案正式开庭;同时,Anthropic 因拒绝将 AI 用于大规模监控而引发关注,Google 随后接手了相关国防合同。
- 开发者工具生态变动:GitHub 宣布 Copilot 代码审查将开始消耗 Actions 时长,引发社区对成本的担忧;Anthropic 推出 Claude Desktop 代理工具 Cowork,旨在降低非技术用户的 AI 使用门槛。
- 全球能源与地缘政治:阿联酋正式宣布退出欧佩克(OPEC),这一历史性决定引发了能源市场的广泛关注。
- AI 代理与自动化趋势:从 Google 的 AI 代理课程到 Meta 的基础设施优化代理,AI 正在从简单的聊天机器人向能够执行复杂任务、优化系统性能的“代理时代”演进。
Hacker News
Ghostty is leaving GitHub
Ghostty 宣布将离开 GitHub。作为 GitHub 的资深用户,开发者 Mitchell Hashimoto 在文中表达了对这一决定的复杂情感,并回顾了自己长达 18 年的 GitHub 使用历程。
Your phone is about to stop being yours
文章警告称,从 2026 年 9 月起,Google 将强制推送更新,封锁所有未在 Google 注册、未签署合同且未提交政府身份证明的 Android 应用开发者所开发的 App。此举被认为将严重削弱 Android 系统的开放性。
Localsend: An open-source cross-platform alternative to AirDrop
LocalSend 是一款免费、开源的跨平台文件传输工具,旨在提供类似 AirDrop 的便捷体验,支持多种操作系统,是目前开源社区中备受推崇的替代方案。
GTFOBins
GTFOBins 是一个精选的 Unix 类可执行文件列表,详细记录了如何利用这些合法工具绕过本地安全限制、提升权限或进行文件传输,是安全研究人员的重要参考资源。
Period tracking app, Flo, found to be selling user data to Meta
经调查发现,经期追踪应用 Flo 存在将用户敏感健康数据出售给 Meta 的行为,引发了关于隐私保护和数据合规性的严重质疑。
To my students
这是一封写给学生的公开信,探讨了教育、技术与未来发展的相关议题,反映了学术界对当前技术变革的思考。
UAE Leaves OPEC
阿联酋正式宣布退出欧佩克(OPEC),结束了其长期的成员国身份,这一举动可能对全球石油市场格局产生深远影响。
VibeVoice: Open-source frontier voice AI
VibeVoice 是一款开源的前沿语音 AI 模型,现已集成至 Hugging Face Transformers 库中。该模型支持长达 60 分钟的音频处理,为开发者提供了高效的语音转文字解决方案。
An Update on GitHub Availability
GitHub 官方针对近期发生的两次服务中断事件发布了说明,向用户致歉,并详细阐述了提升平台可靠性的改进计划。
OpenAI CEO’s Identity Verification Company Announced Fake Bruno Mars Partnership
Sam Altman 旗下的身份验证公司 Tools For Humanity 被曝宣布了一项与 Bruno Mars 的虚假合作伙伴关系,引发了公众对其商业诚信的质疑。
Google and Pentagon reportedly agree on deal for ‘any lawful’ use of AI
据报道,Google 已与五角大楼达成一项关于 AI 使用的机密协议,允许政府在“任何合法”范围内使用其 AI 技术,且 Google 无权否决政府的具体使用方式。
Claude.ai unavailable and elevated errors on the API
Claude.ai 平台近期出现服务不可用及 API 错误率升高的情况,官方已发布公告并正在处理相关故障。
GitHub Copilot code review will start consuming GitHub Actions minutes
GitHub 宣布自 2026 年 6 月 1 日起,Copilot 代码审查功能将开始消耗 GitHub Actions 的额度时长,此举旨在平衡日益增长的推理成本。
Anthropic Joins the Blender Development Fund as Corporate Patron
Anthropic 正式加入 Blender 开发基金,成为企业赞助商,旨在支持 Blender 核心功能的持续开发与维护。
TechCrunch
Amazon is already offering new OpenAI products on AWS
在 OpenAI 与微软结束独家合作协议后,AWS 迅速宣布上线一系列 OpenAI 模型产品,包括全新的代理服务,进一步加剧了云端 AI 市场的竞争。
Amazon launches an AI-powered audio Q&A experience on product pages
亚马逊推出了一项名为“Join the chat”的新功能,允许用户通过语音向 AI 提问,并获得关于产品的实时音频解答,旨在提升购物体验。
Match Group invests $100M in Sniffies, a cruising app for gay men
Match Group 斥资 1 亿美元投资了同性交友应用 Sniffies,试图通过这一举措重新激发移动用户对在线浪漫社交的兴趣。
Google expands Pentagon’s access to its AI after Anthropic’s refusal
在 Anthropic 拒绝将 AI 用于国内大规模监控和自主武器系统后,Google 与美国国防部签署了新的合作合同,扩大了其 AI 在国防领域的应用权限。
Paragon is not collaborating with Italian authorities probing spyware attacks, report says
据报道,以色列间谍软件制造商 Paragon 拒绝配合意大利当局对针对记者和活动人士的黑客攻击调查,尽管此前曾承诺提供协助。
US Supreme Court appears split over controversial use of ‘geofence’ search warrants
美国最高法院正在审理关于“地理围栏”搜查令合法性的案件,法官们对警方通过搜索科技巨头数据库来识别犯罪嫌疑人的做法存在明显分歧。
Australia forces Big Tech firms to pay for news or face a 2.25% tax
澳大利亚政府强制大型科技公司为新闻内容付费,否则将面临 2.25% 的税收。通过与媒体机构达成协议,科技公司可降低税率,此举旨在支持本土新闻业。
Lovable launches its vibe-coding app on iOS and Android
Lovable 推出了其“vibe-coding”应用,支持开发者在移动端随时随地进行 Web 应用和网站的开发与编码。
Founder of Shark Tank-backed startup Scholly sues his acquirer Sallie Mae
Scholly 创始人 Chris Gray 起诉其收购方 Sallie Mae,指控其非法解雇并涉嫌通过子公司违规出售学生数据,Sallie Mae 对此予以否认。
Apple introduces a cheaper option for App Store subscriptions
苹果公司推出了一项新的 App Store 订阅选项,允许开发者通过提供 12 个月的订阅承诺,为用户提供更优惠的月度价格。
The Verge
James Comey indicted over Instagram seashell photo that allegedly threatened Trump
美国司法部再次起诉前 FBI 局长 James Comey,指控其去年在 Instagram 上发布的一张贝壳照片涉嫌威胁唐纳德·特朗普。
Elon Musk tells the jury that all he wants to do is save humanity
在与 OpenAI CEO Sam Altman 的诉讼案中,Elon Musk 在法庭上将自己定位为“拯救人类”的救世主,并回顾了自己的成长背景。
Taylor Swift is stepping up the legal war on AI copycats
泰勒·斯威夫特(Taylor Swift)正加大法律力度,通过申请商标等手段保护自己免受 AI 模仿者的侵害,尽管法律界认为其面临挑战。
Now YouTube TV lets you multiview any channel you want
YouTube TV 宣布推出“完全可定制”的多画面观看功能,用户可以自由组合最多四个直播频道,打造个性化的观看体验。
The FCC is going after the broadcast licenses of Disney-owned ABC stations
美国联邦通信委员会(FCC)要求迪士尼旗下的 ABC 电视台提前申请广播执照续期,此举被视为对迪士尼 DEI(多元、公平与包容)政策调查的一部分。
Live updates from Elon Musk and Sam Altman’s court battle over the future of OpenAI
Elon Musk 与 Sam Altman 关于 OpenAI 未来使命的诉讼案进入庭审阶段,该案可能决定 OpenAI 是否能继续作为营利性企业存在。
Elon Musk takes the stand in high-profile trial against OpenAI
Elon Musk 正式出庭作证,讲述了他与 OpenAI 创始团队在公司结构和使命上的分歧,以及他早期对该公司的投资背景。
You can get dragged into a police investigation by proximity alone — for now
最高法院正在审理 Chatrie v. United States 案,探讨警方使用“地理围栏”搜查令的合法性,该案可能对所有手机用户的隐私权产生深远影响。
Google Home makes it easier to understand why devices aren’t working
Google Home 更新后,当智能设备离线时,应用会提供“即时账户重新关联”提示,帮助用户快速排查并解决设备连接问题。
The Nex Playground gaming console is $60 off this week
Nex Playground 游戏机在亚马逊游戏周促销期间提供 60 美元的折扣,该设备以其适合儿童的动作控制游戏而闻名。
Ars Technica
Flesh-eating bacteria devour man’s arm and leg in just three days
一名男子在短短三天内因食肉菌感染导致肢体严重受损,医生在检查时发现其肢体已出现变色和坏死迹象。
FCC orders review of ABC licenses after Kimmel joke offends Trump and first lady
因吉米·坎摩尔(Jimmy Kimmel)在节目中开玩笑称梅拉尼娅为“准寡妇”,FCC 下令对 ABC 电视台的广播执照进行审查。
Drone pilot makes US rescind no-fly zones around unmarked, moving ICE vehicles
一名无人机飞行员成功挑战了 FAA 在未标记的移动 ICE(移民及海关执法局)车辆周围设立禁飞区的规定,引发了关于民权保护的讨论。
Humanoid robots start sorting luggage in Tokyo airport test amid labor shortage
为应对劳动力短缺,东京羽田机场开始测试使用人形机器人处理旅客行李,未来可能扩展至货物装载和机舱清洁工作。
GitHub will start charging Copilot users based on their actual AI usage
GitHub 宣布将根据 Copilot 用户的实际 AI 使用量进行收费,以应对不断攀升的推理成本。
Electrical current might be the key to a better cup of coffee
俄勒冈大学的科学家利用电池测试工具测量咖啡的风味特征,发现电流可能在提升咖啡品质方面发挥关键作用。
The great American data center divide
农村社区对 AI 基础设施建设表现出强烈的抵触情绪,引发了关于数据中心选址与地方利益冲突的讨论。
A billion miles in less than a decade: GM’s Super Cruise reaches a milestone
通用汽车的 Super Cruise 驾驶辅助系统自 2017 年推出以来,已累计行驶超过 10 亿英里,该系统目前仅适用于地理围栏覆盖的高速公路。
Start with the sensors, then design the rest: How Zoox built its robotaxi
Zoox 分享了其自动驾驶出租车的研发历程,强调了“先设计传感器,再设计车身”的独特双向设计理念。
Neanderthal brains measure up to ours—literally
研究表明,尼安德特人的大脑尺寸与现代人类相当,两者之间的差异很可能仅限于外观层面。
Product Hunt
Kinhub
Kinhub 提供可扩展的教练服务,旨在通过专业指导推动企业的实际业务增长。
Flitch
Flitch 是一款数据分析工具,能够帮助用户将原始数据转化为有价值的业务洞察。
Social Fetch
Social Fetch 允许用户通过 API 从任何社交平台实时获取数据,方便进行数据集成与分析。
Blueprint
Blueprint 是一款 AI 辅助工具,专注于处理复杂的编码任务,支持一次性完成大型开发工作。
Monet
Monet 结合了 Claude Code 和 Codex 技术,支持用户通过 AI 辅助进行视频编辑和图像设计。
SureThing.io
SureThing.io 是一款自主 AI 代理,能够像人类一样清晰地沟通任务结果。
Clera
Clera 是一款 AI 代理工具,旨在通过智能匹配将候选人与最合适的职位进行对接。
Lumen Tool
Lumen Tool 是一款 3D 人像照明模拟器,为摄影师和设计师提供专业的布光参考。
Curflow
Curflow 允许用户通过在 Mac 上绘制手势来触发特定的自动化操作。
Thoth
Thoth 是一款 Mac 端的私有 AI 转录工具,支持本地运行,确保用户数据的隐私安全。
MIT Technology Review
The Download: Musk and Altman’s legal showdown, and AI’s profit problem
本期简报重点关注 Elon Musk 与 Sam Altman 的 OpenAI 诉讼案,以及 AI 行业在实现盈利方面面临的挑战。
Elon Musk and Sam Altman are going to court over OpenAI’s future
Elon Musk 与 Sam Altman 的法律纠纷进入庭审,该案可能对 OpenAI 的 IPO 及未来作为营利性企业的合法性产生重大影响。
The missing step between hype and profit
文章探讨了 AI 行业从技术炒作到实现商业盈利之间缺失的关键环节,分析了当前 AI 落地面临的现实困境。
Rebuilding the data stack for AI
企业在部署 AI 时发现,最大的障碍往往是数据状态。文章讨论了如何重构数据栈以支持 AI 的规模化应用。
The Download: DeepSeek’s latest AI breakthrough, and the race to build world models
本期简报介绍了中国 AI 公司 DeepSeek 发布的新旗舰模型 V4,以及全球范围内构建“世界模型”的竞争态势。
Three reasons why DeepSeek’s new model matters
DeepSeek V4 模型凭借处理超长提示词的能力和开源特性,在 AI 领域引起了广泛关注,文章分析了其技术突破的三个核心原因。
The Download: supercharged scams and studying AI healthcare
本期简报探讨了 AI 驱动的诈骗手段升级,以及医疗领域 AI 应用的有效性评估问题。
Health-care AI is here. We don’t know if it actually helps patients.
尽管 AI 在医疗领域应用广泛,但目前尚缺乏足够的证据证明其确实能改善患者的治疗效果。
The Download: introducing the Nature issue
本期简报介绍了关于“自然”主题的特别报道,探讨了人类活动对自然环境的深远影响。
Will fusion power get cheap? Don’t count on it.
尽管核聚变被视为未来的清洁能源,但研究表明,即使技术成熟,其建设和运营成本也未必会大幅下降。
GitHub Trending
mattpocock / skills
面向真实工程师的技能集合,直接源自作者的 .claude 配置目录。
abhigyanpatwari / GitNexus
GitNexus 是一款零服务器代码智能引擎,可在浏览器中创建交互式知识图谱,并内置 Graph RAG 代理,适合代码探索。
ComposioHQ / awesome-codex-skills
一份精选的 Codex 技能列表,旨在自动化 Codex CLI 和 API 的工作流。
davila7 / claude-code-templates
用于配置和监控 Claude Code 的 CLI 工具。
HunxByts / GhostTrack
一款用于追踪位置或手机号码的实用工具。
fspecii / ace-step-ui
开源的 Suno 替代方案,为 ACE-Step 1.5 AI 音乐生成提供专业 UI,支持本地免费使用。
public-apis / public-apis
一个收集免费 API 的集体列表,方便开发者查找各类数据接口。
CJackHwang / ds2api
Deepseek to API 中间件,支持多账号轮询、Docker 部署,兼容 Google、Claude 和 OpenAI API 格式。
Alishahryar1 / free-claude-code
允许用户在终端、VSCode 扩展或 Discord 中免费使用 Claude Code 的工具。
OpenAI Blog
OpenAI models, Codex, and Managed Agents come to AWS
OpenAI 的 GPT 模型、Codex 和托管代理服务现已登陆 AWS,助力企业在 AWS 环境中构建安全的 AI 应用。
OpenAI available at FedRAMP Moderate
OpenAI 的 ChatGPT 企业版和 API 已获得 FedRAMP Moderate 授权,为美国联邦机构提供安全的 AI 采用方案。
The next phase of the Microsoft OpenAI partnership
OpenAI 与微软宣布修订合作协议,旨在简化合作关系,增加长期透明度,并支持 AI 创新的持续规模化。
An open-source spec for orchestration: Symphony
OpenAI 推出开源编排规范 Symphony,旨在将问题追踪系统转化为全天候的代理系统,提升工程效率。
Choco automates food distribution with AI agents
Choco 利用 OpenAI API 实现了食品分销的自动化,显著提升了生产力并解锁了业务增长。
Our principles
Sam Altman 分享了指导 OpenAI 工作的五项核心原则,旨在确保 AGI 的发展造福全人类。
GPT-5.5 System Card
GPT-5.5 模型的系统卡片,详细记录了模型的技术规格与安全评估。
Introducing GPT-5.5
OpenAI 推出 GPT-5.5 模型,这是目前最智能的模型,在编码、研究和数据分析等复杂任务中表现更出色。
Top 10 uses for Codex at work
探索 Codex 在工作中的 10 个实用场景,帮助用户自动化任务并提升工作效率。
What is Codex?
介绍 Codex 如何通过自动化任务、连接工具并生成文档和仪表盘,帮助用户超越简单的聊天交互。
Anthropic Blog
Introducing Claude Opus 4.7
Anthropic 发布 Claude Opus 4.7 模型,在编码、代理任务、视觉理解及多步推理方面表现更强,工作一致性更高。
Introducing Claude Design by Anthropic Labs
Anthropic Labs 推出 Claude Design,允许用户与 Claude 协作创建设计、原型、幻灯片等视觉内容。
Claude is a space to think
Anthropic 承诺 Claude 将保持无广告状态,认为广告激励与 AI 助手的核心价值相悖,旨在维护用户信任。
Claude for Creative Work
介绍 Claude 在创意工作中的应用,展示其如何辅助用户进行创作。
Anthropic names Theo Hourmouzis General Manager of Australia & New Zealand and officially opens Sydney office
Anthropic 任命 Theo Hourmouzis 为澳大利亚及新西兰总经理,并正式在悉尼开设办公室。
An update on our election safeguards
Anthropic 发布关于选举安全保障措施的最新更新,旨在防范 AI 在选举期间的潜在滥用。
Anthropic and NEC collaborate to build Japan’s largest AI engineering workforce
Anthropic 与 NEC 达成合作,旨在共同培养日本规模最大的 AI 工程人才队伍。
Anthropic and Amazon expand collaboration for up to 5 gigawatts of new compute
Anthropic 与亚马逊扩大合作,计划增加高达 5 吉瓦的计算资源,以支持 AI 模型的训练与推理。
Anthropic’s Long-Term Benefit Trust appoints Vas Narasimhan to Board of Directors
Anthropic 的长期利益信托任命 Vas Narasimhan 为董事会成员。
Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute
Anthropic 扩大与 Google 和 Broadcom 的合作,共同开发下一代计算基础设施,以满足大规模 AI 计算需求。
Google AI Blog
Celebrating 20 years of Google Translate: Fun facts, tips and new features to try
Google 庆祝翻译服务上线 20 周年,分享了从 2006 年 AI 实验到支持近 250 种语言的历程与趣事。
Join the new AI Agents Vibe Coding Course from Google and Kaggle
Google 与 Kaggle 联合推出 5 天 AI 代理密集课程,现已开放注册。
8 Gemini tips for organizing your space (and life)
分享 8 个使用 Gemini 整理家庭和数字空间的技巧,包括清洁计划和收件箱清理。
Here’s how our TPUs power increasingly demanding AI workloads.
通过新视频展示 Google 的 TPU 如何为日益复杂的 AI 工作负载提供算力支持。
Elevating Austria: Google invests in its first data center in the Alps.
Google 宣布在奥地利 Kronstorf 建设其首个阿尔卑斯山数据中心,预计将创造 100 个直接就业岗位。
We’re launching two specialized TPUs for the agentic era.
Google 推出两款专为“代理时代”设计的第八代 TPU 芯片,旨在推动 AI 技术的进一步发展。
3 new ways Ads Advisor is making Google Ads safer and faster
Ads Advisor 引入三项代理安全与政策功能,旨在保护并简化 Google Ads 账户的管理。
7 ways to travel smarter this summer, with help from Google
分享 7 个利用 Google AI 工具规划夏季旅行、寻找优惠并探索目的地的技巧。
A new way to explore the web with AI Mode in Chrome
Chrome 浏览器推出 AI 模式升级,彻底改变了用户与网页的交互方式。
New ways to create personalized images in the Gemini app
Gemini 应用推出新功能,利用个人上下文和 Google 相册创建反映用户独特生活的个性化图像。
Hugging Face Blog
Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents
NVIDIA 发布 Nemotron 3 Nano Omni 模型,具备长上下文多模态智能,适用于文档、音频和视频代理任务。
How to build scalable web apps with OpenAI’s Privacy Filter
介绍如何利用 OpenAI 的隐私过滤器构建可扩展的 Web 应用。
DeepSeek-V4: a million-token context that agents can actually use
DeepSeek-V4 模型支持百万级 Token 上下文,为 AI 代理提供了更强大的处理能力。
How to Use Transformers.js in a Chrome Extension
介绍如何在 Chrome 扩展程序中使用 Transformers.js。
QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard
推出 QIMMA 阿拉伯语大模型排行榜,专注于评估模型的质量。
AI and the Future of Cybersecurity: Why Openness Matters
探讨 AI 与网络安全的未来,强调开源在提升安全性方面的重要性。
Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents
介绍 Ecom-RLVE,一种用于电子商务对话代理的自适应可验证环境。
The PR you would have opened yourself
介绍如何将 Transformers 模型转换为 MLX 格式。
Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers
介绍如何使用 Sentence Transformers 训练和微调多模态嵌入与重排序模型。
Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents
深入分析 VAKRA 基准测试,探讨 AI 代理的推理能力、工具使用及失败模式。
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
文章探讨了基于美德伦理学的 AI 对齐方法,认为理性 AI 不应仅以“目标”为导向,而应与人类实践对齐。
AGI Is Not Multimodal
文章反驳了 AGI 必然是多模态的观点,强调了人类智能中隐含的具身理解的重要性。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
探讨了机器学习研究中数学角色的转变,分析了工程驱动的规模化方法与数学驱动的架构设计之间的平衡。
What’s Missing From LLM Chatbots: A Sense of Purpose
文章指出当前 LLM 聊天机器人虽然基准测试成绩优异,但缺乏明确的“目的感”,影响了用户体验。
We Need Positive Visions for AI Grounded in Wellbeing
呼吁建立以人类福祉为基础的 AI 积极愿景,探讨 AI 对社会的深远影响。
Financial Market Applications of LLMs
探讨了 LLM 在金融市场中的应用潜力,分析了其在处理序列数据方面的优势。
A Brief Overview of Gender Bias in AI
简要概述了 AI 系统中存在的性别偏见问题及其影响。
Mamba Explained
详细解释了 Mamba 模型,作为一种基于状态空间模型(SSM)的替代方案,它解决了 Transformer 在处理长序列时的效率问题。
Car-GPT: Could LLMs finally make self-driving cars happen?
探讨了 LLM 在自动驾驶领域的应用潜力,分析了其在提升驾驶安全性方面的挑战。
Do text embeddings perfectly encode text?
文章介绍了 ‘Vec2text’ 技术,能够将嵌入向量还原为文本,强调了嵌入数据安全协议的重要性。
arXiv CS.AI
An Intelligent Fault Diagnosis Method for General Aviation Aircraft Based on Multi-Fidelity Digital Twin and FMEA Knowledge Enhancement
提出了一种基于多保真数字孪生和 FMEA 知识增强的通用航空飞机智能故障诊断框架。
PExA: Parallel Exploration Agent for Complex Text-to-SQL
提出 PExA 代理,通过并行探索优化复杂 Text-to-SQL 任务的性能与延迟平衡。
The Power of Power Law: Asymmetry Enables Compositional Reasoning
研究发现自然语言数据的幂律分布有助于模型学习长尾技能,支持组合推理。
On the Existence of an Inverse Solution for Preference-Based Reductions in Argumentation
探讨了偏好论证框架(PAF)中偏好驱动的论证还原及其逆解的存在性。
Towards Causally Interpretable Wi-Fi CSI-Based Human Activity Recognition with Discrete Latent Compression and LTL Rule Extraction
提出一种基于 Wi-Fi CSI 的因果可解释人类活动识别方法,结合离散潜在压缩与 LTL 规则提取。
FormalScience: Scalable Human-in-the-Loop Autoformalisation of Science with Agentic Code Generation in Lean
提出 FormalScience 框架,利用代理代码生成技术实现科学推理的自动形式化。
A Systematic Approach for Large Language Models Debugging
提出一种系统化的 LLM 调试方法,旨在解决模型不透明和概率性带来的调试难题。
A Decoupled Human-in-the-Loop System for Controlled Autonomy in Agentic Workflows
提出一种解耦的人机协作系统,旨在增强代理工作流中的受控自主性与安全性。
arXiv CS.CL
The Randomness Floor: Measuring Intrinsic Non-Randomness in Language Model Token Distributions
引入“熵偏差”(ED)指标,系统测量了多种语言模型的内在非随机性。
TexOCR: Advancing Document OCR Models for Compilable Page-to-LaTeX Reconstruction
提出 TexOCR 模型,旨在将科学 PDF 页面重构为可编译的 LaTeX 代码。
AutoPyVerifier: Learning Compact Executable Verifiers for Large Language Model Outputs
提出 AutoPyVerifier,学习紧凑的可执行验证器以控制 LLM 输出。
Self Knowledge Re-expression: A Fully Local Method for Adapting LLMs to Tasks Using Intrinsic Knowledge
提出一种完全本地化的方法,通过知识重表达使 LLM 适应特定任务。
Uncertainty Quantification for LLM Function-Calling
研究 LLM 函数调用中的不确定性量化,以提高工具使用的安全性。
Chinese-SkillSpan: A Span-Level Dataset for ESCO-Aligned Competency Extraction from Chinese Job Ads
发布 Chinese-SkillSpan 数据集,用于从中文招聘广告中提取技能实体。
Evaluating Temporal Consistency in Multi-Turn Language Models
研究多轮对话模型中的时间一致性,确保模型能正确更新隐含的时间假设。
DeepImagine: Learning Biomedical Reasoning via Successive Counterfactual Imagining
提出 DeepImagine 方法,通过连续的反事实想象学习生物医学推理。
WIRED
Elon Musk Testifies That He Started OpenAI to Prevent a ‘Terminator Outcome’
Elon Musk 在法庭上作证称,他创立 OpenAI 的初衷是为了防止“终结者式”的 AI 灾难。
Sniffies’ Users Worry About a ‘Straightification’ of the Gay Hookup App
Match Group 对 Sniffies 的投资引发了用户对该应用“异性恋化”的担忧。
‘It’s Undignified’: Hundreds of Workers Training Meta’s AI Could Be Laid Off
Meta 在爱尔兰的 AI 训练承包商面临裁员风险,超过 700 名员工可能失去工作。
The UK’s Answer to Darpa Wants to Rewire the Human Brain
英国 ARIA 机构拥有 10 亿美元预算,旨在通过神经技术解决癫痫和阿尔茨海默病等难题。
Why Sharing a Screenshot Can Get You Jailed in the UAE
文章探讨了阿联酋严苛的在线内容法律,分享截图可能导致严重的法律后果。
UAE to Exit OPEC After Nearly 60 Years
阿联酋将于 5 月 1 日正式退出欧佩克,结束近 60 年的成员国身份。
Amazon’s Kindle Colorsoft Gets a Dark Mode (2026)
亚马逊的彩色电子阅读器 Kindle Colorsoft 终于迎来了深色模式。
A DOGE Affiliate Is Now in Charge of the US Government’s ID Platform
Greg Hogan 被任命负责 Login.gov,该平台正计划整合驾照和护照信息,引发了关于“国家 ID”的讨论。
Colorado’s Anti-Repair Bill Is Dead
科罗拉多州的反维修法案最终未能通过,维修权倡导者暂时取得胜利。
Get Ready for More Brain-Scanning Consumer Gadgets
Neurable 等公司正在授权其脑机接口技术,预计未来将有大量脑部扫描消费电子产品上市。
Lobsters
jjj
关于 jjj 的讨论。
Carrot disclosure: Forgejo
关于 Forgejo 项目的 Carrot 披露信息。
GitHub Actions is the weakest link
文章指出 GitHub Actions 在安全链条中可能存在的薄弱环节。
Who Owns the Code Claude Wrote?
探讨 AI(Claude)生成的代码的版权归属问题。
Using a 1978 terminal in 2026 (DEC VT-100)
分享在 2026 年使用 1978 年产 DEC VT-100 终端的体验。
Illegal vs Unwanted States
探讨软件开发中“非法状态”与“不想要的状态”之间的区别。
Bypassing DPI with eBPF, no VPN or proxy needed
介绍如何利用 eBPF 技术绕过深度包检测(DPI),无需 VPN 或代理。
FOSDEM 2026 - All FOSDEM 2026 videos are online
FOSDEM 2026 的所有会议视频现已上线。
DEV Community
Flutter GoRouter Advanced — Nested Navigation, Auth Guards, and Deep Links
介绍 Flutter GoRouter 的高级用法,包括嵌套导航、权限守卫和深度链接。
The Small Documentation Mistakes That Turn Good Products Into Frustrating Ones
探讨文档中的小错误如何影响产品体验,并提供改进建议。
Supabase Stripe — Implement Subscription Billing with Edge Functions
介绍如何使用 Supabase Edge Functions 实现 Stripe 订阅计费系统。
Indie Dev Incorporation — When Should You Form a Company?
探讨独立开发者何时应该注册公司,分析了税务成本与收益。
Dart 3 New Features — Sealed Classes, Pattern Matching, and Records
介绍 Dart 3 的三大核心新特性:密封类、模式匹配和记录。
Your AI Agent Can Be Socially Engineered. Here Are 3 Attacks That Prove It.
揭示 AI 代理可能遭受的三种社会工程学攻击方式。
Not Your grandma’s Code
介绍如何利用 jQuery 快速实现现代网页设计,强调开发者应成为全能型人才。
🗓️ Monthly Dev Report: April 2026
分享 2026 年 4 月的开发旅程、成就及下个月的目标。
Flutter Supabase Storage — Complete File Upload Guide
Flutter 与 Supabase Storage 的完整文件上传指南。
A 150-Line whentime tokyo london ny CLI in Rust — and Why You Need IANA tzdata, Not ‘UTC + N’
介绍如何用 Rust 编写一个 150 行的 CLI 工具来处理时区转换,并强调使用 IANA tzdata 的重要性。
Meta Engineering
Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge
Meta 升级了 Facebook 群组搜索功能,采用混合检索架构,提升了社区内容的发现与验证效率。
Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale
介绍 Meta 的容量效率计划,利用 AI 代理平台自动化修复基础设施性能问题。
Post-Quantum Cryptography Migration at Meta: Framework, Lessons, and Takeaways
分享 Meta 在后量子密码学(PQC)迁移方面的经验,提出 PQC 迁移等级框架。
Escaping the Fork: How Meta Modernized WebRTC Across 50+ Use Cases
介绍 Meta 如何通过双重构建系统解决 WebRTC 内部版本分叉问题,实现与上游社区的同步。
Trust But Canary: Configuration Safety at Scale
探讨 Meta 如何通过金丝雀发布和渐进式部署确保大规模配置更新的安全性。
How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines
介绍 Meta 如何利用 AI 代理映射大规模数据流水线中的“部落知识”,提升代码编辑效率。
KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure
介绍 Ranking Engineer Agent 如何自主设计和分析排名模型实验,优化 AI 基础设施。
Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads
介绍 Meta 自适应排名模型,通过 LLM 规模的复杂性提升广告推荐系统的性能。
AI for American-Produced Cement and Concrete
Meta 发布新的 AI 模型,旨在帮助建筑行业设计更可持续的混凝土混合物。
DeepMind Blog
Announcing our partnership with the Republic of Korea
Google DeepMind 与韩国达成合作,旨在利用前沿 AI 模型加速科学突破。
Decoupled DiLoCo: A new frontier for resilient, distributed AI training
介绍 Decoupled DiLoCo,一种用于弹性分布式 AI 训练的新方法。
Partnering with industry leaders to accelerate AI transformation
DeepMind 与全球咨询公司合作,将前沿 AI 技术带给全球组织。
Gemini 3.1 Flash TTS: the next generation of expressive AI speech
发布 Gemini 3.1 Flash TTS,引入音频标签,实现对 AI 语音表达的精确控制。
Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning
发布 Gemini Robotics-ER 1.6,增强了机器人的空间推理和多视角理解能力。
Gemma 4: Byte for byte, the most capable open models
发布 Gemma 4,这是目前最智能的开源模型,专为高级推理和代理工作流设计。
Gemini 3.1 Flash Live: Making audio AI more natural and reliable
发布 Gemini 3.1 Flash Live,提升了语音交互的流畅度、自然度和精确度。
Protecting people from harmful manipulation
DeepMind 研究 AI 在金融和健康领域的有害操纵风险,并制定了新的安全措施。
Lyria 3 Pro: Create longer tracks in more
发布 Lyria 3 Pro,支持创建更长、结构更清晰的音乐轨道。
Measuring progress toward AGI: A cognitive framework
引入衡量 AGI 进展的认知框架,并启动 Kaggle 黑客马拉松以构建相关评估指标。
Microsoft AI Blog
A conversation with Kevin Scott: What’s next in AI
与 Kevin Scott 对话,探讨 AI 的未来发展方向。
From Hot Wheels to handling content: How brands are using Microsoft AI to be more productive and imaginative
介绍品牌如何利用 Microsoft AI 提升生产力和创造力。
Microsoft open sources its ‘farm of the future’ toolkit
微软开源其“未来农场”工具包。
How data and AI will transform contact centres for financial services
探讨数据与 AI 如何变革金融服务行业的联络中心。
AI-equipped drones study dolphins on the edge of extinction
利用 AI 无人机研究濒临灭绝的海豚。
Online math tutoring service uses AI to help boost students’ skills and confidence
在线数学辅导服务利用 AI 提升学生的技能与自信心。
AI-Mimi is building inclusive TV experiences for Deaf and Hard of Hearing user in Japan
AI-Mimi 为日本听障用户构建包容性的电视体验。
Microsoft’s framework for building AI systems responsibly
介绍微软负责任地构建 AI 系统的框架。
Singapore develops Asia’s first AI-based mobile app for shark and ray fin identification to combat illegal wildlife trade
新加坡开发亚洲首个 AI 移动应用,用于识别鲨鱼和鳐鱼鳍,打击非法野生动物贸易。
The opportunity at home – can AI drive innovation in personal assistant devices and sign language?
探讨 AI 如何推动个人助理设备和手语领域的创新。
VentureBeat AI
Railway secures $100 million to challenge AWS with AI-native cloud infrastructure
Railway 融资 1 亿美元,旨在通过 AI 原生云基础设施挑战 AWS。
Claude Code costs up to $200 a month. Goose does the same thing for free.
对比 Claude Code 的高昂费用,Goose 提供了免费的替代方案,引发开发者关注。
Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews
Listen Labs 通过病毒式广告牌招聘活动融资 6900 万美元,用于扩展 AI 客户访谈业务。
Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI
Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域与微软和 Google 展开竞争。
Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required
Anthropic 推出 Cowork,一款无需编码即可在本地文件上工作的 Claude Desktop 代理。
Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment
Nous Research 发布 NousCoder-14B 开源编码模型,性能媲美大型专有系统。
The creator of Claude Code just revealed his workflow, and developers are losing their minds
Claude Code 的创建者分享了其个人工作流,引发了开发者的热烈讨论。
arXiv CS.LG
The Spectral Lifecycle of Transformer Training: Transient Compression Waves, Persistent Spectral Gradients, and the Q/K—V Asymmetry
系统研究了