2026-06-26
今日要点
- AI 代理生态爆发:从企业级编排到个人开发工具,AI 代理(Agent)正成为软件开发的核心,Notion 等公司已开始全面转向以代理为中心的业务模式。
- 硬件成本压力:受内存及存储组件价格上涨影响,苹果、Xbox 等科技巨头纷纷上调产品价格,行业面临严峻的硬件成本挑战。
- 监管与安全博弈:OpenAI 应美国政府要求推迟 GPT-5.6 发布,同时 Anthropic 指控阿里巴巴大规模克隆 Claude 模型,AI 安全与合规成为焦点。
- 欧洲能源危机:极端热浪席卷欧洲,导致电网负荷激增及部分电厂停运,科技行业正寻求通过分布式能源管理等技术缓解压力。
TechCrunch
YouTube Shorts are getting even shorter with an update that lets you double the playback speed
YouTube Shorts 更新:支持 2 倍速播放,视频体验更紧凑
YouTube Shorts 正在进行一系列功能升级,旨在提升用户观看体验。最引人注目的更新是引入了 2 倍速播放功能,允许用户更快地浏览短视频内容。这一举措被视为 YouTube 进一步向 TikTok 风格靠拢的策略,旨在通过更高效的交互方式留住用户。
Patronus AI lands $50M to build ‘digital worlds’ that stress-test AI agents
Patronus AI 获 5000 万美元融资,构建“数字世界”以压力测试 AI 代理
由前 Meta AI 研究人员创立的代理测试初创公司 Patronus AI 近日完成了 5000 万美元融资。该公司致力于构建模拟的“数字世界”,专门用于对 AI 代理进行高强度的压力测试。投资者表示,随着 AI 代理在各行各业的广泛应用,市场对这种能够验证代理可靠性和安全性的工具需求极其旺盛。
Polymarket says hackers stole users’ funds
Polymarket 确认遭遇黑客攻击,用户资金被盗
预测市场巨头 Polymarket 近日发布公告称,由于第三方安全漏洞,部分用户资金遭到黑客窃取。公司目前已承诺将对受影响的用户进行全额赔付,并正在加强安全防御措施以防止此类事件再次发生。
Xbox follows Apple with price increases
Xbox 跟随苹果步伐上调产品价格
继苹果之后,微软也宣布将上调 Xbox 系列游戏主机的价格。公司表示,此次涨价主要受内存和存储组件成本飙升的影响,目前的硬件采购成本已达到以往水平的 2.5 倍以上。这一决定标志着消费电子行业正面临普遍的硬件成本压力。
Notion Mail shuts down amid agent takeover
Notion Mail 宣布关停,全面转向 AI 代理服务
Notion 宣布将正式关停其邮件收件箱服务。公司表示,随着用户越来越倾向于将邮件处理任务交给 AI 代理,Notion 决定将资源集中投入到其核心的 AI 代理产品中,以更好地满足用户对自动化办公的需求。
a16z-backed Base Power is offering cheaper electricity to the power grid that needs it most
a16z 支持的 Base Power 为电网提供更廉价的电力支持
Base Power 正在通过在用户家中部署电池储能系统,绕过传统电网复杂的互联队列,直接为电网提供备份服务。这种分布式能源模式不仅为用户提供了更便宜的电力,也为电网在高峰期提供了关键的调节能力,获得了 a16z 的大力支持。
Anthropic’s Claude is winning over paid consumers, a market owned by ChatGPT
Anthropic 的 Claude 在付费用户市场挑战 ChatGPT 的统治地位
最新数据显示,尽管 ChatGPT 在 AI 市场占据主导地位,但越来越多的付费用户开始转向 Anthropic 的 Claude 模型。Claude 在处理复杂任务和专业工作流方面的表现,使其在高端付费用户群体中赢得了显著的市场份额。
General Intuition’s $2.3B bet that video games can train AI agents for the real world
General Intuition 豪掷 23 亿美元,押注视频游戏训练现实世界 AI 代理
General Intuition 筹集了 3.2 亿美元资金,旨在利用数百万小时的游戏数据来训练 AI 代理。该公司认为,通过游戏中的动作数据,AI 可以培养出更接近人类的直觉,从而更好地适应现实世界的复杂环境。
Databricks’ former AI chief thinks he can cut AI’s power bill by 1,000x
Databricks 前 AI 负责人:有望将 AI 电力成本降低 1000 倍
Databricks 前 AI 负责人推出了一款名为 Un-0 的图像生成系统工具。该工具展示了如何通过技术创新复制传统 AI 系统,并声称能够将 AI 的电力消耗成本降低 1000 倍,为 AI 行业的可持续发展提供了新思路。
Hacked Klue says criminals are deleting stolen customer data, but now other hackers are making threats
Klue 遭黑客攻击:原始黑客正在删除数据,但面临新一轮勒索威胁
市场研究公司 Klue 近日遭遇数据泄露,公司告知客户,原始黑客组织似乎正在删除窃取的数据。然而,Klue 同时警告称,目前出现了第二个黑客组织,正试图利用这些数据进行勒索,公司正在积极应对这一安全危机。
The Verge
Android 17’s new foldable gaming mode could make flippy phones more fun
Android 17 新增折叠屏游戏模式,提升翻盖手机游戏体验
Android 17 即将推出专为折叠屏手机设计的游戏模式。该模式会在屏幕的一半区域显示虚拟游戏手柄,通过系统级模拟物理按键,让用户在折叠屏设备上玩游戏时拥有更舒适的操控体验。
YouTube updates Shorts to make it even more like TikTok
YouTube 更新 Shorts,进一步强化 TikTok 风格
YouTube 正在为 Shorts 增加更多类似 TikTok 的功能,包括移除视频图标和文字的“清屏模式”,将“点赞”按钮替换为“心形”图标,并支持 2 倍速播放。这些调整旨在通过更简洁的界面和更快的节奏吸引年轻用户。
OpenAI will delay GPT-5.6 after Trump administration request
应特朗普政府要求,OpenAI 推迟 GPT-5.6 发布
据报道,由于特朗普政府对潜在安全问题的担忧,OpenAI 已同意推迟其下一代大模型 GPT-5.6 的全面发布。CEO Sam Altman 表示,公司将先以有限预览版的形式向少数企业客户开放,以配合政府的安全审查要求。
Framework has good news and bad news
Framework 带来好消息与坏消息
受组件危机影响,目前购买新电脑面临挑战。但对于预订了 Framework Laptop 13 Pro(被称为“Linux 用户的 MacBook Pro”)的用户,公司宣布已获得更便宜的 PCIe Gen 5 SSD,这意味着部分预订用户的最终购买成本将低于预期。
Score a discounted Xbox console before the prices jump
趁涨价前抢购折扣 Xbox 主机
微软宣布将于 8 月上调所有 Xbox 机型价格。鉴于内存价格持续波动,这已是不到一年内的第二次涨价。目前正值 Prime Day 活动期间,消费者仍有机会在涨价前以折扣价购入主机。
Instagram wants to monopolize your attention
Instagram 试图垄断你的注意力
Instagram 本周为其智能电视应用推出了一系列新功能,旨在将用户从手机屏幕引向家庭电视大屏。除了垂直 Reels,用户现在还可以在电视上观看消失的 Stories 和横屏视频,进一步延长用户在平台上的停留时间。
RAMageddon just got extremely real
“内存末日”已成现实
苹果公司近期上调了 iPad 和 MacBook 的价格,这被视为行业的一个重要信号。作为拥有强大供应链议价能力的巨头,苹果的涨价意味着内存供应危机已经严重影响到了整个消费电子行业,短期内硬件价格难以下调。
The 16 best robot vacuum deals available during Prime Day
Prime Day 期间 16 款最佳扫地机器人折扣推荐
Prime Day 活动进入第三天,亚马逊及沃尔玛等零售商对多款扫地机器人进行了大幅降价。对于一直想购买高性能扫地机器人但受限于价格的用户来说,目前是入手的好时机。
It’s a bad time to want a new computer
现在不是购买新电脑的好时机
受内存供应危机(RAMageddon)影响,本周多款电脑和硬件产品价格上涨。分析认为,由于组件短缺问题短期内难以解决,消费者在近期购买新设备时可能会面临严重的“价格冲击”。
You won’t have long to get these iPad deals before Apple’s price hike
苹果涨价在即,抓紧时间抢购 iPad 折扣机
随着苹果全线调高 iPad 和 MacBook 价格,零售商库存的旧价格产品成为最后的“捡漏”机会。消费者如果近期有购买需求,应尽快行动,因为未来很难再见到目前的优惠价格。
Ars Technica
Microsoft adds another year to Windows 10 extended update program
微软将 Windows 10 扩展更新计划延长一年
由于目前仍有约四分之一的 PC 在运行 Windows 10,微软决定将该系统的扩展更新计划再延长一年,以帮助用户平稳过渡。
FCC may kill $2B program that connects schools and libraries to Internet
FCC 可能取消 20 亿美元的学校与图书馆互联网连接计划
FCC 委员 Carr 以屏幕时间担忧为由,提议取消一项旨在为学校和图书馆提供互联网连接的 20 亿美元资助计划,此举引发了关于政府干预教育的激烈争议。
Notion killing Skiff-influenced email app since most users use AI agents instead
Notion 关停受 Skiff 影响的邮件应用,用户已转向 AI 代理
Notion 决定关停其邮件应用,理由是大多数用户现在更倾向于使用 AI 代理来管理收件箱,而非传统的邮件客户端。
Google finally releases a Finance Android app, promises iOS version later in 2026
Google 终于发布 Finance 安卓应用,承诺年内推出 iOS 版本
在 Google Finance 服务推出 20 年后,Google 终于发布了其安卓版应用,并集成了最新的 AI 功能,iOS 版本预计将于 2026 年晚些时候上线。
Anthropic says Alibaba must be punished for largest Claude cloning attack
Anthropic:阿里巴巴必须因大规模克隆 Claude 模型受到惩罚
Anthropic 指控阿里巴巴利用 25,000 个账户对 Claude 模型进行了超过 2880 万次的挖掘和克隆,要求对其进行严厉惩处。
Planet orbits so close to its star that their magnetic fields connect
行星轨道过于靠近恒星,导致两者磁场连接
天文学家发现一颗行星因轨道极度靠近其恒星,导致两者的磁场发生连接,在特定轨道周期内,恒星色球层会出现显著增亮现象。
Feds deny Polestar authorization to sell cars in US from model year 2027
美国联邦政府拒绝 Polestar 2027 车型在美国销售的授权
与沃尔沃不同,Polestar 未能获得美国联邦政府的销售授权,这意味着其 2027 车型将无法在美国市场销售。
Apple ratchets up prices, blames the cost of memory
苹果上调价格,归咎于内存成本
苹果公司今日上调了多款 Mac 产品的价格,部分机型涨幅达数百美元,公司将此归因于内存组件成本的上涨。
The “sad inevitability” of Europe’s heat wave
欧洲热浪的“悲剧性必然”
欧洲正经历今年夏季的第二次热浪,气温屡创新高,气候专家指出这是全球变暖背景下的一种“悲剧性必然”。
New effort will get genome sequences for entire Endangered Species list
新计划将为所有濒危物种建立基因组序列库
Colossal Biosciences 启动了一项新计划,旨在为濒危物种名单上的所有物种进行基因组测序,并建立生物组织库以保护生物多样性。
Product Hunt
BrowserBash
BrowserBash:将自然语言转化为浏览器测试的 CLI 工具
BrowserBash 是一款命令行工具,允许开发者通过简单的英语指令自动生成和运行浏览器测试,极大简化了前端自动化测试流程。
Tough Tongue AI for Sales
Tough Tongue AI:销售对话实时 AI 助手
Tough Tongue AI 是一款专为销售人员设计的实时 AI 队友,能够在复杂的销售对话中提供即时建议和话术支持。
Blop
Blop:AI 驱动的应用测试与修复工具
Blop 允许用户描述应用功能,AI 会自动进行测试,并在发现问题时自动修复损坏的测试用例。
Sidegent
Sidegent:通过实战构建 AI 代理
Sidegent 提供了一个学习平台,让用户通过亲手构建 AI 代理来掌握相关技术,适合希望深入了解代理开发的人员。
Signspell
Signspell:实时美国手语字母识别工具
Signspell 是一款基于 Python 的实时手语字母识别工具,通过简单的 pip 安装即可使用,为手语交流提供了便捷的数字化方案。
VTT for Mac
VTT for Mac:macOS 本地语音转文字工具
VTT for Mac 是一款专为 macOS 设计的语音转文字应用,支持完全本地化运行,确保用户隐私和数据安全。
Nashra
Nashra:将粉丝转化为客户的工具
Nashra 旨在帮助创作者和企业通过社交媒体粉丝群体进行精准转化,将其转化为付费客户。
Polygraph
Polygraph:支持跨仓库与会话记忆的 AI 代理
Polygraph 允许 AI 代理访问多个代码仓库并维护长期的会话记忆,从而在复杂的开发任务中提供更连贯的协助。
Papermark Agents
Papermark Agents:AI 驱动的交易与融资管理代理
Papermark Agents 能够自动处理融资、数据室管理及交易流程,帮助企业更高效地完成商业任务。
SendTidings
SendTidings:将分析数据转化为精美月度报告
SendTidings 能够自动抓取分析数据,并将其整理成美观的月度邮件报告,方便团队进行业务复盘。
MIT Technology Review
Repositioning retail for the AI era
为 AI 时代重新定位零售业
AI 正在重塑零售业,但重点不在于虚拟试穿等表面功能,而在于后台决策的优化,包括搜索结果排序、供应链库存管理以及代码交付效率的提升。
The Download: Europe’s heat wave hits the grid, and IBM’s chip targets Moore’s Law
今日下载:欧洲热浪冲击电网,IBM 芯片挑战摩尔定律
本期简报重点关注欧洲极端热浪对电网的压力,以及 IBM 推出的新型芯片技术,该技术有望将摩尔定律再延续十年。
What Europe’s heat wave means for the power grid
欧洲热浪对电网意味着什么
欧洲多地气温破纪录,导致学校停课、活动取消,电网负荷达到极限,凸显了气候变化对基础设施的严峻挑战。
IBM has unveiled chip technology that could help extend Moore’s Law another decade
IBM 发布新型芯片技术,有望延续摩尔定律十年
IBM 开发出一种新型原型芯片,在指甲盖大小的面积上集成了约 1000 亿个晶体管,密度是 2021 年技术的两倍,为未来更高效的计算奠定了基础。
Europe’s extreme heat is shutting down power plants
欧洲极端高温导致电厂停运
由于气温过高,欧洲部分电厂无法正常运行,加剧了电网在高温期间的供电压力。
The Download: introducing the Engineering issue
今日下载:工程特刊发布
本期特刊探讨了如何通过人类智慧和工程手段解决复杂挑战,让世界变得更美好。
Stripe, Anthropic, and OpenAI are backing an effort to stop respiratory infections
Stripe、Anthropic 和 OpenAI 支持预防呼吸道感染研究
Stripe 联合创始人 Patrick 和 John Collison 宣布资助一项旨在预防普通感冒等呼吸道感染的新研究。
The emergence of the web data infrastructure layer for AI
AI 网络数据基础设施层的兴起
AI 的发展需要海量数据,但网络原始数据往往是非结构化的,构建专门的数据基础设施层已成为企业利用 AI 的关键。
This flying solar-powered platform could deliver better internet from the air
太阳能飞行平台:从空中提供更好的互联网服务
Sceye 公司研发的 200 英尺长太阳能飞行器即将部署在 18 公里高空,旨在为地面提供更优质的互联网连接。
All challenges big and small
大小挑战并存
作者回顾了 1991 年海湾战争后的经历,探讨了在极端环境下解决问题的经验,并将其与当今的工程挑战联系起来。
GitHub Trending
google-labs-code / design.md
设计系统描述规范,旨在为编码代理提供持久、结构化的视觉身份理解。
calesthio / OpenMontage
全球首个开源代理化视频制作系统,包含 12 个流水线和 500 多种代理技能,可将 AI 助手转化为视频工作室。
xbtlin / ai-berkshire
AI 时代的伯克希尔:基于 Claude Code 的价值投资研究框架,结合巴菲特等大师方法论与多代理并行分析。
mauriceboe / TREK
自托管旅行规划器,支持实时协作、交互式地图、PWA、SSO、预算管理及打包清单等功能。
apple / container
苹果推出的 Swift 编写的工具,用于在 Mac 上利用轻量级虚拟机创建和运行 Linux 容器,针对 Apple Silicon 进行了优化。
JCodesMore / ai-website-cloner-template
利用 AI 编码代理实现一键克隆任何网站的模板。
every-app / open-seo
Semrush 和 Ahrefs 的开源替代方案。
garrytan / gstack
Garry Tan 的 Claude Code 配置方案,包含 23 个工具,涵盖 CEO、设计师、工程经理等多种角色。
aws / agent-toolkit-for-aws
AWS 官方支持的 MCP 服务器、技能和插件,帮助 AI 代理在 AWS 上构建应用。
mukul975 / Anthropic-Cybersecurity-Skills
包含 817 个结构化网络安全技能的 AI 代理工具包,映射至 6 大框架,适用于 Claude Code 等多种平台。
OpenAI Blog
How agents are transforming work
代理如何改变工作方式
OpenAI 的最新研究论文展示了 AI 代理如何通过处理更长、更复杂的任务来提升各行各业的生产力。
OpenAI and Broadcom unveil LLM-optimized inference chip
OpenAI 与博通发布 LLM 优化推理芯片
双方共同推出名为“Jalapeño”的定制 AI 芯片,旨在提升大模型推理的性能、效率和扩展性。
Helping build shared standards for advanced AI
助力构建先进 AI 的共享标准
OpenAI 通过 Appia 基金会支持评估框架、安全实践和全球合作,推动先进 AI 共享标准的建立。
How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery
GPT-5 如何帮助免疫学家解决三年未解之谜
GPT-5 Pro 为 T 细胞行为研究提供了关键洞察,助力癌症和自身免疫性疾病研究取得突破。
How Omio is building the future of conversational travel
Omio 如何构建对话式旅游的未来
Omio 利用 OpenAI 技术打造对话式旅游体验,加速产品开发,转型为 AI 原生公司。
Patch the Planet: a Daybreak initiative to support open source maintainers
Patch the Planet:Daybreak 计划支持开源维护者
OpenAI 推出该计划,利用 AI 和专家评审帮助开源维护者发现并修复漏洞。
Daybreak: Tools for securing every organization in the world
Daybreak:为全球组织提供安全工具
OpenAI 发布 Codex Security 和 GPT-5.5-Cyber 等新工具,帮助组织大规模识别和修复安全漏洞。
Codex-maxxing for long-running work
Codex-maxxing:处理长期运行的任务
介绍 Jason Liu 如何利用 Codex 保持上下文,管理复杂项目,实现跨提示词的持续工作。
Samsung Electronics brings ChatGPT and Codex to employees
三星电子为全球员工部署 ChatGPT 和 Codex
三星电子在全球范围内为员工部署 ChatGPT 企业版和 Codex,成为 OpenAI 最大的企业级应用案例之一。
New usage analytics and updated spend controls for enterprises
企业版新功能:使用分析与支出控制
OpenAI 推出新的支出控制和使用分析功能,帮助企业更有效地管理 AI 成本和规模。
Anthropic Blog
Statement on the US government directive to suspend access to Fable 5 and Mythos 5
关于美国政府暂停 Fable 5 和 Mythos 5 访问指令的声明
Anthropic 确认已收到美国政府的出口管制指令,将暂停对 Fable 5 和 Mythos 5 模型的访问。
Introducing Claude Tag
推出 Claude Tag
Claude Tag 是一种全新的团队协作方式,旨在提升团队使用 Claude 的效率。
Introducing Claude Corps
推出 Claude Corps
Claude Corps 是一个全国性奖学金项目,旨在支持职业生涯早期的年轻人,将 AI 的益处带给美国各地的社区。
Expanding Project Glasswing
扩展 Project Glasswing 项目
Anthropic 将 Project Glasswing 项目扩展至全球 15 个国家的约 150 个新组织。
Introducing Claude Opus 4.8
推出 Claude Opus 4.8
Opus 系列模型升级版,在编码、代理任务和专业工作方面表现更强,并具备处理长期任务的稳定性。
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
Anthropic 在首尔开设办事处,并与韩国 AI 生态系统建立新合作伙伴关系
Anthropic 正式进军韩国市场,旨在通过本地化合作推动 AI 技术在韩国的应用。
Results from the first Anthropic Public Record
首份 Anthropic 公共记录结果
公布了 Anthropic 首份公共记录的评估结果,展示了模型在透明度和安全性方面的进展。
TCS and Anthropic partner to bring Claude to regulated industries
TCS 与 Anthropic 合作,将 Claude 引入受监管行业
双方合作旨在将 Claude 模型集成到银行、航空等受监管行业的关键系统中。
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
DXC 将 Claude 集成到银行、航空等受监管行业的系统中
DXC 科技将 Claude 模型引入其服务的关键行业系统,提升业务自动化水平。
Claude Fable 5 and Claude Mythos 5
Claude Fable 5 与 Claude Mythos 5
Anthropic 发布的新一代模型,具备更强的推理和创作能力。
Google AI Blog
Our latest Google Finance upgrades, including a new app
Google Finance 最新升级,包括全新应用
Google Finance 服务正式走出测试阶段,并发布了全新的安卓应用,提供更强大的金融数据分析功能。
New research shows how AMIE, our medical AI, could help manage health conditions.
新研究显示医疗 AI AMIE 有助于管理健康状况
发表在《Nature》上的研究表明,Google 的对话式 AI 系统 AMIE 在复杂疾病管理方面表现与初级保健医生相当。
We’re strengthening our presence in Alabama through new investments and community support.
通过新投资和社区支持加强在阿拉巴马州的布局
Google 宣布在 2026-2027 年投资 15 亿美元,扩建其位于阿拉巴马州杰克逊县的数据中心园区。
Our new community investments in Virginia support local jobs and expand energy affordability.
在弗吉尼亚州的社区投资支持当地就业并提升能源负担能力
Google 正在通过投资能源项目和劳动力培训,支持弗吉尼亚州的经济发展。
The latest AI news we announced in May 2026
2026 年 5 月 AI 最新动态汇总
回顾 Google 在 5 月份发布的各项 AI 更新和技术进展。
5 ways Google Search can level up your thrift and vintage shopping
Google 搜索助力二手与复古购物的 5 种方式
利用 Google 搜索和购物中的 AI 工具,用户可以更轻松地发现二手好物。
How we used Gemini to build Google I/O 2026
我们如何利用 Gemini 构建 Google I/O 2026
分享 Google 团队如何使用 AI 技术来策划和执行 Google I/O 2026 大会。
Take our I/O 2026 quiz, vibe coded in Google AI Studio.
参与 I/O 2026 测验,体验 Google AI Studio 的“氛围编码”
Google 使用 AI Studio 快速构建了关于 I/O 2026 发布内容的趣味测验。
9 demos of Gemini Omni and Gemini 3.5 in action
Gemini Omni 和 Gemini 3.5 的 9 个演示视频
展示了在 Google I/O 2026 上发布的 Gemini Omni 和 Gemini 3.5 的强大功能。
Check out real-life AI prototypes from the Futures Lab.
查看 Futures Lab 的真实 AI 原型
滑铁卢大学学生开发的 AI 原型(如手语导师)展示了 AI 在教育和工作领域的未来潜力。
Hugging Face Blog
Run a vLLM Server on HF Jobs in One Command
一键在 HF Jobs 上运行 vLLM 服务器
介绍如何通过单条命令在 Hugging Face Jobs 上部署 vLLM 推理服务器。
Which tokens does a hybrid model predict better?
混合模型在哪些 Token 上预测表现更好?
探讨混合模型在不同类型 Token 预测任务中的优势与局限。
Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel
利用 NVIDIA NeMo AutoModel 加速 Transformer 微调
介绍如何使用 NeMo 工具链优化 Transformer 模型的微调效率。
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World
推出 FFASR 排行榜:真实场景下的 ASR 基准测试
旨在评估自动语音识别(ASR)系统在复杂真实环境中的表现。
Build real agentic apps using CUGA: two dozen working examples on a lightweight harness
使用 CUGA 构建真实代理应用:轻量级框架下的 24 个工作示例
介绍 CUGA 框架,提供大量代理应用开发实例。
Shipping huggingface_hub every week with AI, open tools, and a human in the loop
每周发布 huggingface_hub:AI、开源工具与人工参与的结合
分享 Hugging Face 如何利用 AI 和人工协作实现高效的每周版本迭代。
Experimenting with the proposed Cross-Origin Storage API in Transformers.js
在 Transformers.js 中试验跨源存储 API
探讨如何利用新的 API 提升 Web 端 AI 应用的存储能力。
PP-OCRv6 on Hugging Face: 50-Language OCR from 1.5M to 34.5M Parameters
Hugging Face 上的 PP-OCRv6:支持 50 种语言,参数量覆盖 1.5M 至 34.5M
介绍高性能 OCR 模型 PP-OCRv6 的发布及其多语言支持能力。
We got local models to triage the OpenClaw repo for FREE!*
我们利用本地模型免费对 OpenClaw 仓库进行了分类
分享如何使用本地运行的 AI 模型高效处理开源仓库的 Issue 分类。
MosaicLeaks: Can your research agent keep a secret?
MosaicLeaks:你的研究代理能保守秘密吗?
探讨 AI 代理在处理敏感研究数据时的安全性与隐私保护问题。
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
正交性之后:美德伦理代理与 AI 对齐
探讨 AI 对齐的新视角,认为理性行为不应仅基于目标,而应基于实践和美德伦理。
AGI Is Not Multimodal
AGI 不是多模态的
反思当前生成式 AI 的局限,指出语言模型缺乏对现实世界的具身理解。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
形状、对称性与结构:数学在机器学习研究中角色的转变
分析机器学习研究从数学驱动向工程驱动的范式转移。
What’s Missing From LLM Chatbots: A Sense of Purpose
LLM 聊天机器人缺失了什么:目标感
探讨为何基准测试分数提升并未带来用户体验的同比例增长,强调 AI 需要更明确的“目的性”。
We Need Positive Visions for AI Grounded in Wellbeing
我们需要基于福祉的 AI 正向愿景
呼吁 AI 发展应以人类福祉为核心,而非仅仅追求技术指标。
Financial Market Applications of LLMs
LLM 在金融市场的应用
探讨大语言模型在金融序列数据建模和市场分析中的潜力。
A Brief Overview of Gender Bias in AI
AI 中的性别偏见简述
讨论 AI 模型中存在的性别偏见及其对社会的影响。
Mamba Explained
Mamba 模型详解
介绍 Mamba 这一基于状态空间模型(SSM)的新型架构,及其在处理长序列任务上的优势。
Car-GPT: Could LLMs finally make self-driving cars happen?
Car-GPT:LLM 能否最终实现自动驾驶?
探讨大语言模型在自动驾驶决策系统中的应用前景与挑战。
Do text embeddings perfectly encode text?
文本嵌入能完美编码文本吗?
介绍 ‘Vec2text’ 工具,探讨如何将嵌入还原为文本,并强调嵌入数据的安全性。
arXiv CS.AI
The Hitchhiker’s Guide to Agentic AI: From Foundations to Systems
代理 AI 漫游指南:从基础到系统
一本全面的实践参考书,涵盖了构建自主 AI 系统的全栈知识,从第一性原理到生产部署。
Project Auto-World: Towards Automated Benchmarking of Neural Relational Reasoners
Auto-World 项目:迈向神经关系推理机的自动化基准测试
探讨如何评估神经模型在处理复杂关系结构时的泛化能力。
Diagnosing and Mitigating Compounding Failures in Agentic Persuasion via Taxonomic Strategy Retrieval
通过分类策略检索诊断并缓解代理说服中的复合故障
研究 AI 代理在说服任务中出现的错误累积问题,并提出通过策略检索进行缓解。
Do vision-language models search like humans? Reasoning tokens as a reaction-time analog in classic visual-search paradigms
视觉语言模型像人类一样搜索吗?推理 Token 作为经典视觉搜索范式中的反应时间模拟
对比视觉语言模型与人类在视觉搜索任务中的行为特征。
Beyond Shapley: Efficient Computation of Asymmetric Shapley Values
超越 Shapley:非对称 Shapley 值的有效计算
提出一种改进的特征归因方法,将因果知识融入模型解释中。
The Clinician’s Veto: Navigating Trust, Liability, and Uncertainty in Autonomous AI Prescribing
临床医生的否决权:导航自主 AI 开药中的信任、责任与不确定性
探讨 AI 在医疗处方中的角色,以及医生在其中的监管责任。
TRUSTMEM: Learning Trustworthy Memory Consolidation for LLM Agents with Long-Term Memory
TRUSTMEM:为具有长期记忆的 LLM 代理学习可信的记忆巩固
提出一种新的记忆巩固机制,防止 AI 代理在更新长期记忆时出现信息丢失或损坏。
Elo-Disentangled Player-Style Embeddings for Human Chess via Rating-Conditioned Residual Move Model
基于评分条件残差移动模型的国际象棋人类风格嵌入
研究如何从棋手历史对局中学习风格嵌入,并将其与棋力(Elo)解耦。
arXiv CS.CL
Graph-Based Phonetic Error Correction of Noisy ASR
基于图的噪声 ASR 语音错误校正
针对自动语音识别中的语音相似性错误,提出一种基于图的校正方法。
Small edits, large models: How Wikipedia advocacy shapes LLM values
小编辑,大模型:维基百科倡导如何塑造 LLM 价值观
研究发现,维基百科上的小规模志愿者编辑活动能够显著影响大语言模型的价值观输出。
AgentOdyssey: Open-Ended Long-Horizon Text Game Generation for Test-Time Continual Learning Agents
AgentOdyssey:用于测试时持续学习代理的开放式长程文本游戏生成
引入 AgentOdyssey 基准,用于评估 AI 代理在测试阶段的持续学习和长程规划能力。
Error-Aware TF-IDF Retrieval-Augmented Generation for ASR Error Correction
用于 ASR 错误校正的错误感知 TF-IDF 检索增强生成
提出一种结合错误感知检索的 RAG 框架,用于修正 ASR 系统中的罕见实体幻觉。
Perfect Detection, Failed Control: The Geometry of Knowing vs. Steering in Language Models
完美检测,失败控制:语言模型中“知”与“控”的几何学
探讨模型中检测行为的激活方向与控制行为的方向是否一致,揭示了可解释性研究中的挑战。
Dustin: Draft-Augmented Sparse Verification for Efficient Long-Context Generation with Speculative Decoding
Dustin:用于高效长上下文生成的草稿增强稀疏验证与推测解码
提出一种新的推测解码方法,通过稀疏验证缓解 KV 缓存加载瓶颈。
LLM Performance on a Real, Double-Marked GCSE Benchmark
LLM 在真实双重评分 GCSE 基准上的表现
使用 3 万多份真实学生试卷评估 LLM 的评分能力,并与人类考官进行对比。
LLM-Based Scientific Peer Review: Methods, Benchmarks, and Reliability Challenges
基于 LLM 的科学同行评审:方法、基准与可靠性挑战
探讨利用 LLM 辅助科学论文评审的潜力及其面临的可靠性挑战。
WIRED
99 Prime Day Deals That Aren’t For Suckers, Up to 50% Off (2026)
99 个 Prime Day 避坑指南:最高 5 折优惠
精选 Prime Day 期间值得购买的装备,帮助消费者避开虚假折扣。
Venezuela’s Powerful Earthquakes Were a Rare ‘Seismic Doublet’
委内瑞拉强震属于罕见的“地震双重奏”
委内瑞拉近期发生的连续强震是由断层应力转移引起的罕见地震现象。
Forget Peloton. Race to This 25% Off Deal on Hydrow’s Rowing Machine (2026)
别看 Peloton 了,Hydrow 划船机 Prime Day 75 折优惠
推荐一款游戏化健身的划船机,目前正值 Prime Day 折扣期。
We’re Live-Blogging For The Real Heads Still Shopping Amazon Prime Day
Prime Day 第三天直播:为真正的购物达人准备
WIRED 团队持续直播 Prime Day 的最新折扣趋势和购物建议。
A Fatal Tesla Crash in Texas Sets Up a Legal Showdown
德州特斯拉致命车祸引发法律对决
探讨特斯拉“全自动驾驶(监督版)”功能在导致一名女性死亡的事故中是否负有责任。
The Aerogarden I Recommend to Everyone Is Just $83 Right Now, a 63 Percent Discount
强烈推荐的 Aerogarden 现价仅 83 美元,折扣高达 63%
一款广受好评的水培花园设备在 Prime Day 期间迎来史低价。
17 Best Prime Day Fitness Tech Deals (2026) Up to $250 Off
17 款最佳 Prime Day 健身科技折扣,最高立减 250 美元
汇总了智能手表、步行垫等健身科技产品的最佳折扣。
Stop Mowing Your Grass Forever With One of These Highly Rated Robot Mowers On Sale
告别割草:Prime Day 期间高评价扫地割草机折扣
推荐多款正在促销的机器人割草机,让用户彻底解放双手。
Kobo Libra Colour Sale (2026): The E-Reader Deal Worth Jumping on This Prime Day
Kobo Libra Colour 折扣:Prime Day 最值得入手的电子阅读器
推荐一款非亚马逊品牌的彩色电子阅读器,性价比极高。
21 Best Prime Day Beauty Deals of 2026 (We Sifted Through Hundreds to Pick Them)
2026 年 21 款最佳 Prime Day 美妆折扣
从数百个折扣中精选出的美妆产品推荐。
Lobsters
The Exhaustion of Talking to a Tool
与工具对话的疲惫感
探讨在日常工作中过度依赖 AI 聊天机器人带来的心理疲劳。
font-family recommendations
字体系列推荐
社区关于编程和阅读用字体的讨论。
The Xteink X4 E-Ink Reader
Xteink X4 电子墨水阅读器
关于新款电子阅读器的硬件评测与讨论。
New @bitCast Semantics and LLVM Backend Improvements
新的 @bitCast 语义与 LLVM 后端改进
关于 Zig 语言编译器开发的深度技术讨论。
Vibecoding gets Emacs patch rejected
“氛围编码”补丁被 Emacs 拒绝
讨论关于 AI 生成代码在开源项目中的接受度问题。
OS9Map: OpenStreetMap for Mac OS 9
OS9Map:Mac OS 9 上的 OpenStreetMap
复古计算爱好者开发的 OS 9 地图应用。
Are We GlobalShortcuts Yet?
我们实现全局快捷键了吗?
关于跨平台全局快捷键支持的现状讨论。
tropius: detect AI tropes in prose
tropius:检测散文中的 AI 惯用语
一款用于识别文本中 AI 生成痕迹的工具。
Oxide Rack 3D Explorer
Oxide 机架 3D 浏览器
展示 Oxide 计算机硬件设计的 3D 交互工具。
UK Wikipedia Workers seek union recognition
英国维基百科员工寻求工会认可
关于维基百科员工争取工会权益的报道。
DEV Community
I Scanned 1,200 MCP Configs From GitHub. Here’s What I Found.
我扫描了 GitHub 上的 1200 个 MCP 配置,发现了什么?
作者通过扫描发现,大量 AI 代理部署存在严重安全漏洞,包括硬编码密钥等问题。
How I built a YouTube performance classifier that adjusts tomorrow’s video script bias
我如何构建 YouTube 表现分类器并自动调整视频脚本
分享如何通过反馈机制自动优化 AI 生成的视频脚本,提升频道表现。
Notable releases I’m watching: Deno 2.8, Models.dev, DeepSeek V4 Pro permanent pricing
值得关注的发布:Deno 2.8、Models.dev 及 DeepSeek V4 Pro 永久降价
汇总本周 AI 和开发领域的关键更新,特别是 DeepSeek 的价格调整。
Base64 Encoding Explained — JWT Tokens, Data URIs, and Kubernetes Secrets
Base64 编码详解:JWT、Data URI 与 Kubernetes 密钥
深入浅出地解释了 Base64 编码在开发中的应用场景。
Enterprise AI Agent Orchestration: Shared Memory & Local-First…
企业级 AI 代理编排:共享内存与本地优先
探讨企业如何通过共享内存机制实现多个 AI 代理的协同工作。
Three Loops, No Ship
三次迭代,依然无法交付
作者分享了在构建 AI 自动修复流水线时遇到的挫折与经验教训。
I built an AI project manager for dev teams because Jira was too much and Trello was too little — meet Rahnuma.io 🚀
我为开发团队构建了 AI 项目经理 Rahnuma.io
介绍一款旨在平衡 Jira 的复杂性与 Trello 的简洁性的 AI 项目管理工具。
Why I stopped trying to correct my AI model and made incoherence algebraically impossible
为什么我不再纠正 AI 模型,而是从代数上杜绝了不连贯性
分享一种通过代数约束确保 AI 输出连贯性的创新方法。
sick of Boring, Corporate Looking Websites? Try This Fun CSS Framework! 🎨
厌倦了枯燥的企业风网站?试试这个有趣的 CSS 框架!
介绍 Butterfly CSS,一个能让网站呈现手绘风格的趣味框架。
How to Run OpenAI & Claude on the Frontend Without Leaking Your API Keys 🤯
如何在前端运行 OpenAI 和 Claude 而不泄露 API 密钥
介绍 Puter.js 库,实现安全的前端 AI 调用。
Meta Engineering
Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study
AI 原生时代的隐私感知基础设施:资产分类案例研究
探讨 Meta 如何通过精确的数据分类,在 AI 系统中实施有效的隐私控制。
How Meta Engineered Ultra-Narrow Batteries for AI Glasses
Meta 如何为 AI 眼镜设计超窄电池
分享 Meta 在 Ray-Ban Meta 眼镜中实现高能量密度与超窄体积平衡的工程挑战。
Adopting AV1 for Real-Time Communication (RTC) at Scale
在大规模实时通信中采用 AV1 编码
分享 Meta 在 RTC 系统中部署 AV1 编码器的技术挑战与优化经验。
Lights Out, Systems On: Validating Instant Power Loss Readiness
停电系统不停:验证瞬时断电准备能力
介绍 Meta 的“瞬时断电风暴”测试范式,用于提升数据中心在极端断电情况下的可靠性。
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems
SilverTorch:索引即模型——推荐系统的新检索范式
介绍一种统一的检索架构,显著提升了推荐系统的吞吐量和计算效率。
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends:构建可扩展至数十亿用户的社交发现功能
分享 Facebook 如何通过工程手段实现好友 Reels 互动功能的社交发现。
Migrating Data Ingestion Systems at Meta Scale
Meta 大规模数据摄取系统的迁移
分享 Meta 如何在保持可靠性的前提下,完成大规模数据摄取系统的架构升级。
Labyrinth 1.1: Making End-to-End Encrypted Backups Even More Reliable
Labyrinth 1.1:让端到端加密备份更可靠
介绍 Messenger 加密存储系统的升级,提升了备份在设备更换等场景下的恢复能力。
How Meta Is Strengthening End-to-End Encrypted Backups
Meta 如何加强端到端加密备份
详细介绍基于 HSM 的备份密钥库,确保用户备份数据的安全与隐私。
DeepMind Blog
Introducing computer use in Gemini 3.5 Flash
在 Gemini 3.5 Flash 中引入计算机使用能力
Gemini 3.5 Flash 现在具备了直接操作计算机的能力,能够执行更复杂的自动化任务。
Unlocking UK house-building with AI-accelerated planning
利用 AI 加速规划,解锁英国住房建设
Google DeepMind 与英国政府合作,开发 AI 原型以加速住房建设审批流程。
Securing the future of AI agents
保障 AI 代理的未来安全
介绍 AI 控制路线图,结合传统安全防护与实时监控,确保 AI 代理系统的安全性。
DiffusionGemma: 4x faster text generation
DiffusionGemma:文本生成速度提升 4 倍
介绍新型模型架构,显著提升了文本生成效率。
Investing in multi-agent AI safety research
投资多代理 AI 安全研究
Google DeepMind 联合合作伙伴设立 1000 万美元基金,支持多代理系统的安全研究。
Fluid, natural voice translation with Gemini 3.5 Live Translate
Gemini 3.5 Live Translate:流畅自然的语音翻译
为 Google AI Studio 等平台带来近乎实时的自然语音翻译体验。
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
推出 Gemma 4 12B:统一的无编码器多模态模型
发布高性能多模态模型,简化了架构设计。
Powering the future of robotics in Europe
助力欧洲机器人技术的未来
分享 DeepMind 在欧洲机器人研究领域的投入与进展。
Measuring the impact of learning with AI in Sierra Leone and beyond
衡量 AI 学习在塞拉利昂及其他地区的影响
研究显示 Gemini 的引导式学习功能显著提升了学生的参与度和学习效率。
We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks
在亚太地区启动 Google DeepMind 加速器项目,应对环境风险
旨在利用 AI 技术解决亚太地区的环境挑战。
VentureBeat AI
Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.
Google 25 年来首次重新设计搜索框,其意义远超你的想象
Google 在 I/O 大会上宣布彻底改变搜索框范式,标志着从传统搜索向 AI 交互的重大转型。
Railway secures $100 million to challenge AWS with AI-native cloud infrastructure
Railway 获 1 亿美元融资,以 AI 原生云基础设施挑战 AWS
Railway 宣布完成 1 亿美元 B 轮融资,旨在为 AI 应用提供更高效的云基础设施。
Claude Code costs up to $200 a month. Goose does the same thing for free.
Claude Code 每月收费 200 美元,Goose 提供免费替代方案
对比 Anthropic 的 Claude Code 与开源工具 Goose,探讨 AI 编码工具的成本与竞争。
Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews
Listen Labs 获 6900 万美元融资,此前曾通过病毒式广告招聘
分享 Listen Labs 如何通过创意招聘广告吸引人才并成功融资。
Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI
Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域对抗微软与 Google
Salesforce 升级 Slackbot,使其具备搜索企业数据、撰写文档等高级代理能力。
Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required
Anthropic 发布 Cowork:无需编码即可操作文件的 Claude 桌面代理
Cowork 扩展了 Claude Code 的能力,让非技术用户也能通过 AI 代理处理本地文件。
[Read more →](https://venturebeat.com/technology/anthropic-launches-cowork-a-claude-desktop-agent