2026-07-05
今日要点
- AI 代理生态爆发:Anthropic 推出 Cowork 扩展 Claude Desktop 能力,而开源界则通过 Goose 等工具挑战昂贵的闭源 AI 编码代理。
- 行业监管与合规:阿里巴巴因安全考量禁用 Claude Code;Midjourney 试图通过法律手段迫使好莱坞工作室披露 AI 使用细节。
- 基础设施与硬件创新:OpenAI 与 Broadcom 合作推出 Jalapeño 推理芯片;NASA 启动紧急任务以拯救面临坠毁风险的 Swift 天文台。
- AI 治理与伦理:美国政府删除能源保护网页引发争议;AI 幻觉与“群体思维”问题成为技术讨论焦点,企业正寻求更具确定性的 AI 系统架构。
TechCrunch
New Google commercial imagines a Declaration of Independence written with help from AI
谷歌新广告:如果《独立宣言》由 AI 辅助撰写会怎样?
在《独立宣言》签署 250 周年之际,谷歌发布了一则创意广告,探讨了一个有趣的假设:如果当年的开国元勋们拥有 Google Workspace 等现代 AI 工具,历史进程会发生怎样的改变?该广告旨在展示 AI 在协作与创作中的潜力。
Midjourney wants Hollywood studios to reveal the details of their AI usage
Midjourney 要求好莱坞工作室披露其 AI 使用细节
在与三家好莱坞工作室的持续法律纠纷中,Midjourney 采取了反制措施,试图通过法律手段强制要求这些工作室披露其内部使用 AI 的具体方式。此举被视为 AI 公司在版权与技术应用争议中,试图通过透明度要求来平衡双方地位。
Alibaba reportedly bans employees from using Claude Code
据报道,阿里巴巴禁止员工使用 Claude Code
出于安全与合规考量,阿里巴巴已将 Anthropic 的 Claude Code 归类为高风险软件,并禁止员工在工作中使用。这一决定反映了大型企业在引入外部 AI 编码工具时,对数据泄露和代码安全性的高度警惕。
What is Mistral AI? Everything to know about the OpenAI competitor
什么是 Mistral AI?关于这家 OpenAI 竞争对手你需要知道的一切
Mistral AI 自 2023 年成立以来,凭借其开源 AI 模型策略迅速崛起,并获得了大量融资。该公司的核心愿景是“将前沿 AI 技术交到每个人手中”,在当前由闭源模型主导的市场中,Mistral 正在成为一股不可忽视的开源力量。
The only AI glossary you’ll need this year
今年你唯一需要的 AI 术语表
随着 AI 技术的爆炸式增长,大量新词汇和行业俚语涌现。本文整理了一份详尽的 AI 术语表,涵盖了当前技术领域最重要、最常被提及的词汇和短语,旨在帮助读者快速理解复杂的 AI 生态。
The browser wars aren’t about search anymore — here are the best alternatives to Chrome and Safari
浏览器大战不再仅仅关于搜索——这里有 Chrome 和 Safari 的最佳替代品
现代浏览器竞争的焦点已从单纯的搜索转向了用户体验、隐私保护和 AI 集成。本文盘点了几款旨在挑战 Chrome 和 Safari 市场地位的顶级替代浏览器,分析了它们在功能和性能上的独特优势。
The Dune keypad device can be your meeting controller and more
Dune 键盘设备:你的会议控制器及更多功能
Dune 是一款拥有三个按键的创新外设,其核心亮点在于能够根据用户当前使用的应用程序自动切换功能。例如,在视频会议软件中,它可以自动映射为静音、开关摄像头和窗口置顶等快捷操作,极大提升了办公效率。
Chevy built an all-American EV truck — why is nobody buying it?
雪佛兰打造了一款纯正美式电动皮卡——为什么没人买?
雪佛兰 Silverado EV 被认为是电动皮卡领域的“优秀初稿”,但在市场表现上却不尽如人意。本文分析了该车型在设计、续航及市场定位上的优缺点,探讨了为何这款产品未能成功打动消费者。
Politician who investigated spyware abuses had his phone hacked with Pegasus spyware
曾调查间谍软件滥用的政客手机被 Pegasus 软件入侵
一名欧洲政客在担任欧盟间谍软件调查委员会成员期间,其手机遭到了 Pegasus 间谍软件的入侵。据悉,该软件由 NSO Group 的政府客户使用,这一事件再次引发了关于政府监控工具滥用及隐私保护的激烈讨论。
Last chance to apply — Startup Battlefield Australia applications close July 6
最后申请机会——Startup Battlefield Australia 申请将于 7 月 6 日截止
针对澳大利亚初创企业的 Startup Battlefield 申请通道即将关闭。对于希望获得展示机会和潜在投资的创业者来说,这是最后的机会,错过截止日期后将无法再参与本届活动。
The Verge
NASA launched an emergency mission to stop the Swift Observatory from crashing to Earth
NASA 发起紧急任务,阻止 Swift 天文台坠毁地球
Swift 天文台自 2004 年发射以来一直运行良好,但近期强烈的太阳风暴导致其轨道下降,面临坠入大气层烧毁的风险。NASA 已委托 Katalyst Space Technologies 发射 Link 航天器,试图在 Swift 失去动力的情况下对其进行拦截和轨道修正。
White House deletes thousands of web pages about energy conservation as heatwave slams US
美国遭遇热浪袭击,白宫删除了数千个关于节能的网页
在美国多地遭受历史性热浪袭击之际,美国能源部被曝删除了约 6000 个关于节能的网页。此举引发了广泛质疑,被认为与共和党人对节能倡议(如建议调高空调温度以减轻电网压力)的强烈反对有关。
Matic’s robot vacuum is getting a $250 price hike in September
Matic 扫地机器人将于 9 月涨价 250 美元
Matic 扫地机器人因其出色的性能备受好评,但公司宣布将于 9 月 9 日起将价格从 1245 美元上调至 1495 美元。官方表示,涨价主要源于内存及其他核心组件成本的激增。
Flatbush Zombies’ Erick the Architect misses his BlackBerry keyboard
Flatbush Zombies 的 Erick the Architect 怀念他的黑莓键盘
作为知名嘻哈组合 Flatbush Zombies 的核心成员,Erick the Architect 在访谈中表达了对黑莓手机物理键盘的怀念。这种对旧时代硬件交互的眷恋,反映了在触屏时代下,部分用户对实体按键反馈的独特需求。
Hey number pad lovers, this is a keyboard we can finally agree on
嘿,数字小键盘爱好者们,这是一款我们终于能达成共识的键盘
Epomaker RT98 是一款兼具复古美学与现代功能的机械键盘。它最吸引人的地方在于其模块化设计,用户可以将数字小键盘放置在左侧或右侧,满足了不同习惯用户的需求,同时还配备了有趣的 CRT 风格屏幕。
The square-ish phone that I wanted to love
我想爱却爱不起来的方形手机
Ikko MindOne Pro 是一款设计独特的小型手机,拥有方形屏幕和可翻转摄像头。尽管其概念新颖且支持多种配件,但在实际使用体验中,该产品未能达到预期,被评价为“概念虽好,落地平庸”。
The fanfiction community is at war with AI — and itself
同人小说社区正与 AI 开战——同时也陷入了内斗
同人小说界近期掀起了一场抵制 AI 生成内容的运动,试图清理那些非人工创作的作品。然而,由于缺乏有效的检测手段,这场运动导致了社区内部的混乱,许多无辜的作者也受到了波及。
Qi fan fan
Qi 充电风扇
Kuxiu D5 是一款集成了主动散热风扇的 Qi2.2 无线充电底座。作者在经过一周的测试后表示,该设备不仅能有效防止手机在充电时过热,且噪音控制出色,彻底改变了他对无线充电器加装风扇的偏见。
Amazon updated 2023’s Fire HD 10 tablet with 4GB of RAM
亚马逊升级 2023 款 Fire HD 10 平板电脑,内存提升至 4GB
亚马逊悄然更新了 2023 款 Fire HD 10 平板电脑。其中 32GB 版本将内存从 3GB 提升至 4GB,价格也随之小幅上涨至 154.99 美元。不过,64GB 版本仍维持 3GB 内存配置。
While you’re watching the World Cup, the feds may be watching you
当你在观看世界杯时,联邦政府可能正在监视你
随着美国共同举办世界杯,各主办城市正在大幅提升监控能力。从堪萨斯城到纽约,大规模的监控部署引发了公众对隐私权的担忧,人们在享受体育盛事的同时,可能正处于联邦政府的严密注视之下。
Ars Technica
Review: Supergirl is not the disaster its low box office suggests
影评:女超人并非票房惨淡所暗示的那样是一场灾难
尽管《女超人》在票房上表现不佳,但影评认为这并非电影质量的问题,而是因为当前超级英雄电影市场过于饱和。该片本身是一部相当不错的作品,但在竞争激烈的市场中,它需要达到“伟大”的程度才能脱颖而出。
When the ability to smell goes away
当嗅觉消失时
嗅觉的丧失往往不仅仅是感官问题,它通常与大脑健康状况密切相关。本文探讨了嗅觉障碍背后的科学机制,以及它作为神经系统疾病早期预警信号的重要性。
A martian rock has lots of carbon on it, and it’s not clear why
一块火星岩石上含有大量碳,原因尚不明确
科学家在火星岩石样本中发现了异常高含量的碳。虽然生物活动是可能的解释之一,但目前尚无定论,研究人员正在探索其他非生物性的地质化学解释。
Rocket Report: Indian startup nears first launch; SpaceX’s millenary milestone
火箭报告:印度初创公司接近首次发射;SpaceX 达成千次里程碑
本期火箭报告涵盖了印度航天初创公司的最新进展,以及 SpaceX 达成的千次发射里程碑。此外,NASA 还与 Rocket Lab 签署了三项专用发射协议,进一步推动了商业航天的发展。
Inside the Luddite festival harnessing Gen Z’s rage against Big Tech
走进利用 Z 世代对科技巨头愤怒的卢德主义节
纽约市举办的“卢德主义之夏”活动旨在教导人们如何脱离数字生活。该活动吸引了大量对大型科技公司感到不满的 Z 世代年轻人,探讨了在高度数字化的社会中寻找离线生活方式的可能性。
Despite the darkness, I still see signs of hope in America
尽管身处黑暗,我依然在美国看到了希望的迹象
本文作者回顾了美国社会近年来的动荡与迷茫,试图在当前的社会困境中寻找积极的信号。尽管面临诸多挑战,作者依然对美国的未来保持谨慎的乐观。
Visiting the stars (and planets, and telescopes) in VR
在 VR 中造访恒星(以及行星和望远镜)
通过 VR 技术,用户现在可以身临其境地探索遥远的恒星、系外行星以及著名的天文观测台。这种沉浸式体验为天文科普教育提供了全新的视角。
Wing Commander IV and the FMV future that never quite was
《银河飞将 4》与那段未竟的 FMV 未来
本文回顾了《银河飞将 4》这款经典游戏,探讨了当时 FMV(全动态视频)技术在游戏开发中的应用,以及为何这种曾被寄予厚望的叙事方式最终未能成为主流。
Newly discovered PamStealer isn’t your typical macOS malware
新发现的 PamStealer:并非典型的 macOS 恶意软件
安全研究人员发现了一种名为 PamStealer 的新型 macOS 恶意软件。与以往的威胁不同,它展示了更复杂的攻击手段,凸显了针对 Mac 平台的信息窃取攻击正在日益增加。
FAA proposal: Supersonic airliners can fly over US cities if they’re quiet
FAA 提案:超音速客机若足够安静,可在美国城市上空飞行
美国联邦航空管理局(FAA)提出新规,如果超音速客机能够消除音爆,将允许其在美国城市上空飞行。这一提案为超音速商业航空的复兴扫清了关键的监管障碍。
Product Hunt
CentryAI
CentryAI
一款订阅追踪工具,由一位曾因忘记取消 11 个订阅而深受其害的开发者打造,旨在帮助用户管理和优化日常开支。
PhoneDeck
PhoneDeck
一款可以将 iPhone 转化为 Mac 免费控制器的应用,提升了跨设备协作的便捷性。
ChecklistFox
ChecklistFox
一款 AI 驱动的清单制作工具,能够快速生成美观的 PDF 文档,完全免费且即时可用。
Vida
Vida
一款 AI 工具,允许用户“克隆”自己,让 AI 在你提问之前就完成相关工作,旨在提升个人生产力。
Termi Protocol
Termi Protocol
一款可以在 3D 环境中实时观察 AI 编码代理构建过程的工具,为开发者提供了全新的调试与监控视角。
Goals from Loops
Goals from Loops
一款用于衡量营销活动是否达成预期目标的分析工具,由 Garry Tan 推荐。
nxt
nxt
一款语音交互的待办事项应用,用户只需通过对话即可获取下一步任务,简化了任务管理流程。
Archify
Archify
一款旨在帮助用户深入理解软件架构和代码逻辑的工具。
Vox
Vox
一款支持 GitHub Copilot 的语音交互工具,实现了“语音输入、语音输出”的编程辅助体验。
Glaze by Raycast
Glaze by Raycast
一款允许用户通过与 AI 对话来创建 Mac 应用的工具,极大地降低了软件开发的门槛。
MIT Technology Review
A device that revives eyeballs from dead donors could make eye transplants possible
一种能复活捐赠者眼球的设备,或使眼球移植成为可能
眼球移植手术一直面临巨大挑战,因为眼球离开人体后会迅速退化。研究人员开发出一种能够维持眼球活性的设备,有望解决这一难题,为视力恢复带来新的希望。
The Download: a smoking “endgame” and a new Elizabeth Bear story
每日下载:烟草“终局”与 Elizabeth Bear 的新故事
本期简报探讨了英国的代际禁烟政策,并分享了 Elizabeth Bear 的最新文学作品,同时回顾了科技界的每日要闻。
The UK’s generational tobacco ban might not work. I’m supporting it anyway.
英国的代际禁烟政策可能无效,但我依然支持它
作者从家长的角度出发,探讨了英国禁烟政策的社会意义。尽管该政策在执行层面可能面临挑战,但其对下一代健康观念的塑造作用依然值得肯定。
Achieving operational excellence with AI
利用 AI 实现卓越运营
Lean Six Sigma 和 BPM 等框架曾是企业运营管理的基石。如今,AI 正在成为新的核心运营层,通过统计严谨性和流程映射,为复杂的工业系统带来更高的效率与安全性。
Teaching AI to run with the turbines
教 AI 运行涡轮机
AI 的应用已从消费级聊天机器人转向工业基础设施。在需要高度安全性和连续性的行业中,AI 正在成为管理大型工业系统、优化能源效率的关键技术。
The Download: a startup has a solution for AI’s groupthink problem
每日下载:一家初创公司找到了解决 AI “群体思维”问题的方案
本期简报重点介绍了 AI 模型中存在的“群体思维”现象,并探讨了一家初创公司如何通过技术手段打破 LLM 的思维定势。
Why California’s carbon manure math doesn’t add up
为什么加州的碳粪便数学算不通?
加州政府通过补贴鼓励奶农将牛粪产生的甲烷转化为天然气,但这一政策在环保层面引发了争议。批评者认为,这种做法实际上是在鼓励生产化石燃料,而非真正减少碳排放。
LLMs are stuck in a groupthink groove. This startup is trying to get them out.
LLM 陷入了群体思维的怪圈,这家初创公司正试图打破它
研究发现,主流大语言模型在回答随机问题时往往表现出高度的一致性,即“群体思维”。本文探讨了这种现象的原因,以及如何通过技术手段提升 AI 输出的多样性。
The Download: Anthropic launches Claude Science, and California’s carbon manure math
每日下载:Anthropic 发布 Claude Science,以及加州的碳粪便数学
本期简报涵盖了 Anthropic 针对科研领域推出的 Claude Science,以及对加州碳排放政策的深度分析。
Claude Science is Anthropic’s newest flagship product
Claude Science 是 Anthropic 的最新旗舰产品
Anthropic 推出了 Claude Science,这是一款专为科研人员设计的 AI 工作台。它能够集成研究中常用的工具和包,支持自主执行复杂任务,并提供可审计的科研成果,旨在加速科学发现的进程。
GitHub Trending
openai / codex-plugin-cc
使用 Claude Code 中的 Codex 插件来审查代码或委派任务。
JuliusBrussee / caveman
🪨 为什么用那么多 token?Claude Code 的一项技能,通过像穴居人一样说话来减少 65% 的 token 消耗。
alibaba / page-agent
JavaScript 页面内 GUI 代理,通过自然语言控制网页界面。
usestrix / strix
开源 AI 渗透测试工具,用于发现并修复应用程序中的漏洞。
ChromeDevTools / chrome-devtools-mcp
用于编码代理的 Chrome 开发者工具。
Zackriya-Solutions / meetily
隐私优先的 AI 会议助手,基于 Rust 构建,支持本地处理,无需云端,提供快速转录、说话人识别和总结功能。
asgeirtj / system_prompts_leaks
定期更新的系统提示词泄露集合,涵盖 Anthropic、OpenAI、Google、xAI 等主流模型。
harvard-edge / cs249r_book
机器学习系统相关书籍资源。
rommapp / romm
一个美观、强大且可自托管的 ROM 管理器和播放器。
ogulcancelik / herdr
一个运行在终端中的代理多路复用器。
OpenAI Blog
How ChatGPT adoption has expanded
ChatGPT 的采用率是如何扩展的
OpenAI Signals 数据显示,ChatGPT 的全球采用率正在持续增长。用户不仅增加了使用频率,还在探索更多高级功能,推动了其在不同地区和语言环境下的广泛应用。
Inside Genebench-Pro
深入了解 Genebench-Pro
(内容为空,主要介绍 Genebench-Pro 的案例研究)
Introducing GeneBench-Pro
推出 GeneBench-Pro
OpenAI 推出了 GeneBench-Pro,这是一个全新的基准测试工具,旨在利用复杂的真实世界数据集,评估 AI 在基因组学、生物学和科学研究领域的性能。
Core dump epidemiology: fixing an 18-year-old bug
核心转储流行病学:修复一个 18 年前的 Bug
OpenAI 工程师利用大规模核心转储分析技术,成功定位并修复了一个罕见的系统崩溃问题,最终发现该问题源于硬件故障与一个长期存在的软件 Bug 的共同作用。
Mapping Europe’s AI Workforce Opportunity
绘制欧洲 AI 就业机会图谱
OpenAI 发布了一份新报告,分析了 AI 如何重塑欧盟的就业市场,重点指出了哪些职业可能面临自动化、增长或工作流程的改变。
HP Inc. launches Frontier strategic partnership with OpenAI
惠普与 OpenAI 建立 Frontier 战略合作伙伴关系
惠普公司扩大了与 OpenAI 的 Frontier 战略合作,旨在将 AI 技术部署到客户体验、软件开发和企业运营的各个环节。
Previewing GPT-5.6 Sol: a next-generation model
预览下一代模型 GPT-5.6 Sol
OpenAI 预览了 GPT-5.6 Sol 模型,该模型在编码、科学研究和网络安全方面具备更强的能力,并配备了 OpenAI 目前最先进的安全架构。
How agents are transforming work
AI 代理如何改变工作方式
OpenAI 的一项最新研究表明,AI 代理正在通过处理更长、更复杂的任务来显著提升各行各业的生产力,改变了传统的工作模式。
OpenAI and Broadcom unveil LLM-optimized inference chip
OpenAI 与博通联合发布 LLM 优化推理芯片
OpenAI 与博通合作推出了名为“Jalapeño”的定制 AI 芯片。该芯片专为大语言模型推理而设计,旨在提升 AI 系统的性能、效率和扩展能力。
Helping build shared standards for advanced AI
助力构建先进 AI 的共享标准
OpenAI 正在通过 Appia 基金会支持评估框架、安全实践和全球合作,致力于为先进 AI 技术构建共享的行业标准。
Anthropic Blog
Redeploying Fable 5
重新部署 Fable 5
Fable 5 已于 7 月 1 日全球重新上线。Anthropic 同时联合亚马逊、微软、谷歌等合作伙伴,提出了一套行业通用的越狱严重程度评分框架。
Introducing Claude Sonnet 5
推出 Claude Sonnet 5
Sonnet 5 正式发布,在编码、代理任务和专业工作场景中展现了前沿的性能表现,能够支持大规模的业务需求。
Claude Science, an AI workbench for scientists, is now available
面向科学家的 AI 工作台 Claude Science 现已可用
Claude Science 是一款可定制的 AI 应用,集成了科研人员常用的工具和包,能够生成可审计的科研成果,并提供灵活的计算资源访问权限。
Introducing Claude Tag
推出 Claude Tag
Claude Tag 是一种全新的团队协作方式,旨在提升团队使用 Claude 的效率。
More details on Fable 5’s cyber safeguards and our jailbreak framework
关于 Fable 5 网络安全防护及越狱框架的更多细节
本文详细介绍了 Fable 5 的安全机制,以及 Anthropic 在应对 AI 越狱风险方面所制定的行业框架。
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
Anthropic 在首尔开设办事处,并宣布与韩国 AI 生态系统建立新合作伙伴关系
Anthropic 进一步拓展全球版图,在首尔设立办事处,并与韩国多家机构达成合作,共同推动当地 AI 生态的发展。
Statement on the US government directive to suspend access to Fable 5 and Mythos 5
关于美国政府暂停 Fable 5 和 Mythos 5 访问权限指令的声明
Anthropic 对美国政府暂停其部分模型访问权限的指令发表了官方声明,表示将配合相关审查工作。
Results from the first Anthropic Public Record
首份 Anthropic 公共记录结果
Anthropic 发布了首份公共记录报告,展示了公司在透明度与 AI 安全方面的进展。
TCS and Anthropic partner to bring Claude to regulated industries
TCS 与 Anthropic 合作,将 Claude 引入受监管行业
TCS 与 Anthropic 达成合作,旨在将 Claude 模型集成到银行、航空等受监管行业的关键系统中。
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
DXC 将把 Claude 集成到银行、航空公司及其他受监管行业依赖的系统中
DXC 宣布将 Claude 模型引入其核心业务系统,为受监管行业的客户提供更智能的 AI 解决方案。
Google AI Blog
The latest AI news we announced in June 2026
谷歌 2026 年 6 月发布的最新 AI 新闻
汇总了谷歌在 6 月份发布的所有 AI 相关更新与进展。
New York City educators and industry leaders gathered at Google’s offices to shape the future of AI in classrooms.
纽约教育界与行业领袖齐聚谷歌办公室,共商 AI 在课堂中的未来
谷歌联合纽约就业 CEO 理事会和 Urban Assembly 举办了 AI 峰会,邀请 150 名教育和行业领袖共同探讨 AI 技术在教育领域的应用前景。
Unlocking Britain’s next era of productivity: Building a nation of AI trailblazers
开启英国生产力新时代:打造 AI 先锋国家
谷歌英国发布了最新的经济影响报告,探讨了如何通过 AI 技术赋能更多人,从而提升国家整体生产力。
Ask an AI expert: What exactly is the full stack?
询问 AI 专家:到底什么是全栈?
谷歌专家详细解释了 AI 领域的“全栈”概念,并阐述了为什么全栈方法一直是谷歌 AI 工作的基石。
Our latest Google Finance upgrades, including a new app
Google Finance 最新升级,包括一款新应用
Google Finance 结束测试阶段,并正式推出了一款全新的 Android 应用,提供更强大的金融数据分析功能。
New research shows how AMIE, our medical AI, could help manage health conditions.
新研究显示谷歌医疗 AI 系统 AMIE 如何帮助管理健康状况
发表在《Nature》上的研究表明,谷歌的对话式 AI 系统 AMIE 在复杂疾病管理方面表现出色,能够达到与初级保健医生相当的水平。
We’re strengthening our presence in Alabama through new investments and community support.
我们通过新的投资和社区支持加强在阿拉巴马州的布局
谷歌宣布投资 15 亿美元,用于扩建其位于阿拉巴马州杰克逊县的数据中心园区,进一步加强当地的数字基础设施建设。
Our new community investments in Virginia support local jobs and expand energy affordability.
我们在弗吉尼亚州的新社区投资支持了当地就业并扩大了能源可负担性
谷歌在弗吉尼亚州开展了新的社区投资项目,旨在培养下一代劳动力并支持当地的能源 affordability 计划。
The latest AI news we announced in May 2026
谷歌 2026 年 5 月发布的最新 AI 新闻
汇总了谷歌在 5 月份发布的所有 AI 相关更新。
5 ways Google Search can level up your thrift and vintage shopping
谷歌搜索提升二手和复古购物体验的 5 种方式
谷歌利用 AI 工具优化了搜索和购物体验,帮助用户更轻松地发现二手和复古商品。
Hugging Face Blog
Hugging Face and Cerebras bring Gemma 4 to real-time voice AI
Hugging Face 与 Cerebras 将 Gemma 4 引入实时语音 AI
ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration
ScarfBench:企业级 Java 框架迁移的 AI 代理基准测试
Why Specialization Is Inevitable
为什么专业化是不可避免的
Featuring Every Eval Ever Results on Hugging Face Model Pages
在 Hugging Face 模型页面展示所有评估结果
DiScoFormer: One transformer for density and score, across distributions
DiScoFormer:跨分布的密度与分数统一 Transformer 模型
Run a vLLM Server on HF Jobs in One Command
一键在 HF Jobs 上运行 vLLM 服务器
Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel
使用 NVIDIA NeMo AutoModel 加速 Transformer 微调
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World
推出 FFASR 排行榜:真实世界中的 ASR 基准测试
Shipping huggingface_hub every week with AI, open tools, and a human in the loop
每周通过 AI、开源工具和人工参与发布 huggingface_hub
Experimenting with the proposed Cross-Origin Storage API in Transformers.js
在 Transformers.js 中试验跨源存储 API
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
正交性之后:美德伦理代理与 AI 对齐
本文探讨了理性与目标之间的关系,认为人类行为并非由单一目标驱动,而是由实践网络构成。文章提出,AI 对齐不应仅关注目标设定,而应借鉴美德伦理学,构建更具适应性的 AI 代理。
AGI Is Not Multimodal
AGI 不是多模态的
文章挑战了当前 AI 发展的主流观点,认为仅仅通过多模态数据训练无法实现真正的 AGI。作者强调,人类智能植根于具身理解,而单纯的语言模型无法捕捉这种深层的认知本质。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
形状、对称性与结构:数学在机器学习研究中角色的转变
过去十年,机器学习研究从追求数学严谨性转向了工程驱动的规模化扩展。本文分析了这一转变,探讨了在计算资源日益丰富的背景下,数学原理在构建高效架构中的新角色。
What’s Missing From LLM Chatbots: A Sense of Purpose
LLM 聊天机器人缺失的东西:目标感
尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升。文章指出,当前 AI 缺乏明确的“目标感”,这限制了其在复杂任务中的实际应用价值。
We Need Positive Visions for AI Grounded in Wellbeing
我们需要基于福祉的 AI 正向愿景
AI 技术正在深刻改变社会,但我们缺乏一个以人类福祉为核心的愿景。本文呼吁开发者和政策制定者共同构建一个更具人文关怀的 AI 未来。
Financial Market Applications of LLMs
LLM 在金融市场的应用
大语言模型在处理序列数据方面展现了巨大潜力,本文探讨了 LLM 在金融预测、风险管理及自动化交易中的具体应用场景与挑战。
A Brief Overview of Gender Bias in AI
AI 性别偏见简述
本文简要概述了 AI 系统中存在的性别偏见问题,并讨论了其产生的原因及潜在的社会影响。
Mamba Explained
Mamba 原理解析
Mamba 作为一种基于状态空间模型(SSM)的新型 AI 模型,被视为 Transformer 的强力竞争者。本文详细解释了 Mamba 如何解决长序列处理效率低下的问题。
Car-GPT: Could LLMs finally make self-driving cars happen?
Car-GPT:LLM 能否最终实现自动驾驶?
探讨了将大语言模型应用于自动驾驶的可行性,分析了其在决策制定中的潜力以及面临的关键技术挑战。
Do text embeddings perfectly encode text?
文本嵌入能完美编码文本吗?
通过“Vec2text”技术,研究人员展示了如何将嵌入向量还原为文本,这揭示了嵌入数据在安全协议方面存在的潜在风险。
WIRED
Submit Your Questions: Inside The World of Online Romance Scams
提交你的问题:深入了解在线浪漫诈骗的世界
WIRED 邀请作者 Carlos Barragán 与 Kate Knibbs 进行对话,解答关于尼日利亚浪漫诈骗团伙的运作机制及防范建议。
15 Best MagSafe Wireless Chargers (2026): Power Banks, Stands, Pads, and Travel Chargers
2026 年 15 款最佳 MagSafe 无线充电器:充电宝、支架、底座及旅行充电器
盘点了 2026 年市面上最值得购买的磁吸无线充电设备,涵盖了多种使用场景。
Where NASA Posts Its Best Space Photos, and How to Find Them
NASA 在哪里发布其最佳太空照片,以及如何找到它们
介绍了 NASA 发布太空影像的官方渠道,并说明了这些珍贵素材的免费使用与分享规则。
This Buried Apple Feature Turns an iPhone Into the Perfect Kids’ Dumb Phone
这个隐藏的苹果功能将 iPhone 变成了完美的儿童“傻瓜手机”
作者发现了一个原本为认知障碍人士设计的苹果功能,意外地将其转化为一种极佳的儿童手机管理方案,限制了复杂功能,使其更适合儿童使用。
Security Roundup: Apple’s Hide My Email Service Fails to Hide Your Email
安全综述:苹果的“隐藏邮件”服务未能隐藏你的邮件
本期安全综述涵盖了苹果“隐藏邮件”服务的漏洞、Scattered Spider 黑客成员被引渡的消息,以及 WhatsApp 用户名功能引发的隐私担忧。
Food Preservatives May Increase the Risk of High Blood Pressure and Cardiovascular Disease
食品防腐剂可能增加高血压和心血管疾病的风险
一项大规模研究表明,日常加工食品中广泛使用的防腐剂可能加剧常见健康风险,提醒消费者关注饮食成分。
The Best Fourth of July Mattress Sales on Beds We Actually Sleep On (2026)
2026 年独立日最佳床垫促销:我们亲测推荐的床垫
盘点了今年独立日期间值得入手的床垫产品,所有推荐均基于 WIRED 评测团队的实际睡眠体验。
Scientists Have Identified a New Fossil Species of Axolotl in Mexico
科学家在墨西哥发现了一种新的美西螈化石物种
Ambystoma quetzalcoatli 是墨西哥首个被正式确认的蝾螈化石,揭示了美西螈在墨西哥生存了数百万年的历史。
3 Nuclear Startups Hit a Big Milestone. Why It Matters—and Why It Doesn’t
3 家核能初创公司达成重要里程碑:为什么这很重要,又为什么不重要
尽管三家核能初创公司在反应堆设计上取得了进展,但要实现大规模商业化供电,依然面临漫长的道路。
Google DeepMind Unionization Talks Are Off to a Rocky Start
Google DeepMind 的工会谈判开局不利
在周三的谈判中,员工对管理层在工会化问题上缺乏实质性参与表示不满,谈判进展陷入僵局。
Lobsters
Fourteener Lobsters
十四峰龙虾(Lobsters 社区 14 周年)
Lobsters 社区成立 14 周年纪念。自 2012 年以来,社区活跃度持续上升,目前拥有超过 2 万名用户,提交了大量高质量故事与评论。
Do Wavy Walls Really Use Fewer Bricks? I Tested It in Blender
波浪墙真的更省砖吗?我在 Blender 中进行了测试
What should a personal website be?
个人网站应该是什么样的?
Reducing Assumptions, Exploding Your Code
减少假设,引爆你的代码
EndBASIC 0.14: Are we multimedia yet?
EndBASIC 0.14:我们实现多媒体了吗?
Who’s Hiring? - Support Edition - Q3 2026
谁在招聘?支持岗位版 - 2026 年第三季度
Magit 4.6 released
Magit 4.6 发布
Why don’t people use git properly?
为什么人们不好好使用 Git?
FreeBSD ate my ram
FreeBSD 吃掉了我的内存
I Don’t Maintain My Homelab
我不维护我的家庭实验室
DEV Community
LLM APIs as Infrastructure: Building Deterministic Systems Around Probabilistic AI
LLM API 作为基础设施:围绕概率 AI 构建确定性系统
文章探讨了如何将概率性的 AI 模型转化为确定性的生产系统。作者指出,开发者应将 LLM API 视为基础设施,通过合理的架构设计来管理模型的局限性与成本。
Why evidence matters more than model memory in AI pentesting
为什么在 AI 渗透测试中,证据比模型记忆更重要
AI 安全工具若无法提供可复现的证据,则毫无价值。Darkmoon 等工具通过记录原始命令和输出,为安全审计提供了可靠的证据链。
What Solana’s Transfer Fee Extension Taught Me About Trustless Payments
Solana 的转账费用扩展教会我关于无信任支付的知识
作者分享了在 Solana 上构建支付流程的经验,探讨了如何通过代码逻辑而非中心化服务器来强制执行费用,从而实现真正的无信任支付。
JavaScript Object Methods
JavaScript 对象方法
介绍了 JavaScript 中对象方法的定义、语法及使用示例,帮助初学者理解“this”关键字在对象方法中的作用。
A write is not just a write
写入不仅仅是写入
在构建 AI 代理与 GitHub 的集成时,作者发现“写入”操作在复杂系统中具有多重含义,不仅是技术上的数据变更,还涉及业务逻辑的深层影响。
AI Governance — EU AI Act Compliance, Risk Assessment, and Audit Logging
AI 治理——欧盟 AI 法案合规、风险评估与审计日志
探讨了在构建多代理 AI 系统时,如何通过治理框架、风险管理和审计日志来确保 AI 的合规性与安全性。
🚀 Introducing Career Agents: An Open-Source Collection of AI-Powered Career Assistants
🚀 推出 Career Agents:AI 驱动的职业助手开源集合
Career Agents 是一个开源项目,旨在通过 AI 辅助简历撰写、面试准备和职业规划,帮助学生和专业人士更好地导航职业生涯。
I Thought I Understood Containers. Then I Tried Building One.
我以为我懂容器,直到我尝试自己构建一个
作者分享了从理论到实践的转变,通过尝试构建容器,深刻理解了命名空间、cgroups 等底层技术概念。
JS1024 2026 is open: build a demo in 1024 bytes
JS1024 2026 开启:在 1024 字节内构建一个演示
JS1024 挑战赛回归,主题为“DREAMING”。参赛者需在 1024 字节内利用 JS、HTML 或 GLSL 构建令人印象深刻的演示作品。
Quieting PHP 8.2+ deprecated noise from older WP-CLI — three layers to keep JSON parse clean
消除旧版 WP-CLI 在 PHP 8.2+ 中的弃用警告——保持 JSON 解析清洁的三层方案
针对旧版 WP-CLI 在新版 PHP 环境中产生的弃用警告,作者提供了一套三层解决方案,确保 JSON 解析过程不受干扰。
Meta Engineering
Meta’s AI Storage Blueprint at Scale
Meta 大规模 AI 存储蓝图
随着模型规模和数据集的指数级增长,存储系统的性能直接影响 AI 创新的速度与成本。Meta 分享了其在大规模 AI 存储架构方面的设计蓝图。
10 Years of Meta’s Commitment to Python
Meta 对 Python 的 10 年承诺
今年是 Meta 连续第 10 年赞助 Python 软件基金会(PSF)。Python 已成为 Meta 工程栈的核心,Meta 将继续支持这一开源语言的发展。
Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study
AI 原生时代的隐私感知基础设施:资产分类案例研究
隐私控制系统需要对数据有深刻的理解才能有效运行。本文通过资产分类案例,探讨了 Meta 如何在 AI 原生时代构建隐私感知的基础设施。
How Meta Engineered Ultra-Narrow Batteries for AI Glasses
Meta 如何为 AI 眼镜设计超窄电池
智能眼镜需要在极小的空间内集成摄像头、处理器和显示器。Meta 分享了其如何设计超窄电池,以满足智能眼镜的能源需求。
Adopting AV1 for Real-Time Communication (RTC) at Scale
在大规模实时通信中采用 AV1
Meta 分享了其在实时通信系统中部署 AV1 编码器的技术挑战与解决方案,包括码率控制和错误恢复机制。
Lights Out, Systems On: Validating Instant Power Loss Readiness
停电,系统运行:验证瞬时断电准备情况
Meta 引入了“瞬时断电风暴”测试范式,旨在验证数据中心在零预警断电情况下的容错能力与恢复策略。
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems
SilverTorch:索引即模型——推荐系统的新检索范式
Meta 介绍了 SilverTorch,这是一种统一的推荐系统检索架构,在吞吐量和计算效率上均大幅超越了现有方案。
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends:构建可扩展至数十亿用户的社交发现功能
探讨了 Facebook 如何通过工程手段实现“Reel Friends”功能,展示了看似简单的社交功能背后复杂的工程挑战。
Migrating Data Ingestion Systems at Meta Scale
Meta 大规模数据摄取系统的迁移
Meta 分享了其数据摄取系统从旧架构迁移到新架构的策略,旨在提升系统在大规模社交图谱数据处理中的可靠性。
DeepMind Blog
Google DeepMind and A24 announce first-of-its-kind research partnership
Google DeepMind 与 A24 宣布达成首个同类研究合作伙伴关系
Start building with Nano Banana 2 Lite and Gemini Omni Flash
开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行构建
Introducing computer use in Gemini 3.5 Flash
在 Gemini 3.5 Flash 中引入计算机使用能力
Unlocking UK house-building with AI-accelerated planning
利用 AI 加速规划,解锁英国住房建设
英国政府与 Google DeepMind 合作,开发 AI 原型系统,旨在加快住房建设审批流程。
Securing the future of AI agents
保障 AI 代理的未来
通过 AI 控制路线图,结合传统安全防护与实时监控,确保内部 AI 系统的安全性。
DiffusionGemma: 4x faster text generation
DiffusionGemma:文本生成速度提升 4 倍
Investing in multi-agent AI safety research
投资多代理 AI 安全研究
Google DeepMind 与合作伙伴宣布提供 1000 万美元资金,用于支持多代理 AI 安全领域的研究。
Fluid, natural voice translation with Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 实现流畅自然的语音翻译
Gemini 3.5 Live Translate 为 Google AI Studio、Translate 和 Meet 带来了近乎实时的自然语音翻译体验。
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
推出 Gemma 4 12B:统一的、无编码器的多模态模型
Powering the future of robotics in Europe
助力欧洲机器人技术的未来
VentureBeat AI
Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.
谷歌 25 年来首次重新设计搜索框——为什么这比你想象的更重要
谷歌在 I/O 大会上宣布彻底重构搜索框,标志着从传统的“关键词+链接”模式向 AI 驱动的交互模式转型。
Railway secures $100 million to challenge AWS with AI-native cloud infrastructure
Railway 融资 1 亿美元,以 AI 原生云基础设施挑战 AWS
Railway 宣布完成 1 亿美元 B 轮融资,旨在通过 AI 原生云平台解决传统云基础设施在 AI 应用开发中的局限性。
Claude Code costs up to $200 a month. Goose does the same thing for free.
Claude Code 每月最高 200 美元,Goose 提供同样的免费服务
Claude Code 的高昂定价引发了开发者社区的抵制,开源替代品 Goose 凭借免费特性迅速获得关注。
Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews
Listen Labs 融资 6900 万美元,此前曾通过病毒式广告牌招聘
Listen Labs 通过在旧金山投放包含 AI Token 的广告牌成功吸引了人才,并最终完成了 6900 万美元融资。
Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI
Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域对抗微软与谷歌
Salesforce 重构了 Slackbot,使其从简单的通知工具升级为能够处理企业数据、撰写文档的 AI 代理。
Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required
Anthropic 发布 Cowork,一款无需编码即可处理文件的 Claude Desktop 代理
Cowork 将 Claude Code 的强大能力带给了非技术用户,标志着 Anthropic 在 AI 代理普及化进程中的重要一步。
Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment
Nous Research 的 NousCoder-14B:一款在 Claude Code 热潮中发布的开源编码模型
Nous Research 发布了 NousCoder-14B,该模型在编程任务上表现出色,且训练成本极低,为开源社区提供了强有力的编码辅助工具。