2026-07-04

今日要点


TechCrunch

The only AI glossary you’ll need this year

今年你唯一需要的 AI 术语表

随着 AI 技术的爆炸式增长,大量新术语和俚语涌现。本文整理了一份详尽的 AI 术语表,旨在帮助读者理解当前 AI 领域最核心的概念和短语,是初学者和从业者快速掌握行业语言的必备指南。

Read more →


The browser wars aren’t about search anymore — here are the best alternatives to Chrome and Safari

浏览器大战不再关乎搜索——Chrome 和 Safari 的最佳替代品

现代浏览器竞争的焦点已从搜索转向了用户体验和功能集成。本文盘点了几款旨在挑战 Chrome 和 Safari 市场地位的顶级替代浏览器,重点介绍了它们在隐私保护、性能优化及个性化功能方面的独特优势。

Read more →


The Dune keypad device can be your meeting controller and more

Dune 键盘设备:你的会议控制器及更多功能

Dune 是一款拥有三个按键的创新硬件设备,其核心亮点在于能够根据当前运行的应用程序自动切换功能。例如,在会议软件中,它可以一键实现静音切换、视频开关或窗口置顶,极大提升了办公效率。

Read more →


Chevy built an all-American EV truck — why is nobody buying it?

雪佛兰打造了纯正美式电动皮卡——为什么没人买?

雪佛兰 Silverado EV 作为一款纯正的美式电动皮卡,虽然在设计和性能上表现扎实,但市场反响平平。本文分析了该车型在当前竞争激烈的电动车市场中面临的挑战,并探讨了未来改进的方向。

Read more →


Politician who investigated spyware abuses had his phone hacked with Pegasus spyware

曾调查间谍软件滥用的政客遭 Pegasus 间谍软件攻击

一名欧洲政客在担任欧盟委员会成员期间,负责调查间谍软件行业,却不幸成为 Pegasus 间谍软件的受害者。该事件揭露了 NSO Group 的技术被政府客户滥用于监控调查人员的严重安全隐患。

Read more →


Last chance to apply — Startup Battlefield Australia applications close July 6

最后申请机会——Startup Battlefield Australia 申请将于 7 月 6 日截止

Startup Battlefield Australia 的申请通道即将关闭。对于希望在这一顶级创业舞台展示项目的初创公司来说,7 月 6 日是最后的截止日期,错过此次机会将无法参与后续的选拔。

Read more →


Mark Zuckerberg tells staff that AI agents haven’t progressed as quickly as he’d hoped

马克·扎克伯格告诉员工:AI 代理的进展未达预期

在近期的一次内部会议上,Meta 首席执行官马克·扎克伯格表示,公司在 AI 代理方面的开发进度并没有达到他最初的预期。这反映出即使是科技巨头,在实现高度自主的 AI 代理方面也面临着技术瓶颈。

Read more →


Private space pilots are flying orbital missions for the US Space Force

私人航天飞行员正在为美国太空军执行轨道任务

True Anomaly 和 Rocket Lab 等私营航天公司正在为美国军方执行类似“壮志凌云”风格的卫星近距离飞行任务。这一合作标志着商业航天力量在国家安全和轨道防御领域扮演着越来越重要的角色。

Read more →


Thiel Capital’s Jack Selby nabs stakes in hot startups like Etched through Arizona connections

Thiel Capital 的 Jack Selby 通过亚利桑那人脉入股 Etched 等热门初创公司

Jack Selby 旗下的 Copper Sky Capital 正在筹集 3 亿美元的第二期基金。通过在亚利桑那州建立的深厚人脉,Selby 成功抢占了 Etched 等热门 AI 初创公司的早期股份。

Read more →


IQM, Europe’s first public quantum company, admits the future of the tech is uncertain

欧洲首家上市量子计算公司 IQM 承认该技术未来充满不确定性

来自芬兰的全栈量子计算公司 IQM 今日在纳斯达克上市,估值约 19 亿美元。尽管成功上市,但公司在招股书中坦诚,量子计算技术的未来发展路径和商业化前景仍存在显著的不确定性。

Read more →


The Verge

Amazon updated 2023’s Fire HD 10 tablet with 4GB of RAM

亚马逊为 2023 款 Fire HD 10 平板电脑升级至 4GB 内存

亚马逊悄然更新了 2023 年发布的 Fire HD 10 平板电脑。32GB 版本现已配备 4GB 内存(此前为 3GB),售价也从 139.99 美元小幅上调至 154.99 美元,旨在提升这款入门级设备的运行性能。

Read more →


While you’re watching the World Cup, the feds may be watching you

当你在观看世界杯时,联邦政府可能正在监视你

随着美国迎来建国 250 周年并联合举办世界杯,各大主办城市正在大幅升级监控系统。本文提醒公众,在享受赛事的同时,可能正处于无处不在的监控网络之下,引发了对隐私保护的担忧。

Read more →


This slim camera has a transparent LCD screen for a viewfinder

这款轻薄相机配备了透明 LCD 取景器

在智能手机摄影统治的时代,便携式数码相机正迎来复兴。Godox 推出了新款相机,其最大特色是采用了一块透明的 LCD 屏幕作为取景器,为追求复古拍摄体验的用户提供了新选择。

Read more →


I finally got my Trump phone

我终于拿到了我的特朗普手机

经过长达一年的等待,作者终于收到了备受争议的“特朗普手机”(T1 Phone 8002)。文章详细记录了这款手机的开箱体验,并指出其在环保意识(仍附带充电器)和产品定位上的独特之处。

Read more →


Hydration isn’t complicated: Just drink water

补水并不复杂:喝水就行

针对市面上琳琅满目的运动饮料和补水产品,本文作者 Victoria Song 在其专栏中指出,除非进行高强度的专业运动,否则普通人补水最简单有效的方式就是喝水,无需过度依赖功能性饮料。

Read more →


Anthropic wants to develop its own drugs

Anthropic 想要自主研发药物

在“AI for Science”简报会上,Anthropic 发布了 Claude Science。这是一个专为科学家设计的 AI 工作台,旨在整合碎片化的工具和数据集,通过 AI 辅助生成科研图表和分析,标志着 Anthropic 正深入生物医药研发领域。

Read more →


Jon Prosser responds to Apple lawsuit by blaming the other guy

Jon Prosser 回应苹果诉讼:将责任推给他人

知名 YouTuber Jon Prosser 正式回应了苹果对其窃取 iOS 机密信息的诉讼。Prosser 否认参与任何针对苹果的阴谋,但承认曾录制过展示未发布 iOS 软件的 FaceTime 通话,并将责任归咎于他人。

Read more →


The Verge’s annual summer ‘in’ and ‘out’ list

The Verge 年度夏季“流行”与“过时”清单

The Verge 编辑部再次发布了年度夏季趋势清单。在 AI 算法主导的现代生活中,这份清单盘点了哪些事物在今年夏天是“IN”(流行),哪些是“OUT”(过时),引发了读者的广泛讨论。

Read more →


Apple TV is hitting its stride

Apple TV 渐入佳境

Apple TV Plus 自推出以来一直坚持“重质不重量”的策略。2026 年,该平台凭借一系列高质量的原创剧集,展现出类似早期 HBO 的品牌影响力,被认为正处于发展的黄金时期。

Read more →


A behind-the-scenes look at Midjourney’s medical scanner leaves many questions unanswered

Midjourney 医疗扫描仪幕后揭秘:仍留下诸多疑问

Midjourney 发布了一段关于其医疗超声扫描仪的幕后视频。尽管展示了其未来感的设计,但外界对于该设备是否真正具备临床有效性仍存疑,公司尚未提供足够的科学证据来支持其医疗应用。

Read more →


Ars Technica

Rocket Report: Indian startup nears first launch; SpaceX’s millenary milestone

火箭报告:印度初创公司接近首次发射;SpaceX 达成千次里程碑

本期火箭报告涵盖了印度航天初创公司的最新进展,以及 SpaceX 在发射任务数量上达成的千次里程碑。此外,NASA 授予 Rocket Lab 三次 Electron 火箭发射合同,进一步巩固了其在小型卫星发射市场的地位。

Read more →


Inside the Luddite festival harnessing Gen Z’s rage against Big Tech

走进“卢德分子”节:利用 Z 世代对大科技公司的愤怒

纽约市举办的“Summer of Ludd”节日旨在教导人们如何摆脱数字依赖,回归线下生活。这一活动反映了 Z 世代对大科技公司算法控制和数字过载的深层不满与反思。

Read more →


Despite the darkness, I still see signs of hope in America

尽管身处黑暗,我依然在美国看到希望

作者 Eric Berger 在文中探讨了美国社会当前面临的困境,并反思了国家偏离正轨的时刻。尽管面临诸多挑战,他依然在社会各界的努力中看到了复苏的希望。

Read more →


Visiting the stars (and planets, and telescopes) in VR

在 VR 中造访恒星、行星和天文台

本文介绍了一款 VR 体验应用,用户可以通过虚拟现实技术身临其境地参观遥远的恒星、系外行星以及世界各地的顶级天文台,为天文爱好者提供了全新的探索视角。

Read more →


Wing Commander IV and the FMV future that never quite was

《银河飞将 4》与那段未竟的 FMV 未来

本文回顾了 Chris Roberts 在《银河飞将 4》中尝试将电影化叙事与游戏结合的历程。尽管 FMV(全动态影像)技术在当时被寄予厚望,但最终并未成为游戏行业的主流发展方向。

Read more →


Newly discovered PamStealer isn’t your typical macOS malware

新发现的 PamStealer:非典型的 macOS 恶意软件

研究人员发现了一种名为 PamStealer 的新型 macOS 恶意软件。与传统病毒不同,它专门针对 Mac 用户的信息窃取,凸显了针对苹果生态系统的恶意软件攻击正变得日益复杂。

Read more →


FAA proposal: Supersonic airliners can fly over US cities if they’re quiet

FAA 提案:超音速客机若足够安静,可飞越美国城市

美国联邦航空管理局(FAA)提出新规,如果超音速客机能够有效控制噪音,避免产生音爆,将允许其在城市上空飞行。这一政策有望为超音速商业航空的复兴铺平道路。

Read more →


Ars Live recap: When are the big rockets NASA desperately needs going to be ready?

Ars Live 回顾:NASA 急需的大型火箭何时才能就绪?

在 Ars Live 的讨论中,专家们探讨了 NASA 关键火箭项目的进度问题。结论显示,目前几乎没有大型火箭项目能够按计划准时交付,行业面临着严重的进度延期挑战。

Read more →


Plex debuts 5-year membership pass for $250

Plex 推出 250 美元 5 年期会员通行证

Plex 宣布推出 250 美元的 5 年期会员计划。此举旨在引导用户转向更长期的订阅模式,并推广其平台上的最新功能,以增加用户粘性和收入稳定性。

Read more →


Africa CDC confirms Marburg case in Uganda as Ebola outbreak rages

非洲疾控中心确认乌干达出现马尔堡病毒病例,埃博拉疫情持续蔓延

在埃博拉疫情肆虐的同时,非洲疾控中心确认乌干达出现了马尔堡病毒病例。虽然目前报告显示传播范围相对局限,但公共卫生部门正密切监控以防疫情进一步扩散。

Read more →


Product Hunt

Osloq

An AI agent that reproduces GitHub issues for you.

Read more →


nxt

Talk to your to do list and get what’s next.

Read more →


Tamamon

A desktop pet that grows as you code with Claude Code.

Read more →


Glaze by Raycast

Create your own Mac apps by chatting with AI.

Read more →


Goals from Loops

Measure whether a campaign drove the desired outcome.

Read more →


Archify

Understand software.

Read more →


Vox

Voice in, voice out — with GitHub Copilot.

Read more →


Fypro

Convert your TikTok followers into paying customers.

Read more →


Context.dev

One API to scrape, enrich, and extract the internet.

Read more →


Needle

The proactive GTM agent in Slack and Teams.

Read more →


MIT Technology Review

A device that revives eyeballs from dead donors could make eye transplants possible

一种能复苏捐赠者眼球的设备可能使眼球移植成为现实

眼球移植手术因其复杂性和眼球离体后的快速退化而极具挑战。研究人员开发出一种新型设备,能够维持离体眼球的活性,这为未来实现真正的眼球移植手术带来了新的希望。

Read more →


The Download: a smoking “endgame” and a new Elizabeth Bear story

今日下载:吸烟的“终局”与 Elizabeth Bear 的新故事

本期简报讨论了英国的代际禁烟政策,尽管其效果尚存争议,但作者表达了对该政策的支持。此外,简报还推荐了 Elizabeth Bear 的最新科幻故事。

Read more →


The UK’s generational tobacco ban might not work. I’m supporting it anyway.

英国的代际禁烟政策可能无效,但我依然支持它

作者从家长的视角出发,探讨了英国旨在彻底消除吸烟的代际禁烟政策。尽管该政策在执行层面面临挑战,但作者认为其对下一代健康观念的塑造具有深远意义。

Read more →


Achieving operational excellence with AI

利用 AI 实现卓越运营

Lean Six Sigma 和 BPM 等传统管理框架曾为企业运营带来秩序。如今,AI 正在成为这些框架的核心,通过自动化和数据驱动的洞察,帮助企业在复杂的运营环境中实现更高的效率和质量控制。

Read more →


Teaching AI to run with the turbines

教 AI 与涡轮机协同工作

AI 的应用已从聊天机器人扩展到工业基础设施领域。在安全和连续性至关重要的工业系统中,AI 正在成为核心操作系统,通过实时监控和优化,提升大型工业设备的运行效率。

Read more →


The Download: a startup has a solution for AI’s groupthink problem

今日下载:一家初创公司为 AI 的“群体思维”问题提供了解决方案

本期简报重点介绍了 AI 模型中存在的“群体思维”现象(即不同模型给出相似的随机答案),并探讨了一家初创公司如何通过技术手段打破这种思维定势。

Read more →


Why California’s carbon manure math doesn’t add up

为什么加州的碳排放粪便计算逻辑不成立

加州政府通过补贴鼓励奶农将牛粪产生的甲烷转化为天然气,旨在减少污染。然而,本文指出这种计算逻辑存在漏洞,实际上可能并未达到预期的减排效果,反而引发了环境争议。

Read more →


LLMs are stuck in a groupthink groove. This startup is trying to get them out.

大语言模型陷入了“群体思维”的怪圈,这家初创公司正试图打破它

研究发现,当要求不同的 AI 模型生成随机数时,它们往往会给出惊人相似的答案。这种“群体思维”限制了 AI 的创造力,本文探讨了如何通过技术手段引导模型跳出这种思维定势。

Read more →


The Download: Anthropic launches Claude Science, and California’s carbon manure math

今日下载:Anthropic 发布 Claude Science 与加州的碳排放粪便计算

本期简报涵盖了 Anthropic 针对科研领域推出的 Claude Science,以及对加州碳排放政策中粪便处理计算逻辑的深度分析。

Read more →


Claude Science is Anthropic’s newest flagship product

Claude Science 是 Anthropic 最新的旗舰产品

Anthropic 宣布推出 Claude Science,这是继 Claude Code 之后的又一旗舰产品。该工具旨在通过自主执行科研任务,为制药和生物技术领域的科研人员提供强大的 AI 辅助支持。

Read more →


usestrix / strix

开源 AI 渗透测试工具,用于发现和修复应用程序中的漏洞。

Read more →


openai / codex-plugin-cc

使用 Claude Code 中的 Codex 来审查代码或委派任务。

Read more →


JuliusBrussee / caveman

Claude Code 技能,通过像原始人一样说话来减少 65% 的 Token 消耗。

Read more →


elastic / elasticsearch

免费开源的分布式 RESTful 搜索引擎。

Read more →


actions / checkout

用于检出代码仓库的 GitHub Action。

Read more →


ChromeDevTools / chrome-devtools-mcp

用于编码代理的 Chrome 开发者工具。

Read more →


ansible / ansible

简单易用的 IT 自动化平台,用于部署和维护应用程序及系统。

Read more →


facebook / astryx

一个完全可定制且支持 AI 代理的开源设计系统。

Read more →


rommapp / romm

一个美观、强大且可自托管的 ROM 管理器和播放器。

Read more →


harvard-edge / cs249r_book

机器学习系统相关书籍。

Read more →


OpenAI Blog

How ChatGPT adoption has expanded

ChatGPT 的采用率是如何扩展的

OpenAI Signals 数据显示,ChatGPT 的全球采用率正在持续增长。用户不仅增加了使用频率,还在探索更多功能,推动了在不同地区和语言环境下的广泛应用。

Read more →


Inside Genebench-Pro

深入了解 Genebench-Pro

Genebench-Pro 是 OpenAI 推出的新基准测试,旨在通过复杂的真实世界数据集,评估 AI 在基因组学、生物学和科学研究领域的性能表现。

Read more →


Introducing GeneBench-Pro

介绍 GeneBench-Pro

OpenAI 正式发布 GeneBench-Pro,这是一个专门用于测试 AI 在生物科学领域科研能力的基准测试工具,旨在推动 AI 在生命科学研究中的应用。

Read more →


Core dump epidemiology: fixing an 18-year-old bug

核心转储流行病学:修复一个 18 年前的 Bug

OpenAI 工程师利用大规模核心转储分析技术,成功定位并修复了一个长期存在的系统基础设施 Bug,该 Bug 同时涉及硬件故障和软件逻辑错误。

Read more →


Mapping Europe’s AI Workforce Opportunity

绘制欧洲 AI 劳动力机遇图谱

OpenAI 发布了一份新报告,分析了 AI 技术将如何重塑欧盟的就业市场,重点指出了哪些职业将面临自动化、哪些将迎来增长,以及工作流程将如何演变。

Read more →


HP Inc. launches Frontier strategic partnership with OpenAI

惠普与 OpenAI 达成 Frontier 战略合作伙伴关系

惠普公司扩大了与 OpenAI 的 Frontier 合作伙伴关系,旨在将 AI 技术部署到客户体验、软件开发和企业运营的各个环节。

Read more →


Previewing GPT-5.6 Sol: a next-generation model

预览下一代模型 GPT-5.6 Sol

OpenAI 预览了其下一代模型 GPT-5.6 Sol。该模型在编码、科学研究和网络安全方面表现出更强的能力,并配备了 OpenAI 最先进的安全防护体系。

Read more →


How agents are transforming work

AI 代理如何改变工作方式

OpenAI 的一项最新研究表明,AI 代理正在深刻改变工作模式,使 AI 能够处理更长、更复杂的任务,从而在不同岗位上显著提升生产力。

Read more →


OpenAI and Broadcom unveil LLM-optimized inference chip

OpenAI 与博通联合发布 LLM 优化推理芯片

OpenAI 与博通合作推出了名为“Jalapeño”的定制 AI 芯片。该芯片专为大语言模型推理而设计,旨在提升 AI 系统的性能、效率和扩展能力。

Read more →


Helping build shared standards for advanced AI

助力构建先进 AI 的共享标准

OpenAI 正在通过 Appia 基金会积极参与构建先进 AI 的共享标准,支持评估框架、安全实践以及全球范围内的技术合作。

Read more →


Anthropic Blog

Redeploying Fable 5

重新部署 Fable 5

Fable 5 已于 7 月 1 日全球重新上线。Anthropic 同时联合亚马逊、谷歌、微软等合作伙伴,提出了一套行业通用的越狱严重程度评分框架。

Read more →


Introducing Claude Sonnet 5

介绍 Claude Sonnet 5

Claude Sonnet 5 正式发布,该模型在编码、代理任务和专业工作场景中展现了前沿的性能表现,能够在大规模应用中提供高效支持。

Read more →


Claude Science, an AI workbench for scientists, is now available

Claude Science:面向科学家的 AI 工作台现已上线

Claude Science 是一款可定制的应用程序,集成了科研人员常用的工具和软件包,能够生成可审计的科研成果,并提供灵活的计算资源访问权限。

Read more →


Introducing Claude Tag

介绍 Claude Tag

Claude Tag 是一种全新的团队协作方式,旨在帮助团队更高效地与 Claude 进行交互和工作。

Read more →


More details on Fable 5’s cyber safeguards and our jailbreak framework

关于 Fable 5 网络安全防护与越狱框架的更多细节

本文详细介绍了 Fable 5 的网络安全防护机制,以及 Anthropic 与合作伙伴共同制定的越狱严重程度评分框架。

Read more →


Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem

Anthropic 在首尔开设办事处,并宣布与韩国 AI 生态系统建立新合作伙伴关系

Anthropic 正式在首尔设立办事处,并宣布与韩国多家机构达成合作,旨在共同推动韩国 AI 生态系统的发展。

Read more →


Statement on the US government directive to suspend access to Fable 5 and Mythos 5

关于美国政府暂停 Fable 5 和 Mythos 5 访问权限指令的声明

Anthropic 发布声明,回应了美国政府关于暂停 Fable 5 和 Mythos 5 模型访问权限的指令。

Read more →


Results from the first Anthropic Public Record

首份 Anthropic 公共记录结果

本文公布了 Anthropic 首份公共记录的评估结果,展示了模型在安全性和性能方面的表现。

Read more →


TCS and Anthropic partner to bring Claude to regulated industries

TCS 与 Anthropic 合作,将 Claude 引入受监管行业

塔塔咨询服务公司(TCS)与 Anthropic 达成合作,旨在将 Claude 模型引入银行、航空等受监管行业,提升其业务智能化水平。

Read more →


DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on

DXC 将把 Claude 集成到银行、航空公司及其他受监管行业依赖的系统中

DXC Technology 宣布将 Claude 模型集成到其为银行、航空公司等受监管行业提供的核心系统中,以优化业务流程。

Read more →


Google AI Blog

The latest AI news we announced in June 2026

2026 年 6 月 Google AI 最新动态汇总

本文汇总了 Google 在 2026 年 6 月发布的各项 AI 技术更新和研究成果。

Read more →


New York City educators and industry leaders gathered at Google’s offices to shape the future of AI in classrooms.

纽约教育界与行业领袖齐聚 Google 办公室,共商 AI 课堂的未来

Google 与纽约就业 CEO 理事会及 Urban Assembly 合作,举办了一场 AI 教育峰会,邀请 150 位教育和行业领袖共同探讨 AI 在课堂中的应用前景。

Read more →


Unlocking Britain’s next era of productivity: Building a nation of AI trailblazers

开启英国生产力新时代:打造 AI 先锋国家

Google 英国发布了最新的经济影响报告,探讨了如何通过 AI 技术赋能更多人,从而提升英国的整体生产力。

Read more →


Ask an AI expert: What exactly is the full stack?

咨询 AI 专家:到底什么是“全栈”?

Google 专家深入浅出地解释了 AI 领域“全栈”方法的含义,并阐述了为什么这种方法一直是 Google AI 研究的核心基础。

Read more →


Our latest Google Finance upgrades, including a new app

Google Finance 最新升级,包括一款全新 App

Google Finance 结束测试阶段,正式推出全新 Android 应用程序,为用户提供更便捷的金融信息服务。

Read more →


New research shows how AMIE, our medical AI, could help manage health conditions.

最新研究显示:医疗 AI 系统 AMIE 如何助力健康管理

发表在《Nature》上的研究表明,Google 的对话式 AI 系统 AMIE 在复杂疾病管理方面表现出色,其诊断能力可媲美初级保健医生。

Read more →


We’re strengthening our presence in Alabama through new investments and community support.

通过新投资与社区支持,加强在阿拉巴马州的布局

Google 宣布在 2026 年和 2027 年投资 15 亿美元,用于扩建其位于阿拉巴马州杰克逊县的数据中心园区。

Read more →


Our new community investments in Virginia support local jobs and expand energy affordability.

在弗吉尼亚州的新社区投资:支持当地就业并提升能源可负担性

Google 宣布在弗吉尼亚州进行社区投资,旨在培养下一代劳动力,并支持当地的能源项目。

Read more →


The latest AI news we announced in May 2026

2026 年 5 月 Google AI 最新动态汇总

本文汇总了 Google 在 2026 年 5 月发布的各项 AI 技术更新。

Read more →


5 ways Google Search can level up your thrift and vintage shopping

Google 搜索助力二手与复古购物的 5 种方式

Google 搜索和购物功能引入了 AI 工具,帮助用户更轻松地发现和购买二手及复古商品。

Read more →


Hugging Face Blog

Hugging Face and Cerebras bring Gemma 4 to real-time voice AI

Hugging Face 与 Cerebras 将 Gemma 4 引入实时语音 AI

Read more →


ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration

ScarfBench:企业级 Java 框架迁移的 AI 代理基准测试

Read more →


Why Specialization Is Inevitable

为什么专业化是不可避免的

Read more →


Featuring Every Eval Ever Results on Hugging Face Model Pages

在 Hugging Face 模型页面展示所有评估结果

Read more →


DiScoFormer: One transformer for density and score, across distributions

DiScoFormer:跨分布的密度与分数统一 Transformer 模型

Read more →


Run a vLLM Server on HF Jobs in One Command

一键在 HF Jobs 上运行 vLLM 服务器

Read more →


Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel

使用 NVIDIA NeMo AutoModel 加速 Transformer 微调

Read more →


Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World

介绍 FFASR 排行榜:真实世界中的自动语音识别基准测试

Read more →


Shipping huggingface_hub every week with AI, open tools, and a human in the loop

每周利用 AI、开源工具和人工干预发布 huggingface_hub

Read more →


Experimenting with the proposed Cross-Origin Storage API in Transformers.js

在 Transformers.js 中试验跨源存储 API

Read more →


The Gradient

After Orthogonality: Virtue-Ethical Agency and AI Alignment

正交性之后:美德伦理代理与 AI 对齐

本文探讨了 AI 对齐问题,认为理性的人类行为并非基于单一的“目标”,而是基于实践网络。因此,AI 不应被赋予固定的目标,而应通过美德伦理框架进行对齐。

Read more →


AGI Is Not Multimodal

AGI 不是多模态的

作者反驳了当前生成式 AI 预示 AGI 即将到来的观点,指出语言模型缺乏人类智能所必需的具身理解,AGI 的实现不能仅依赖多模态数据的堆砌。

Read more →


Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research

形状、对称性与结构:数学在机器学习研究中角色的转变

过去十年,机器学习研究从数学驱动转向了工程驱动。本文探讨了这种转变对模型性能和研究范式的影响,并反思了数学在现代机器学习中的地位。

Read more →


What’s Missing From LLM Chatbots: A Sense of Purpose

LLM 聊天机器人缺失了什么:目标感

尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升。本文认为,聊天机器人缺乏明确的“目标感”,这是限制其从工具向智能助手转型的关键因素。

Read more →


We Need Positive Visions for AI Grounded in Wellbeing

我们需要基于福祉的 AI 正向愿景

AI 技术正在深刻改变社会,但目前的讨论往往过于关注技术本身。本文呼吁建立以人类福祉为核心的 AI 发展愿景,确保技术进步真正服务于人类生活质量的提升。

Read more →


Financial Market Applications of LLMs

LLM 在金融市场的应用

大语言模型在处理序列数据方面的能力,使其在金融市场预测和分析中展现出巨大潜力。本文概述了 LLM 在金融领域的应用现状及面临的挑战。

Read more →


A Brief Overview of Gender Bias in AI

AI 中的性别偏见简述

本文简要概述了 AI 系统中存在的性别偏见问题,并讨论了其产生的原因及潜在的社会影响。

Read more →


Mamba Explained

Mamba 模型详解

Mamba 是一种基于状态空间模型(SSM)的新型 AI 模型,旨在解决 Transformer 模型在处理长序列时的效率瓶颈,是当前 AI 架构研究的重要方向。

Read more →


Car-GPT: Could LLMs finally make self-driving cars happen?

Car-GPT:大语言模型能最终实现自动驾驶吗?

本文探讨了将大语言模型应用于自动驾驶系统的可能性,分析了其在处理复杂驾驶场景时的优势及面临的信任与安全挑战。

Read more →


Do text embeddings perfectly encode text?

文本嵌入能完美编码文本吗?

研究发现,通过“Vec2text”技术可以将嵌入向量还原为文本,这揭示了嵌入数据在安全性方面的潜在风险,呼吁行业重新审视相关安全协议。

Read more →


arXiv CS.AI

PACE: A Neuro-Symbolic Framework for Plausible and Actionable Counterfactual Explanations

PACE:一种用于生成合理且可操作的反事实解释的神经符号框架

针对现有反事实解释方法常产生不切实际建议的问题,本文提出 PACE 框架,通过神经符号方法确保生成的解释既符合逻辑又具备实际操作性。

Read more →


Auto-FL-Research: Agentic Search for Federated Learning Algorithms

Auto-FL-Research:联邦学习算法的代理式搜索

联邦学习研究涉及大量复杂的参数选择,手动探索成本高昂。本文提出 Auto-FL-Research,利用代理式搜索自动优化联邦学习算法的各项配置。

Read more →


The Wiola Architecture for Efficient Small Language Models

Wiola:用于高效小语言模型的架构

Wiola 是一种全新的小语言模型架构,不依赖现有的 GPT 或 LLaMA 等结构。它引入了五项创新组件,包括螺旋旋转位置编码(SRPE),旨在提升模型的效率和性能。

Read more →


Agent4cs: A Multi-agent System for Code Summarization in Large Hierarchical Codebases

Agent4cs:用于大型分层代码库代码摘要的多代理系统

针对大型复杂代码库的理解难题,本文提出 Agent4cs 多代理系统。它超越了单一模型,能够利用代码库的丰富依赖关系,实现更精准的代码摘要。

Read more →


When Should Service Agents Reconsider? Difficulty-Routed Control in Customer-Service Operations

服务代理何时应重新考虑?客户服务运营中的难度路由控制

随着 AI 代理在客户服务中承担更多操作性任务,如何处理复杂请求成为难题。本文提出难度路由控制机制,优化了代理在处理不同难度任务时的决策流程。

Read more →


CreativityNeuro: Steering Language Model Weights to Improve Divergent Thinking and Reduce Mode Collapse

CreativityNeuro:通过引导语言模型权重提升发散性思维并减少模式崩溃

针对 LLM 容易产生重复回答的“人工蜂巢思维”效应,本文提出 CreativityNeuro 方法,通过对比权重引导,有效提升了模型的发散性思维能力。

Read more →


Discrete Diffusion Language Models for Interactive Radiology Report Drafting

用于交互式放射学报告撰写的离散扩散语言模型

本文将扩散语言模型应用于放射学报告撰写,通过双向去噪生成文本,在医疗领域展现出比传统自回归模型更强的交互能力。

Read more →


Beyond Next-Token Prediction: An RLVR Proof of Concept for Tool-Use Agents on Atlassian Workflows

超越下一词预测:Atlassian 工作流中工具使用代理的 RLVR 概念验证

针对 LLM 在企业 SaaS 工作流中因目标不匹配导致的工具使用失败问题,本文提出 RLVR(强化学习验证奖励)方法,显著提升了代理在复杂 API 调用中的成功率。

Read more →


arXiv CS.CL

TokenScope: Token-Level Explainability and Interpretability for Code-Oriented Tasks in Large Language Models

TokenScope:大语言模型代码任务的 Token 级可解释性与可解释性工具

TokenScope 旨在解决 LLM 在代码生成过程中决策过程不透明的问题,提供了解码时的信号、细粒度的不确定性度量及交互式分析功能。

Read more →


Safeguarding LLM Agents from Misalignment through Provenance Analysis

通过溯源分析保护 LLM 代理免受对齐偏差影响

针对 LLM 代理在工具调用中可能出现的意图偏差,本文提出溯源分析方法,作为运行时防护机制,确保代理行为始终符合用户意图。

Read more →


Kara: Efficient Reasoning LLM Serving via Sliding-Window KV Cache Compression

Kara:通过滑动窗口 KV 缓存压缩实现高效推理 LLM 服务

针对推理模型长思维链导致的 KV 缓存过大和延迟问题,Kara 提出滑动窗口压缩技术,在减少内存开销的同时提升了推理吞吐量。

Read more →


SPARCLE: SPeaker-aware Aligned Representations via Contrastive Language Embeddings

SPARCLE:通过对比语言嵌入实现说话人感知对齐表示

针对语音合成中音素映射的局限性,SPARCLE 提出基于字素的建模方法,并结合对比学习,更好地捕捉了说话人的声学特征差异。

Read more →


Breaking Safety at the Token Boundary: How BPE Tokenization Creates Exploitable Gaps in LLM Alignment

突破 Token 边界的安全性:BPE 分词如何在大模型对齐中制造可利用的漏洞

研究发现,BPE 分词会将安全关键词拆分为子词,导致模型对齐失效。本文揭示了这一结构性漏洞,并指出当前主流对齐数据集缺乏对碎片化输入的防御。

Read more →


Prompt Framing Distorts Count-Based Evaluation of LLM Error Detection: Evidence from Numeric Anchoring

提示词框架扭曲了 LLM 错误检测的计数评估:来自数字锚定的证据

本文指出,基于计数的 F1 分数在评估 LLM 错误检测时存在“F1 通胀”现象,并引入 ErrorBench 协议来纠正提示词诱导的计数偏差。

Read more →


Mapping Text to Multiplex Graph: Prompt Compression as L’evy Walk-Guided Graph Pruning

将文本映射为多路复用图:作为莱维飞行引导图剪枝的提示词压缩

针对现有提示词压缩方法忽略文本结构的问题,本文提出将文本映射为图结构,并利用莱维飞行引导进行剪枝,从而更有效地保留关键语义信息。

Read more →


Office Comprehension Benchmark

办公文档理解基准测试

OCB 是首个联合评估 LLM 对 Word、Excel 和 PowerPoint 文档理解能力的基准测试,涵盖了结构感知、视觉感知及跨格式推理任务。

Read more →


WIRED

3 Nuclear Startups Hit a Big Milestone. Why It Matters—and Why It Doesn’t

三家核能初创公司达成重大里程碑:意义何在,又为何无关紧要?

三家核能初创公司近期庆祝了其新型反应堆设计的上线。尽管这是行业的重要进展,但要实现大规模商业化供电,仍面临漫长的技术和监管挑战。

Read more →


Google DeepMind Unionization Talks Are Off to a Rocky Start

Google DeepMind 工会化谈判开局不利

在周三的谈判中,员工对管理层在工会化问题上缺乏实质性参与表示不满,双方的沟通陷入僵局。

Read more →


Best Bone Conduction Headphones (2026): Shokz, Suunto, Mojawa

2026 年度最佳骨传导耳机:Shokz、Suunto、Mojawa

对于户外运动爱好者来说,骨传导耳机是兼顾音乐与环境安全的首选。本文盘点了今年最值得购买的几款骨传导耳机产品。

Read more →


All Your Favorite Gadgets Are Getting Way More Expensive … Again

你最爱的电子产品又双叒涨价了

受 AI 驱动的芯片短缺影响,手机、电脑和游戏主机的价格持续攀升,且短期内看不到回落的迹象。

Read more →


7 Best Phones You Can’t Buy in the US (2026)

2026 年度 7 款美国买不到的最佳手机

为了避免“手机 FOMO”(错失恐惧症),本文盘点了那些在英国和欧洲市场广受好评,但未在美国正式发售的优秀智能手机。

Read more →


The FDA Ruled That ZYN Pouches Are Safer Than Cigarettes. That Doesn’t Mean They’re Safe

FDA 裁定 ZYN 尼古丁袋比香烟更安全,但这并不意味着它就是安全的

尽管 FDA 允许 ZYN 尼古丁袋作为成年吸烟者的减害替代品进行宣传,但专家提醒,彻底戒除所有烟草和尼古丁产品才是最健康的选择。

Read more →


The Best Ultralight Backpacking Quilts (2026): Zenbivy, REI

2026 年度最佳超轻背包旅行被子:Zenbivy、REI

为了减轻背包重量,越来越多的旅行者选择使用超轻被子代替传统的睡袋。本文推荐了今年最值得入手的几款产品。

Read more →


When the Law Kills Your Electric Car Dealership

当法律扼杀你的电动汽车经销店

由于联邦政府拒绝授权 Polestar 绕过中国技术禁令,投资该品牌的经销商明年将无法在美国销售相关车型,这凸显了地缘政治对商业运营的直接影响。

Read more →


The 11 Best TV Shows to Stream This Month (July 2026)

2026 年 7 月最值得观看的 11 部流媒体剧集

本月推荐包括《龙之家族》、《探险活宝:支线任务》等 11 部精彩剧集,为观众提供丰富的流媒体观看选择。

Read more →


Sony Erases Digital Content From Libraries, a Reminder That You Don’t Own What You Buy

索尼从用户库中删除数字内容,提醒你:你买的东西并不真正属于你

索尼宣布将于 9 月删除部分 PlayStation 用户购买的电影和剧集。这一事件再次提醒消费者,数字购买本质上更像是长期租赁,而非永久所有权。

Read more →


Lobsters

Fourteener Lobsters

Lobsters 社区成立 14 周年纪念,用户活跃度持续上升。

Read more →


Why implementing ActivityPub is hard, and why it doesn’t have to be

探讨实现 ActivityPub 协议的难点及简化方案。

Read more →


Clickhouse is winning the Observability Wars

Clickhouse 在可观测性领域的竞争中占据优势。

Read more →


crustc: Entirety of rustc, translated to C

将整个 Rust 编译器翻译为 C 语言的项目。

Read more →


Arbitrary code execution breaking sandboxes in KDE Plasma

KDE Plasma 中存在的沙箱逃逸与任意代码执行漏洞。

Read more →


Gossamer

一种具有真实 goroutine 和 Swift 风格内存模型的 Rust 风格语言。

Read more →


Goodbye, forever, probably

告别文章。

Read more →


Diving into the depths of Widevine L3

深入分析 Widevine L3 DRM 机制。

Read more →


What are you doing this weekend?

社区周末计划交流贴。

Read more →


No LLM code in dependencies

关于在依赖项中拒绝 LLM 生成代码的讨论。

Read more →


DEV Community

Your Coding Agent Is a New Attack Surface and Most Devs Aren’t Ready for It

你的编码代理是一个新的攻击面,大多数开发者还没准备好

开发者分享了编码代理在自动化任务中遭遇提示词注入攻击的经历,提醒同行在赋予 AI 代理自主权时必须警惕潜在的安全风险。

Read more →


AI coding agents don’t have a workspace. Here’s what that costs you.

AI 编码代理没有工作空间,这让你付出了什么代价?

频繁切换 AI 模型会导致上下文丢失和规则重置。本文探讨了缺乏统一工作空间对开发者效率造成的隐形成本。

Read more →


Share Memory by Communicating: When a Channel Beats a Mutex in Go

通过通信共享内存:Go 语言中 Channel 何时优于 Mutex

本文深入探讨了 Go 语言并发编程中的经典原则,分析了在何种场景下使用 Channel 进行通信比使用 Mutex 锁更具优势。

Read more →


How to spot a honeypot token before you buy (and automate the whole checklist)

如何在购买前识别“蜜罐”代币(并自动化整个检查清单)

针对加密货币市场中的“蜜罐”诈骗,本文提供了一套链上检查清单,帮助投资者在入场前识别无法卖出的陷阱代币。

Read more →


Raspberry Pi Cyberdeck Turns a Teensy Into a Pocket Music Studio

Raspberry Pi Cyberdeck 将 Teensy 变成口袋音乐工作室

Maker 分享了一个基于 Raspberry Pi 的 Cyberdeck 项目,将便携式音乐工作室集成到手持设备中,适合动手能力强的爱好者尝试。

Read more →


Catching Goroutine Leaks in Go Tests With goleak

使用 goleak 在 Go 测试中捕获 Goroutine 泄漏

针对 Go 服务中常见的 Goroutine 泄漏问题,本文介绍了如何利用 goleak 工具在测试阶段及时发现并修复这些隐患。

Read more →


Building a Lightweight PWA Meeting App with Vanilla JavaScript and WebRTC

使用原生 JavaScript 和 WebRTC 构建轻量级 PWA 会议应用

作者分享了构建轻量级会议应用的经验,强调了使用原生 JavaScript 理解 WebRTC 底层实现的重要性,而非依赖框架。

Read more →


Sparse Federated Representation Learning for bio-inspired soft robotics maintenance under real-time policy constraints

实时策略约束下仿生软体机器人维护的稀疏联邦表示学习

本文探讨了联邦学习在软体机器人维护中的应用,展示了如何通过稀疏表示学习在实时约束下实现高效的机器人维护。

Read more →


singleflight in Go: Collapsing Duplicate Work Under Load

Go 语言中的 singleflight:在高负载下合并重复工作

针对缓存失效导致的“缓存击穿”问题,本文介绍了 Go 语言中的 singleflight 机制,如何有效合并并发请求以减轻后端压力。

Read more →


The Laws of Diminishing Returns in AI: When Bigger Is No Longer Better

AI 的边际收益递减定律:当“更大”不再意味着“更好”

随着 AI 模型参数规模的扩大,性能提升正面临边际收益递减。本文分析了从盲目堆砌算力向领域特定高效模型转型的行业趋势。

Read more →


Meta Engineering

Meta’s AI Storage Blueprint at Scale

Meta 大规模 AI 存储蓝图

随着模型和数据集的指数级增长,Meta 分享了其在大规模 AI 存储架构方面的经验,强调了可靠且快速的存储访问对于提升 AI 创新速度和降低计算成本的重要性。

Read more →


10 Years of Meta’s Commitment to Python

Meta 对 Python 的十年承诺

今年是 Meta 连续第 10 年赞助 Python 软件基金会(PSF)。Python 已成为 Meta 工程栈的核心语言,公司持续致力于支持开源社区的发展。

Read more →


Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study

AI 原生时代的隐私感知基础设施:资产分类案例研究

隐私控制需要对数据有深刻理解。本文通过“年龄”字段的分类案例,探讨了 Meta 如何在 AI 原生时代构建隐私感知的基础设施。

Read more →


How Meta Engineered Ultra-Narrow Batteries for AI Glasses

Meta 如何为 AI 眼镜设计超窄电池

为了在 Ray-Ban Meta 等智能眼镜的镜腿中集成电池,Meta 进行了深度的工程创新,确保在有限空间内提供足够的能源支持。

Read more →


Adopting AV1 for Real-Time Communication (RTC) at Scale

大规模采用 AV1 进行实时通信(RTC)

Meta 分享了其在大规模实时通信中部署 AV1 编码器的技术挑战与解决方案,包括编解码器选择、设备兼容性及错误恢复机制。

Read more →


Lights Out, Systems On: Validating Instant Power Loss Readiness

停电不停机:验证瞬时断电准备状态

Meta 引入了“瞬时断电风暴”测试范式,旨在验证数据中心在零通知断电情况下的系统容错能力和恢复策略。

Read more →


SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems

SilverTorch:索引即模型——推荐系统的新检索范式

Meta 介绍了 SilverTorch,这是一种统一了用户生成内容检索组件的新架构,在吞吐量和计算效率上均显著优于现有方案。

Read more →


Reel Friends: Building Social Discovery that Scales to Billions

Reel Friends:构建可扩展至数十亿用户的社交发现功能

本文探讨了 Facebook “Friend Bubbles”功能的工程实现,展示了看似简单的社交功能背后深度的工程优化工作。

Read more →


Migrating Data Ingestion Systems at Meta Scale

Meta 大规模数据摄取系统的迁移

Meta 对其数据摄取系统进行了重大重构,以提升其在社交图谱快照处理中的可靠性,并分享了迁移过程中的策略与解决方案。

Read more →


DeepMind Blog

Google DeepMind and A24 announce first-of-its-kind research partnership

Google DeepMind 与 A24 宣布达成首个同类研究合作伙伴关系

Read more →


Start building with Nano Banana 2 Lite and Gemini Omni Flash

开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行开发

Read more →


Introducing computer use in Gemini 3.5 Flash

介绍 Gemini 3.5 Flash 中的计算机使用功能

Read more →


Unlocking UK house-building with AI-accelerated planning

利用 AI 加速规划,解锁英国住房建设

Read more →


Securing the future of AI agents

保障 AI 代理的未来安全

Read more →


DiffusionGemma: 4x faster text generation

DiffusionGemma:文本生成速度提升 4 倍

Read more →


Investing in multi-agent AI safety research

投资多代理 AI 安全研究

Read more →


Fluid, natural voice translation with Gemini

生成二维码中...

请点击右上角 ···

选择 发送给朋友收藏