2026-07-03
今日要点
- AI 代理与基础设施演进:OpenAI 与 Broadcom 合作推出 Jalapeño 推理芯片,Anthropic 发布 Claude Science 工作台,Meta 持续深耕 AI 存储架构,AI 代理(Agent)正从简单的聊天机器人向具备自主执行能力的生产力工具转型。
- 行业监管与合规压力:OpenAI 提议向美国主权财富基金捐赠 5% 股权;FTC 对 Hopper 处以 3500 万美元罚款;欧盟对 Google 的反垄断罚款诉讼败诉,需支付 47 亿美元。
- 自动驾驶与安全争议:Tesla 发生致命车祸,驾驶员面临过失杀人指控;Wisk Aero 被指控因安全担忧解雇员工;FAA 拟允许“安静”超音速客机飞越美国城市。
- 开发者生态变革:AI 编码工具竞争加剧,Claude Code 成本引发开发者不满,开源替代方案(如 Goose、NousCoder-14B)迅速崛起,AI 辅助编程正成为主流。
TechCrunch
Thiel Capital’s Jack Selby nabs stakes in hot startups like Etched through Arizona connections
Jack Selby 通过亚利桑那州的人脉关系入股 Etched 等热门初创公司
Jack Selby 旗下的风险投资公司 Copper Sky Capital 目前正在筹集其第二支基金,目标规模为 3 亿美元。Selby 利用其在亚利桑那州的深厚人脉,成功在 Etched 等备受瞩目的 AI 初创公司中获得了股份。
IQM, Europe’s first public quantum company, admits the future of the tech is uncertain
欧洲首家上市量子计算公司 IQM 承认该技术未来存在不确定性
总部位于芬兰的全栈量子计算公司 IQM 今日在纳斯达克上市,估值约为 19 亿美元。尽管成功上市,但该公司在招股书中坦诚地表示,量子计算技术的未来发展路径和商业化前景仍面临高度不确定性。
Jersey Mike’s IPO illustrates how bad the AI hype has become
Jersey Mike 的 IPO 凸显了 AI 炒作的荒谬程度
在查看三明治连锁店 Jersey Mike 的 IPO 文件时,作者发现即便是这样一家传统的餐饮企业,也在文件中强行提及了 AI。这反映出当前资本市场对 AI 概念的追捧已经到了无孔不入、甚至有些荒谬的地步。
A warning sign about AI’s real cost, courtesy of Google and Amazon
Google 和 Amazon 的案例揭示了 AI 的真实成本代价
AI 的高速发展给科技巨头带来了沉重的环境负担。Google 和 Amazon 等公司发现,为了支撑庞大的 AI 计算需求,它们在实现“净零排放”承诺方面遇到了前所未有的困难,AI 的能源消耗已成为企业可持续发展目标的主要障碍。
Meta quietly launches vibe-coded gaming app Pocket
Meta 低调推出“氛围感”游戏应用 Pocket
Meta 近期悄然发布了一款名为 Pocket 的实验性 AI 应用。该应用允许用户通过简单的文本提示生成并分享互动式迷你游戏,旨在通过 AI 降低游戏创作门槛,打造一种全新的社交游戏体验。
Travel app Hopper to pay $35M in FTC settlement over ‘unfairly’ charging hidden fees
旅行应用 Hopper 因隐藏费用问题与 FTC 达成 3500 万美元和解
Hopper 同意支付 3500 万美元,以了结美国联邦贸易委员会(FTC)对其提出的指控。FTC 指控该公司利用“黑暗模式”欺骗手段隐藏费用,并误导消费者关于其服务成本和收益的信息。
Anthropic is discussing a new custom chip with Samsung
Anthropic 正与三星商讨定制 AI 芯片事宜
继 OpenAI 宣布与博通(Broadcom)合作开发定制 AI 芯片后,Anthropic 也被曝出正在与三星探讨合作开发定制芯片,旨在提升其 AI 模型的推理效率和算力自主权。
Boeing-owned Wisk Aero accused of firing manager who raised safety concerns
波音旗下 Wisk Aero 被指控解雇提出安全担忧的经理
一名 Wisk Aero 的前软件经理指控该公司为了赶进度,在 2025 年的关键飞行测试前仓促进行了软件测试,并因其提出安全质疑而将其解雇。
Melinda Gates’ venture firm backs Magnify Ventures’ $46.6M Fund II
梅琳达·盖茨的风投公司支持 Magnify Ventures 的 4660 万美元二期基金
早期投资机构 Magnify Ventures 成功募集了 4660 万美元的二期基金,其有限合伙人(LP)包括梅琳达·弗伦奇·盖茨旗下的 Pivotal Ventures。
OpenAI proposed donating 5% of its equity to a US sovereign wealth fund
OpenAI 提议向美国主权财富基金捐赠 5% 的股权
据报道,OpenAI 首席执行官萨姆·奥特曼提议将公司 5% 的股权捐赠给美国主权财富基金。此举旨在重启关于让公众分享 AI 繁荣带来的经济收益的讨论。
The Verge
Tesla driver faces manslaughter charges over Texas crash that killed a woman inside her home
特斯拉司机因德州车祸致人死亡面临过失杀人指控
一名特斯拉 Model 3 司机在德克萨斯州发生车祸,撞入民宅导致一名女性死亡。该司机已被逮捕并面临过失杀人指控,他声称事发时正在使用特斯拉的“全自动驾驶”(FSD)系统。
Meta has a new app called Pocket that is absolutely nothing like the old Pocket
Meta 推出的新应用 Pocket 与旧版 Pocket 完全不同
Meta 推出的这款名为 Pocket 的新应用与 Mozilla 此前关闭的同名阅读应用毫无关联。Meta 的 Pocket 专注于 AI 生成互动小工具,体现了扎克伯格将 AI 作为社交媒体核心的战略方向。
The best July 4th sales we found so far
我们发现的目前最值得关注的 7 月 4 日促销活动
尽管 Prime Day 刚刚结束,但 7 月 4 日独立日假期仍有许多零售商(如 Best Buy)在进行促销。本文汇总了目前市面上值得关注的科技产品折扣信息。
Weber marks down grills and griddles to their best prices ever for July 4th
Weber 在 7 月 4 日前将烤架和煎锅降至历史最低价
为了迎接独立日假期,Weber 正在对其旗下的烤架、烟熏炉和煎锅进行大幅降价,这是该品牌今年以来力度最大的促销活动之一。
The video game disc is dead
游戏光盘时代已终结
随着索尼等厂商逐步停止生产物理游戏光盘,游戏行业正式进入了全面数字化的时代。这标志着玩家积累实体收藏的传统模式已成为历史。
Influencer screenings aren’t going away
影响者试映会并不会消失
尽管此前有传言称环球影业将取消克里斯托弗·诺兰新片《奥德赛》的影响者提前试映,但事实证明,影响者依然与传统影评人一同参加了试映活动。
Godox’s feature-packed key light is down to its best price yet
神牛(Godox)功能丰富的补光灯降至历史最低价
神牛 ES45 桌面 LED 补光灯目前在亚马逊和 B&H Photo 售价降至 119 美元,比原价优惠 20 美元,是 Elgato Key Light 的高性价比替代方案。
Tesla’s Q2 sales jump 25 percent
特斯拉第二季度销量增长 25%
特斯拉发布的第二季度生产和交付报告显示,公司正在从 2025 年的低迷中复苏。本季度共生产了 451,758 辆汽车,显示出强劲的增长势头。
AI won’t save advertising, says Digitas’ Amy Lanzi
Digitas CEO Amy Lanzi:AI 无法拯救广告业
在戛纳国际创意节上,Digitas 北美区 CEO Amy Lanzi 表达了对 AI 在广告业应用的清醒认识,认为 AI 并非万能药,不能简单地解决行业面临的所有挑战。
Mystery box shows are complicated for everyone — even the actors
“悬疑盒”类剧集对所有人来说都很复杂,包括演员
Apple TV+ 科幻惊悚剧《羊毛战记》(Silo)的制片人 Graham Yost 分享了制作过程中的挑战,指出这类充满悬疑和复杂设定的剧集,即便是主创团队和演员也经常会感到困惑。
Ars Technica
Newly discovered PamStealer isn’t your typical macOS malware
新发现的 PamStealer 并非典型的 macOS 恶意软件
研究人员发现了一种名为 PamStealer 的新型 macOS 恶意软件,其行为模式与以往的窃密软件不同,凸显了针对 Mac 平台的恶意攻击正在变得日益复杂。
FAA proposal: Supersonic airliners can fly over US cities if they’re quiet
FAA 提案:若足够安静,超音速客机可飞越美国城市
美国联邦航空管理局(FAA)提出新规,如果超音速客机能够有效消除音爆,将允许其在飞越美国城市上空时进行商业飞行。
Ars Live recap: When are the big rockets NASA desperately needs going to be ready?
Ars Live 回顾:NASA 急需的大型火箭何时才能准备就绪?
在 Ars Live 活动中,专家讨论了 NASA 依赖的新一代火箭的研发进度,指出目前几乎没有项目能按原定日期交付。
Plex debuts 5-year membership pass for $250
Plex 推出 250 美元的 5 年期会员通行证
Plex 正在调整其订阅策略,推出 5 年期会员套餐,旨在引导用户转向更频繁的付费模式和使用新功能。
Africa CDC confirms Marburg case in Uganda as Ebola outbreak rages
非洲疾控中心确认乌干达出现马尔堡病毒病例,埃博拉疫情仍在蔓延
在埃博拉疫情持续的同时,非洲疾控中心确认乌干达出现了马尔堡病毒病例,目前认为传播范围尚属局部。
Artificial cell manages a few rounds of cell division
人造细胞成功完成几轮细胞分裂
科学家在实验室中创造出的人造细胞,通过添加额外材料,成功实现了几轮细胞分裂,这是合成生物学领域的一项重要进展。
Google loses long-running appeal of record EU fine, will have to cough up $4.7 billion
Google 在欧盟反垄断罚款上诉中败诉,需支付 47 亿美元
Google 因在 Android 系统中捆绑搜索和浏览器而遭到的欧盟反垄断罚款上诉失败,最终需支付 47 亿美元的巨额罚款。
Trump gets OpenAI to offer US 5% stake, far lower than Sanders’ target
特朗普促使 OpenAI 向美国提供 5% 股权,远低于桑德斯的目标
据内部人士透露,萨姆·奥特曼正在与特朗普政府进行积极谈判,提议向美国政府提供 5% 的股权,这一比例远低于桑德斯此前要求的水平。
Musk’s X poses “serious risk to Americans’ privacy,” advocates warn FTC
倡导者警告 FTC:马斯克的 X 对美国人隐私构成“严重风险”
隐私倡导者敦促 FTC 拒绝马斯克关于结束对 X 平台监管的请求,理由是该平台在 AI 发展背景下对用户隐私构成了严重威胁。
Tesla sales increase by 25% in Q2 2026
特斯拉 2026 年第二季度销量增长 25%
特斯拉第二季度交付量超过了生产量,表明公司已成功清理了部分库存,市场需求呈现回暖态势。
Product Hunt
Context.dev
一个用于抓取、丰富和提取互联网数据的 API。
Fypro
将你的 TikTok 粉丝转化为付费客户的工具。
PixFit
瞬间将一个创意素材转换为所有广告格式。
Solaris
企业的 AI 采用与技能提升平台。
Needle
Slack 和 Teams 中的主动式 GTM(上市策略)代理。
Basedash Actions
一个可以为你执行操作的商业智能(BI)工具。
PieterPost MCP
将你的 AI 代理连接到邮政系统。
Quick Sub 2: Video Subtitling
具有直接画布控制功能的快速、创意视频字幕工具。
Gaming Chat SDK by CometChat
将聊天功能无缝集成到 Unreal 引擎中。
html.contact
一个可以在付费前进行测试的完整表单后端。
MIT Technology Review
Achieving operational excellence with AI
利用 AI 实现卓越运营
文章探讨了精益六西格玛和业务流程管理(BPM)等框架如何与 AI 结合,为复杂的企业运营带来结构化和可重复的优化路径。
Teaching AI to run with the turbines
教 AI 运行涡轮机
AI 不仅仅局限于聊天机器人,其在工业基础设施中的应用正成为核心运营层,负责保障物理系统的连续性和安全性。
The Download: a startup has a solution for AI’s groupthink problem
每日下载:一家初创公司解决了 AI 的“群体思维”问题
LLM 往往陷入“群体思维”的怪圈,给出高度相似的回答。一家初创公司正在尝试通过技术手段打破这种局限。
Why California’s carbon manure math doesn’t add up
为什么加州的碳粪便数学算不通?
加州的一项气候政策鼓励奶农将牛粪产生的甲烷转化为天然气,但这种做法在环境效益计算上存在争议,被指责为“伪环保”。
LLMs are stuck in a groupthink groove. This startup is trying to get them out.
LLM 陷入了群体思维的怪圈,一家初创公司正试图打破它
通过简单的测试(如要求 AI 生成随机数),可以发现 LLM 存在明显的模式化倾向。研究人员正在开发新方法来增加 AI 输出的多样性。
The Download: Anthropic launches Claude Science, and California’s carbon manure math
每日下载:Anthropic 发布 Claude Science,以及加州的碳粪便数学
本期简报重点介绍了 Anthropic 的 Claude Science 产品,以及对加州碳排放政策的深度分析。
Claude Science is Anthropic’s newest flagship product
Claude Science 是 Anthropic 的最新旗舰产品
Claude Science 是一款专为科研人员设计的 AI 工作台,能够自主执行科学研究任务,并提供可审计的实验结果。
Roundtables: Longevity’s Next Frontier: “Reprogramming” Your Body
圆桌会议:长寿的下一个前沿——“重编程”你的身体
探讨了逆转衰老、将细胞恢复到年轻状态的实验性疗法及其面临的科学与伦理挑战。
The Download: AI “coworkers” and stratospheric internet
每日下载:AI“同事”与平流层互联网
探讨了 AI 代理作为“同事”进入职场的影响,以及平流层互联网技术的最新进展。
Agriculture is ready for AI, but its data isn’t
农业已准备好拥抱 AI,但数据尚未就绪
尽管 AI 在农业预测模型中潜力巨大,但行业领导者应警惕在数据基础尚未打牢的情况下盲目投资。
GitHub Trending
usestrix / strix
开源 AI 渗透测试工具,用于发现和修复应用程序漏洞。
JuliusBrussee / caveman
Claude Code 技能插件,通过模拟“穴居人”说话方式,减少 65% 的 Token 消耗。
msitarzewski / agency-agents
一套完整的 AI 代理机构工具,涵盖从前端开发到社区运营的各类专家代理。
hasaneyldrm / exercises-dataset
包含 433 种健身练习的综合数据集,含分类、目标肌肉、设备及动画视频。
santifer / career-ops
基于 Claude Code 构建的 AI 求职系统,支持 14 种技能模式和 PDF 生成。
obra / superpowers
一套行之有效的代理技能框架与软件开发方法论。
ChromeDevTools / chrome-devtools-mcp
为 AI 编码代理提供的 Chrome 开发者工具。
browser-use / video-use
使用编码代理进行视频编辑的工具。
actions / checkout
用于检出代码仓库的 GitHub Action。
affaan-m / ECC
代理性能优化系统,为 Claude Code、Cursor 等提供技能、记忆和安全支持。
OpenAI Blog
How ChatGPT adoption has expanded
ChatGPT 的采用率如何扩展
OpenAI Signals 数据显示,ChatGPT 的全球采用率正在增长,用户不仅增加了使用频率,还在探索更多功能,推动了跨地区和跨语言的增长。
Inside Genebench-Pro
深入了解 Genebench-Pro
介绍 Genebench-Pro 在基因组学和生物学研究中的应用案例。
Introducing GeneBench-Pro
推出 GeneBench-Pro
这是一个新的基准测试工具,旨在利用复杂的真实世界数据集测试 AI 在基因组学、生物学和科学研究中的性能。
Core dump epidemiology: fixing an 18-year-old bug
核心转储流行病学:修复一个 18 年前的 Bug
OpenAI 工程师利用大规模核心转储分析,成功定位并修复了一个长期存在的软件 Bug 和硬件故障。
Mapping Europe’s AI Workforce Opportunity
绘制欧洲 AI 劳动力机遇图谱
一份新报告分析了 AI 如何重塑欧盟就业市场,重点关注哪些职业将面临自动化、增长或工作流变化。
HP Inc. launches Frontier strategic partnership with OpenAI
惠普与 OpenAI 启动 Frontier 战略合作伙伴关系
惠普将扩大与 OpenAI 的合作,在客户体验、软件开发和企业运营中全面部署 AI。
Previewing GPT-5.6 Sol: a next-generation model
预览下一代模型 GPT-5.6 Sol
OpenAI 预览了 GPT-5.6 Sol,该模型在编码、科学和网络安全方面具有更强的能力,并配备了最先进的安全堆栈。
How agents are transforming work
AI 代理如何改变工作方式
一份新研究论文展示了 AI 代理如何通过处理更长、更复杂的任务来提升各行各业的生产力。
OpenAI and Broadcom unveil LLM-optimized inference chip
OpenAI 与博通联合推出 LLM 优化推理芯片
双方推出了名为“Jalapeño”的定制 AI 芯片,专为 LLM 推理设计,旨在提升 AI 系统的性能、效率和扩展性。
Helping build shared standards for advanced AI
助力构建先进 AI 的共享标准
OpenAI 通过 Appia 基金会支持评估框架和安全实践,致力于推动全球 AI 合作与标准制定。
Anthropic Blog
Redeploying Fable 5
重新部署 Fable 5
Fable 5 已于 7 月 1 日全球上线。Anthropic 同时提议与亚马逊、微软、Google 等合作伙伴共同建立行业范围的越狱严重性评分框架。
Introducing Claude Sonnet 5
推出 Claude Sonnet 5
Sonnet 5 在编码、代理任务和专业工作领域提供了前沿的性能表现。
Claude Science, an AI workbench for scientists, is now available
Claude Science:面向科学家的 AI 工作台现已发布
Claude Science 是一款可定制的应用,集成了研究人员常用的工具和包,能够生成可审计的工件并提供灵活的计算资源访问。
Introducing Claude Tag
推出 Claude Tag
Claude Tag 是团队协作使用 Claude 的一种新方式。
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
Anthropic 在首尔开设办事处,并宣布与韩国 AI 生态系统建立新合作伙伴关系
Anthropic 进一步拓展亚洲市场,在首尔设立办事处并与当地企业达成合作。
Statement on the US government directive to suspend access to Fable 5 and Mythos 5
关于美国政府暂停 Fable 5 和 Mythos 5 访问指令的声明
Anthropic 对政府暂停其部分模型访问的指令做出了回应。
Results from the first Anthropic Public Record
首份 Anthropic 公共记录结果
公布了公司在透明度和模型评估方面的首份公开记录。
TCS and Anthropic partner to bring Claude to regulated industries
TCS 与 Anthropic 合作,将 Claude 引入受监管行业
双方合作旨在为银行、航空等受监管行业提供 AI 解决方案。
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
DXC 将把 Claude 集成到银行、航空等受监管行业依赖的系统中
DXC 科技将 Claude 深度集成到关键行业的基础设施中。
Introducing Claude Corps
推出 Claude Corps
Anthropic 推出了面向企业级应用的 Claude Corps 解决方案。
Google AI Blog
The latest AI news we announced in June 2026
Google 2026 年 6 月发布的最新 AI 新闻汇总
回顾了 Google 在 6 月份发布的所有 AI 更新。
New York City educators and industry leaders gathered at Google’s offices to shape the future of AI in classrooms.
纽约教育工作者与行业领袖齐聚 Google 办公室,共商 AI 课堂未来
Google 与纽约就业 CEO 委员会及 Urban Assembly 举办了 AI 峰会,探讨 AI 在教育领域的应用。
Unlocking Britain’s next era of productivity: Building a nation of AI trailblazers
开启英国生产力新时代:打造 AI 先锋国家
Google 英国发布了最新的经济影响报告,探讨如何通过 AI 技术提升国家生产力。
Ask an AI expert: What exactly is the full stack?
咨询 AI 专家:什么是全栈?
Google 专家解释了 AI 领域“全栈”方法的含义及其重要性。
Our latest Google Finance upgrades, including a new app
Google Finance 最新升级,包括一款新应用
Google Finance 结束测试阶段,并正式推出 Android 应用。
New research shows how AMIE, our medical AI, could help manage health conditions.
新研究显示 Google 医疗 AI AMIE 如何辅助健康管理
研究表明,AMIE 在复杂疾病管理方面表现与初级保健医生相当。
We’re strengthening our presence in Alabama through new investments and community support.
Google 通过新投资和社区支持加强在阿拉巴马州的布局
Google 宣布投资 15 亿美元扩建阿拉巴马州的数据中心。
Our new community investments in Virginia support local jobs and expand energy affordability.
Google 在弗吉尼亚州的新社区投资支持当地就业并提升能源可负担性
Google 致力于通过能源项目和劳动力培训支持弗吉尼亚州的发展。
The latest AI news we announced in May 2026
Google 2026 年 5 月发布的最新 AI 新闻汇总
回顾了 Google 在 5 月份发布的所有 AI 更新。
5 ways Google Search can level up your thrift and vintage shopping
Google 搜索提升二手和复古购物体验的 5 种方法
利用 AI 工具,用户可以更轻松地在 Google 搜索和购物中发现二手好物。
Hugging Face Blog
Hugging Face and Cerebras bring Gemma 4 to real-time voice AI
Hugging Face 与 Cerebras 合作,将 Gemma 4 模型引入实时语音 AI 应用。
ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration
用于基准测试企业级 Java 框架迁移 AI 代理的 ScarfBench 工具。
Why Specialization Is Inevitable
探讨为何 AI 模型的专业化是必然趋势。
Featuring Every Eval Ever Results on Hugging Face Model Pages
在 Hugging Face 模型页面展示所有评估结果。
DiScoFormer: One transformer for density and score, across distributions
DiScoFormer:一种跨分布的密度与评分 Transformer 模型。
Run a vLLM Server on HF Jobs in One Command
通过单条命令在 Hugging Face Jobs 上运行 vLLM 服务器。
Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel
利用 NVIDIA NeMo AutoModel 加速 Transformer 微调。
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World
推出 FFASR 排行榜:基准测试真实场景下的自动语音识别(ASR)。
Shipping huggingface_hub every week with AI, open tools, and a human in the loop
利用 AI、开源工具和人工参与,每周发布 huggingface_hub。
Experimenting with the proposed Cross-Origin Storage API in Transformers.js
在 Transformers.js 中试验跨源存储 API。
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
探讨理性人与理性 AI 的目标设定,主张 AI 应通过实践而非固定目标来对齐。
AGI Is Not Multimodal
批评将语言作为思维模型的局限性,强调具身智能在 AGI 中的重要性。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
分析了机器学习研究中从数学驱动向工程驱动的范式转移。
What’s Missing From LLM Chatbots: A Sense of Purpose
指出当前 LLM 聊天机器人虽然基准测试分数高,但缺乏真正的“目的感”。
We Need Positive Visions for AI Grounded in Wellbeing
呼吁建立以人类福祉为基础的 AI 积极愿景。
Financial Market Applications of LLMs
探讨 LLM 在金融市场建模和分析中的应用。
A Brief Overview of Gender Bias in AI
简要概述 AI 中的性别偏见问题。
Mamba Explained
解释 Mamba 模型及其作为 Transformer 替代方案的潜力。
Car-GPT: Could LLMs finally make self-driving cars happen?
探讨 LLM 在自动驾驶领域的应用潜力及挑战。
Do text embeddings perfectly encode text?
介绍 ‘Vec2text’ 工具,强调嵌入数据安全协议的必要性。
arXiv CS.AI
Constructive Alignment: Governing Preference Dynamics in Human-AI Interaction
探讨人类偏好在与 AI 交互中的动态构建过程,而非将其视为固定目标。
Bounded Morality: Defining the Space of Moral Computation
提出“有限道德”框架,分析有限代理在道德计算中的需求。
The MMM Data Model — A Normative Specification for Knowledge Interoperability in a Decentralisable Knowledge Commons
提出 MMM 数据模型,旨在实现去中心化知识共享中的互操作性。
Making Failure Safe: A Constrained, Verifiable Agent Framework for Open-Web Data Collection
提出一种受约束、可验证的代理框架,用于更可靠的开放网络数据收集。
Solution space path planning for supporting en-route air traffic control
提出一种用于空中交通管制决策支持的路径规划算法。
RareDxR1: Autonomous Medical Reasoning for Rare Disease Diagnosis Beyond Human Annotation
介绍 RareDxR1 模型,用于罕见病自主医疗推理诊断。
A Contextual-Bandit Oversight Game with Two-Sided Informational Asymmetry
研究在双向信息不对称情况下的 AI 代理运行时人类监督博弈。
Constructing Epistemic AI Literacy: Detecting Epistemic Aims and Processes in Student-AI Co-Programming
探讨学生在与 AI 协作编程过程中的认知思维与 AI 素养构建。
arXiv CS.CL
Persona Without Substrate: Regime-Dependence and the LLM Individuation Problem
探讨 LLM 个性化问题中的跨机制共指假设。
Controllable Narrative Rendering for Enhanced Assisted Writing
提出可控叙事渲染技术,以改善 AI 在创意写作中的表现。
Harnessing the Latent Space: From Steering Vectors to Model Calibrators for Control and Trust
探讨如何利用潜在空间进行模型控制与信任增强。
Benchmarking Frontier LLMs on Arabic Cultural and Sociolinguistic Knowledge: A Cross-Evaluation Framework with Human SME Ground Truth
建立阿拉伯文化与社会语言学知识的 LLM 基准测试框架。
Hate Speech Detection in Turkish and Arabic Languages: A Comprehensive Study
针对土耳其语和阿拉伯语的仇恨言论检测综合研究。
Readable but Not Controllable: Neuron-Level Evidence for Medical LLM Hallucination
提供医疗 LLM 幻觉的神经元级证据,探讨其可控性。
Identifying and Resolving Pitfalls of Knowledge-Based VQA Benchmarks: Auditing, Repairing, and Augmenting
审计并修复知识库视觉问答(KB-VQA)基准测试中的缺陷。
ALEE: Any-Language Evaluation of Embeddings via English-Centric Minimal Pairs
提出 ALEE 基准,用于跨语言文本嵌入评估。
WIRED
How Big Is ‘Love Island USA’? More Than 10 Million People Are Already on Its App
《美国爱之岛》有多火?已有超过 1000 万人使用其应用
该节目的执行制片人表示,其应用上的投票人数甚至超过了许多地方选举的投票人数。
Spotify Confirms Streaming Fraud After Kalshi Trader Cries Foul
Spotify 确认存在流媒体欺诈行为
在交易员提出质疑后,Spotify 确认了平台上的流媒体欺诈问题,并引发了相关金融市场的动荡。
Can Cursor Remain a Platform for OpenAI and Anthropic’s Models Inside SpaceX?
Cursor 被 SpaceX 收购后,还能继续作为 OpenAI 和 Anthropic 模型的平台吗?
Cursor 希望在被 SpaceX 收购后继续提供第三方 AI 模型,这考验着其与各大前沿 AI 实验室的关系。
The DEA Plans to Ban Opioid-Like Kratom Compound 7-OH
DEA 计划禁止类阿片卡痛化合物 7-OH
美国缉毒局(DEA)计划暂时将这种被称为“加油站海洛因”的物质列为受控物质。
7 Lesser-Known Google Account Settings You Should Change
7 个你应该更改的鲜为人知的 Google 账户设置
文章建议用户调整账户恢复、广告个性化及个人资料公开范围等设置,以保护隐私。
8 Best Travel Adapters (2026): My Top Recommendations
2026 年 8 款最佳旅行适配器推荐
为出国旅行者推荐了充电效率高且兼容性好的旅行适配器。
Bublue BuVortex V5 Pool Skimmer Review: An Impractical Cleaner
Bublue BuVortex V5 泳池撇渣器评测:一个不切实际的清洁工具
尽管其涡流设计引人注目,但该产品在实际使用中表现并不实用。
How Trump Helped China Make America’s Cheapest EV
特朗普如何帮助中国制造了美国最便宜的电动汽车
由于取消了要求材料本土化的电动汽车税收抵免,Slate 等汽车制造商转向了中国制造的低成本电池。
I Tried Rips, the Card-Pack App Where Users Spend Thousands Chasing Pricey Pokémon
我试用了 Rips:一款让用户花费数千美元追逐昂贵宝可梦卡牌的应用
作者体验了这款应用,认为这种高额消费的抽卡模式感觉像是未来的赌博。
Inside the Luddite Festival Harnessing Gen Z’s Rage Against Big Tech
走进利用 Z 世代对大科技公司愤怒的卢德主义节
纽约市举办的“卢德之夏”活动,旨在教导人们如何在科技巨头的包围下过上离线生活。
Lobsters
jj v0.43.0 released
jj 版本 0.43.0 发布。
Wordgard Release 0.1
Wordgard 0.1 版本发布。
.gitignore Isn’t the Only Way To Ignore Files in Git
.gitignore 并不是 Git 中忽略文件的唯一方式。
Artificial adventures
关于人工智能冒险的讨论。
Tools or techniques for conveying mental models?
探讨传达和构建心理模型的工具与技术。
Since Linux 6.9 (May 2024), the LUKS encryption key remained resident in memory across suspend
自 Linux 6.9 起,LUKS 加密密钥在挂起期间会残留在内存中。
US Supreme Court just blew up EU-US Data Transfers
美国最高法院刚刚破坏了欧盟与美国之间的数据传输协议。
No LLM code in dependencies
关于在依赖项中禁止使用 LLM 生成代码的讨论。
kernel asynchronous reads in PostgreSQL 19 (io_uring)
PostgreSQL 19 中的内核异步读取(io_uring)功能。
The modern app
关于现代应用程序架构的讨论。
DEV Community
The Symfony Scheduler Component: Cron in Your App, Not Your Crontab
介绍 Symfony Scheduler 组件,实现应用内定时任务管理。
Congrats to the GitHub Finish-Up-A-Thon Challenge Winners!
祝贺 GitHub Finish-Up-A-Thon 挑战赛的获胜者。
I built a production risk scanner in one day, here’s what it caught
作者开发了一个生产环境风险扫描工具,并分享了其发现的问题。
You Are Wasting Too Many Tokens on Claude
指出开发者在使用 Claude 时存在浪费 Token 的行为,并建议优化交互方式。
Claude Fable 5 Feels Different. But Should Developers Trust It?
探讨 Claude Fable 5 的表现及其在开发中的可信度。
“I built an AI agent that pays its own bills — and you can fork it for $0”
作者构建了一个能够自主赚取收入的 AI 代理,并开源了代码。
I Built a Free Open-Source SEO Checker Tool (Works with WordPress, Showit, Wix and More)
作者开发了一个免费开源的 SEO 检查工具,支持多种平台。
Advanced C# Generics: Contravariance, Custom Comparers and Real Abstractions
深入探讨 C# 泛型中的逆变、自定义比较器和抽象。
Ng-News 26/16: OpenNG Foundation, spartan/ui
Angular 社区新闻:OpenNG 基金会成立及 spartan/ui 1.0 发布。
Auto Sound Recorder AI 的 5 个隐藏用法 🔥
介绍 Auto Sound Recorder AI 的 5 个高级技巧,包括静默检测激活录音等。
Meta Engineering
Meta’s AI Storage Blueprint at Scale
Meta 大规模 AI 存储蓝图
随着模型和数据集的指数级增长,Meta 分享了其在 AI 存储架构方面的技术蓝图,以降低计算成本并提升训练速度。
10 Years of Meta’s Commitment to Python
Meta 对 Python 的 10 年承诺
Meta 庆祝其连续 10 年赞助 Python 软件基金会(PSF),强调了 Python 在其工程栈中的核心地位。
Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study
AI 原生时代的隐私感知基础设施:资产分类案例研究
探讨了在 AI 时代如何通过资产分类实现有效的隐私控制和数据治理。
How Meta Engineered Ultra-Narrow Batteries for AI Glasses
Meta 如何为 AI 眼镜设计超窄电池
介绍了 Meta 如何在智能眼镜的镜腿中集成高能量密度的超窄电池,以支持 AI 工作负载。
Adopting AV1 for Real-Time Communication (RTC) at Scale
在大规模实时通信中采用 AV1 编码
分享了 Meta 在部署 AV1 编码以提升实时通信质量方面的技术挑战与解决方案。
Lights Out, Systems On: Validating Instant Power Loss Readiness
验证瞬时断电准备情况
介绍了 Meta 数据中心应对瞬时断电的测试范式及防御策略。
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems
SilverTorch:索引即模型——推荐系统的新检索范式
介绍了一种统一的推荐系统架构,显著提升了吞吐量和计算效率。
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends:构建可扩展至数十亿用户的社交发现功能
探讨了 Facebook 社交发现功能背后的工程挑战。
Migrating Data Ingestion Systems at Meta Scale
Meta 大规模数据摄取系统的迁移
分享了 Meta 在重构和迁移其数据摄取系统以提升可靠性方面的经验。
DeepMind Blog
Start building with Nano Banana 2 Lite and Gemini Omni Flash
开始使用 Nano Banana 2 Lite 和 Gemini Omni Flash 进行开发。
Introducing computer use in Gemini 3.5 Flash
在 Gemini 3.5 Flash 中引入计算机使用能力。
Unlocking UK house-building with AI-accelerated planning
英国政府与 Google DeepMind 合作,利用 AI 加速住房规划决策。
Securing the future of AI agents
通过 AI 控制路线图和实时监控,保障 AI 代理的安全性。
DiffusionGemma: 4x faster text generation
DiffusionGemma:文本生成速度提升 4 倍。
Investing in multi-agent AI safety research
Google DeepMind 宣布投入 1000 万美元资助多代理 AI 安全研究。
Fluid, natural voice translation with Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 实现流畅、自然的实时语音翻译。
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
推出 Gemma 4 12B:一种统一的、无编码器的多模态模型。
Powering the future of robotics in Europe
助力欧洲机器人技术的未来发展。
Measuring the impact of learning with AI in Sierra Leone and beyond
评估 AI 辅助学习在塞拉利昂等地的应用效果。
VentureBeat AI
Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.
Google 25 年来首次重新设计搜索框——其重要性超乎你的想象
Google 正式退休了传统的搜索框范式,标志着搜索交互方式的重大变革。
Railway secures $100 million to challenge AWS with AI-native cloud infrastructure
Railway 融资 1 亿美元,旨在以 AI 原生云基础设施挑战 AWS
Railway 获得 1 亿美元 B 轮融资,旨在解决传统云基础设施在 AI 应用需求下的局限性。
Claude Code costs up to $200 a month. Goose does the same thing for free.
Claude Code 每月费用高达 200 美元,而 Goose 可以免费实现同样功能
Claude Code 的高昂定价引发了开发者的不满,开源替代方案 Goose 迅速获得关注。
Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews
Listen Labs 在病毒式广告招聘后融资 6900 万美元,用于扩展 AI 客户访谈
Listen Labs 通过独特的广告牌招聘策略成功吸引人才并完成融资。
Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI
Salesforce 推出全新 Slackbot AI 代理,在职场 AI 领域对抗微软和 Google
Salesforce 重构了 Slackbot,使其成为具备自主执行能力的 AI 代理。
Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required
Anthropic 发布 Cowork:一款无需编码即可在本地文件工作的 Claude 桌面代理
Cowork 旨在让非技术用户也能利用 AI 代理处理本地文件任务。
Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment
Nous Research 的 NousCoder-14B:一款在 Claude Code 热潮中发布的开源编码模型
NousCoder-14B 在极短时间内训练完成,性能足以媲美大型专有系统。
arXiv CS.LG
Representation as a Bottleneck for Mechanistic Interpretability: The Manifestation Unit Protocol
探讨表征作为机械可解释性瓶颈的问题,并提出 Manifestation Unit 协议。
SNAP-FM: Sparse Nonlinear Accelerated Projection for Physics-Constrained Generative Modeling
提出 SNAP-FM 方法,用于物理约束下的生成建模。
SemiScope: Disentangling Classifier Tuning and Joint Optimization in Semi-Supervised Security Classification
提出 SemiScope,用于解耦半监督安全分类中的分类器调优与联合优化。
A Filtered Mixture-of-Generators for Fully Synthetic Survival Training
提出一种用于全合成生存训练的过滤生成器混合模型。
GRPO, Dr. GRPO, and DAPO Are Three Operations on One Number: The Group-Standard-Deviation Identity
揭示 GRPO、Dr. GRPO 和 DAPO 本质上都是对标准差这一指标的调整。
EVOTS: Evolutionary Transformer Search for Time Series Forecasting
提出 EVOTS,用于时间序列预测的进化 Transformer 架构搜索。
FRAME: Learning the Adaptation Domain with a Mixture of Fractional-Fourier Experts
提出 FRAME,通过分数傅里叶专家混合模型学习适应域。
Verifiable Rewards for Calibrated Probabilistic Forecasting
探讨用于校准概率预测的可验证奖励机制。
arXiv CS.CV
Enhancing Oracle Bone Inscription Recognition via Multi-Scale Layer Attention
利用多尺度层注意力机制增强甲骨文识别能力。
Joint Medical Image Enhancement and Segmentation with Diffusion-based Symbiotic Information Interaction
提出基于扩散模型的共生信息交互方法,实现医学图像增强与分割。
Synergistic Perception-Reasoning Governance: Grounding Medical MLLMs with Verifiable Anatomical Evidence
通过可验证的解剖证据增强医疗多模态大模型的感知与推理能力。
Lost in the Tail: Addressing Geographic Imbalance in Urban Visual Place Recognition
解决城市视觉地点识别中的地理长尾分布不平衡问题。
PixelEyes: Decoupling Perception and Reasoning for Pinpoint Visual Evidence Seeking
提出 PixelEyes,通过解耦感知与推理实现精准的视觉证据搜索。
Segmenting, Fast and Slow: Real-Time Open-Vocabulary Video Instance Segmentation with Dual-Path Processing
提出双路径处理架构,实现实时开放词汇视频实例分割。
Decompose, Compare, and Decide: Multimodal LLMs are Implicit Few-Shot Learners
提出 DeCoDe 技术,使多模态大模型成为强大的少样本分类器。
A Synthetic-Driven Vision System for Assembly Step Recognition
提出一种基于合成数据的视觉系统,用于工业装配步骤识别。
Towards Data Science
Tokenminning: How to Get More from Your Chatbot for Less
探讨如何在不牺牲 AI 效果的前提下,通过优化 Token 使用来降低成本。
Design Loops, Not Prompts
主张在 AI 应用设计中采用循环机制而非单纯依赖提示词。
Time-Series LLMs, Explained with t0-alpha
解释 t0-alpha 模型,这是一种用于概率时间序列预测的解码器式 Patch Transformer。
The Untaught Lessons of RAG Question Parsing: Structure Before You Search
探讨 RAG 系统中问题解析的结构化重要性。
Why Powerful ML Is Deceptively Easy — Part 2
分析机器学习中的数据泄露问题,包括时间、空间和覆盖范围相关的泄露。
Persistent Latent Memory for Multi-Hop LLM Agents: How a 6G Handover Paper Closes the Agent Cold-Start
介绍诱导潜在上下文持久性(ILCP)技术,以解决多代理管道中的上下文丢失问题。
[Read more →](/news/