2026-06-30
今日要点
- AI 代理生态爆发:从 Anthropic 的 Cowork 到 OpenAI 的 Codex 硬件预告,AI 代理正从代码辅助向桌面级自动化深度演进,企业级应用与个人生产力工具同步激增。
- 算力与基础设施竞赛:韩国科技巨头承诺投入 5500 亿美元应对“内存危机”,OpenAI 与博通合作推出 Jalapeño 推理芯片,显示出 AI 硬件自主化已成为行业核心战略。
- 监管与合规压力加剧:美国政府对 Anthropic 的模型出口限制、欧盟对 Google 的反垄断调查,以及针对 AI 销售健康数据的立法提案,标志着 AI 行业正进入严监管周期。
- AI 商业化与伦理博弈:TIDAL 停止对 AI 生成音乐的变现,Meta 被曝利用承包商测试竞争对手 AI 的安全性,AI 平台的版权、隐私与伦理边界成为焦点。
TechCrunch
Chamath Palihapitiya raises $135M Series A for his AI coding startup, takes CEO role
Chamath Palihapitiya 为其 AI 编程初创公司筹集 1.35 亿美元 A 轮融资,并出任 CEO
尽管 AI 编程领域竞争激烈,但投资者对该赛道的热情依然高涨。知名投资人 Chamath Palihapitiya 亲自下场,为其新成立的 AI 编程初创公司筹集了 1.35 亿美元的 A 轮融资,并亲自担任首席执行官,显示出其对 AI 改变软件开发流程的坚定信心。
Gemini’s personalized AI image generation is now free for US users
Gemini 的个性化 AI 图像生成功能现向美国免费用户开放
Google 正在扩大其 AI 能力的覆盖范围,允许美国地区的免费版 Gemini 用户使用个性化图像生成功能。该功能能够根据用户的兴趣偏好以及关联的 Google 应用数据,生成定制化的图像内容,进一步提升了免费用户的交互体验。
Watch out, Amazon: The Kobo eReader now has a Goodreads rival
小心了亚马逊:Kobo 电子阅读器迎来 Goodreads 的竞争对手
Kobo 用户现在可以将其阅读进度自动同步至 StoryGraph。这一举措为用户提供了一个摆脱亚马逊 Goodreads 生态的替代方案,方便用户更轻松地追踪阅读进度、统计数据并参与阅读挑战。
Waymo and Uber quietly part ways in Phoenix
Waymo 与 Uber 在凤凰城低调“分手”
Waymo 与 Uber 在凤凰城的自动驾驶合作关系已悄然结束。Uber 表示已准备好在该市启动另一项独立的自动驾驶合作伙伴计划,但目前尚未透露具体合作方身份。
Anthropic and Gov. Newsom forge deal allowing California government to use Claude at half price
Anthropic 与加州州长纽森达成协议,加州政府可半价使用 Claude
Anthropic 与加州政府建立了更紧密的合作关系,加州政府机构将能以半价使用 Claude 模型。与此同时,Anthropic 与联邦政府的关系却因政策分歧而趋于紧张,显示出这家 OpenAI 的竞争对手在政商关系处理上的复杂性。
South Korean tech giants commit over $550B to ease ‘RAMageddon’
韩国科技巨头承诺投入超 5500 亿美元以缓解“内存危机”
为应对全球 AI 算力需求激增带来的内存短缺(即“RAMageddon”),韩国两大内存芯片巨头承诺将建设更多先进的内存实验室和晶圆厂。此举旨在将韩国打造为全球 AI 技术的核心枢纽。
Arena, the AI leaderboard everyone uses, is now a $100M business
AI 排行榜 Arena 现已成为价值 1 亿美元的商业实体
作为 AI 领域最权威的免费排行榜,Arena 在去年 9 月推出商业化服务后迅速崛起,目前估值已达 1 亿美元。该平台通过提供客观的 AI 模型性能评估,已成为行业内衡量模型实力的标杆。
Cursor now has a mobile app for guiding your coding agent on the go
Cursor 推出移动端应用,支持随时随地管理编程代理
Cursor 发布了一款全新的移动应用程序,旨在让开发者能够远程监控和指导其 AI 编程代理。这一工具的推出进一步提升了开发者在移动场景下处理复杂代码任务的灵活性。
Trump administration threatens 92 GW of new electricity supply with red tape
特朗普政府的监管政策威胁到 92 吉瓦的新增电力供应
特朗普政府的一系列行政举措可能导致美国 1210 亿美元的太阳能和风能项目陷入停滞。作为美国新增电力容量的主要来源,这些清洁能源项目正面临严峻的监管阻力。
TIDAL cracks down on AI music by cutting off monetization
TIDAL 严厉打击 AI 音乐,切断其变现渠道
音乐流媒体平台 TIDAL 宣布将采取行动打击 AI 生成的音乐。除了切断此类内容的变现渠道外,公司还将利用自动化工具识别并移除那些试图冒充真实艺术家或团体的 AI 生成曲目。
The Verge
T-Mobile is booting customers from its oldest plans
T-Mobile 强制老用户迁移套餐
T-Mobile 开始通知用户,将逐步淘汰包括 3G 时代在内的多个老旧套餐,强制用户迁移至当前的资费计划。此举引发了受影响用户的广泛不满,社交媒体上充斥着用户对强制变更的抱怨。
After a great start, DC’s new cinematic universe is already slowing down
DC 新电影宇宙开局良好后已显现放缓迹象
尽管詹姆斯·古恩执导的《超人》中卡拉·佐-艾尔的亮相令人惊喜,但华纳兄弟探索公司快速推进《女超人》独立电影的计划显得有些操之过急。在建立新电影宇宙的过程中,工作室在角色选择和叙事节奏上似乎遇到了挑战。
Leaked iPhone 18 Pro photos reportedly wound up on the dark web
传 iPhone 18 Pro 泄露照片流入暗网
据路透社报道,苹果公司的一家关键供应商发生数据泄露,导致 iPhone 18 Pro 的照片和零件清单被发布在暗网上。泄露图片展示了疑似 iPhone 18 Pro 的跌落测试过程,显示出三摄布局和苹果标志。
Tidal won’t pay royalties on AI-generated music but isn’t banning it outright
Tidal 将不再为 AI 生成音乐支付版税,但并未全面封禁
Tidal 公布了针对 AI 生成音乐的新政策:从 7 月 15 日起,平台将为 100% 由 AI 生成的曲目添加标签,且即日起停止为此类内容支付版税。此举旨在保护艺术家权益,同时保持平台内容的开放性。
Sony’s next-gen PlayStation will go ‘beyond the living room’
索尼下一代 PlayStation 将“走出客厅”
索尼在近期与投资者的问答环节中暗示,下一代 PlayStation 将提供某种能够让玩家在客厅之外体验游戏的功能。外界普遍猜测索尼正在研发一款全新的掌机设备。
OpenAI is teasing new hardware… for Codex
OpenAI 预告 Codex 新硬件
OpenAI 在 X 上发布视频,预告将于 7 月 15 日推出一款与 AI 编程工具 Codex 相关的方形硬件设备。该设备配有多个按钮,旨在升级 Codex 的快捷操作体验,但并非此前传闻中与 Jony Ive 合作的 AI 设备。
At $499, Apple’s M3-powered iPad Air is a good deal
499 美元的 M3 芯片 iPad Air 性价比极高
在苹果近期普遍上调产品价格的背景下,M3 芯片版 iPad Air 的售价降至 499 美元,成为目前市场上极具吸引力的选择。该设备支持 Apple Pencil Pro 及悬停功能,是近期值得入手的数码产品。
The best July 4th sales we found so far
我们发现的最佳 7 月 4 日促销活动
随着美国独立日临近,尽管 Prime Day 促销刚结束,但百思买等零售商仍推出了多项折扣活动。本文汇总了目前市面上值得关注的数码产品优惠信息。
WhatsApp is launching usernames: here’s how to reserve yours
WhatsApp 即将推出用户名功能:如何预留你的 ID
WhatsApp 正在引入用户名功能,旨在让用户无需分享手机号码即可添加联系人并进行交流。该功能预计将于今年晚些时候推出,旨在进一步提升平台的隐私保护水平。
Lawmakers want to ban AI companies from selling your health data
立法者拟禁止 AI 公司出售用户健康数据
美国参议员伊丽莎白·沃伦和众议员玛丽·盖·斯坎伦计划推出《健康与位置数据保护法》的新版本。该法案旨在禁止数据经纪人出售美国人的健康和位置信息,包括用户在 ChatGPT 或 Claude 等 AI 聊天机器人中透露的敏感数据。
Ars Technica
South Korea to spend $1T on more memory chip production and humanoid robots
韩国将投入 1 万亿美元用于内存芯片生产和人形机器人
韩国政府制定了宏伟目标,计划到 2028 年在物理 AI 领域占据领先地位,并实现人形机器人的商业化。为此,韩国将投入 1 万亿美元用于扩大内存芯片产能及机器人技术研发。
US renewable boom passes key milestone in April
美国可再生能源繁荣在 4 月达到关键里程碑
得益于小型太阳能项目的普及,美国可再生能源发电量在 4 月份几乎达到煤炭发电量的三倍,标志着美国电网向清洁能源转型的重大进展。
Supreme Court ruling guts government’s use of geofence warrants
最高法院裁决削弱政府对地理围栏搜查令的使用
美国最高法院近日做出裁决,限制了政府使用地理围栏搜查令的权力。虽然法院未直接宣布此类搜查令违宪,但这一裁决显著削弱了执法部门通过地理位置数据进行大规模监控的能力。
Sony erases digital content from libraries; we’re reminded we don’t own what we buy
索尼从数字库中删除内容,提醒用户我们并不真正拥有所购商品
索尼近期持续缩减其数字商店规模,并删除了用户库中的部分数字内容。这一事件再次引发了关于数字版权的讨论:在数字时代,消费者购买的往往只是使用权而非所有权。
Ozone loss was a thing even before CFCs were widely used
臭氧层损耗在氟利昂广泛使用前就已存在
最新科学研究表明,臭氧层损耗问题在 20 世纪 50 年代就已显现。如果当时拥有今天的科学监测工具,人类本可以更早发现并应对这一环境危机。
Google warns EU’s plans to weaken its monopoly could expose user data
Google 警告欧盟削弱其垄断地位的计划可能导致用户数据泄露
欧盟正计划要求 Google 共享搜索数据并开放 Android 系统上的 AI 权限。Google 对此发出警告,称这些反垄断措施将带来严重的安全隐患,可能导致用户隐私数据暴露。
Quantum computing startup says it will leapfrog everybody
量子计算初创公司声称将实现行业跨越式发展
一家量子计算初创公司宣称其技术将超越现有所有竞争对手。然而,专家指出,要实现这一目标,该公司需要在现有硬件基础上取得巨大的技术突破。
Kalshi sues Illinois over new tax on prediction market sports bets
Kalshi 就预测市场体育博彩新税起诉伊利诺伊州
预测市场平台 Kalshi 对伊利诺伊州提起诉讼,反对该州对预测市场体育博彩征收的新税。伊利诺伊州已成为预测市场博彩合法性与税收政策争论的关键战场。
F1 in Austria: Starts off exciting, then goes the opposite way
奥地利 F1 大奖赛:开局精彩,结局平淡
奥地利 F1 大奖赛在热浪、引擎升级以及未来两个赛季动力水平调整的背景下展开。比赛开局充满悬念,但后续发展未能延续初期的兴奋感。
Wildwood featurette lifts the veil on building its stop-motion world
《野林》幕后特辑揭秘定格动画世界的构建
导演特拉维斯·奈特(曾执导奥斯卡提名作品《久保与二弦琴》)通过幕后特辑,向观众展示了其新作《野林》中精妙的定格动画制作过程。
Product Hunt
Agent Mode by Receiptor AI
Receiptor AI 的代理模式
一款端到端的记账助手,能够自动处理收据工作流,极大简化了财务记录流程。
Sami
Sami
一款自动化广告预算管理工具,支持跨 Google、LinkedIn 和 Meta 平台进行广告投放优化。
ClinePass
ClinePass
允许用户在 Cline 中运行最优秀的开源权重模型,提升开发效率。
VisibAI
VisibAI
一款 AI 诊断工具,帮助用户在几分钟内发现并修复 AI 回答中的问题。
PMB
PMB
一款本地优先的 AI 记忆工具,旨在解决开发者需要反复向 AI 编程代理解释项目背景的痛点。
Spira for Product Hunt Makers
Spira 社交媒体增长代理
专为 Product Hunt 创作者设计的社交媒体增长代理,帮助用户建立并维持产品热度。
Upstream FTP
Upstream FTP
一款专为 macOS 设计的快速、美观且原生的 FTP/SFTP 客户端。
Intelli
Intelli
一款 AI 对话工具,旨在通过智能对话将潜在客户转化为实际购买者。
Outpaint - Ad Reframe
Outpaint - 广告重构
利用 AI 技术将垂直格式的 UGC 内容转换为宽屏广告,适配更多投放场景。
ReadHere
ReadHere
一款轻量级的浏览器内 PDF 和 EPUB 阅读器,提供简洁的阅读体验。
MIT Technology Review
AI agents are not your “coworkers”
AI 代理不是你的“同事”
本文探讨了企业将 AI 工具视为“下属”或“同事”的误区。尽管公司可能给 AI 工具起名(如 Alex),但 AI 本质上是执行任务的软件,而非具备社会属性的职场伙伴。
Agent confidence on the technical frontier
技术前沿的代理信心
2026 年被 Gartner 称为企业 AI 项目的“拐点年”。随着对投资回报率(ROI)要求的提高,企业高管正寄希望于代理式 AI 来实现可衡量的财务成果。
The Download: metric weaknesses and AI elephant warnings
每日下载:指标的局限性与 AI 风险预警
本期简报讨论了指标在评估 AI 表现时的局限性,并提醒开发者警惕 AI 系统中可能被忽视的重大风险。
The Download: brain-melting heatwaves and unprecedented OpenAI restrictions
每日下载:大脑融化的热浪与 OpenAI 前所未有的限制
本期简报关注了欧洲极端热浪对人类认知的影响,以及 OpenAI 近期实施的严格模型使用限制。
Heat waves mess with your brain. Scientists are trying to figure out why.
热浪正在影响你的大脑,科学家正试图找出原因
欧洲近期遭遇破纪录的热浪,气温飙升至 36.1°C。研究表明,极端高温不仅威胁生命,还会对人类的大脑功能和认知能力产生负面影响。
Repositioning retail for the AI era
AI 时代的零售业重塑
AI 正在重塑零售业,但重点不在于虚拟试穿等表面功能,而在于后台决策的优化,包括搜索结果排序、供应链库存管理以及代码交付效率的提升。
The Download: Europe’s heat wave hits the grid, and IBM’s chip targets Moore’s Law
每日下载:欧洲热浪冲击电网,IBM 芯片挑战摩尔定律
本期简报报道了欧洲热浪导致电网负荷过重,以及 IBM 研发出新型高密度芯片以延续摩尔定律的进展。
What Europe’s heat wave means for the power grid
欧洲热浪对电网意味着什么
极端高温导致欧洲多地电网不堪重负,甚至迫使部分发电厂停运。这凸显了气候变化对基础设施稳定性的严峻挑战。
IBM has unveiled chip technology that could help extend Moore’s Law another decade
IBM 发布新型芯片技术,有望将摩尔定律延长十年
IBM 研发出一款指甲盖大小的芯片原型,集成了约 1000 亿个晶体管,密度是其 2021 年技术的两倍。该设计有望在未来十年内提升计算机的性能与能效。
Europe’s extreme heat is shutting down power plants
欧洲极端高温导致发电厂停运
由于气温过高,法国等欧洲国家的部分发电厂被迫停运,加剧了电网在高温期间的供电压力。
GitHub Trending
simplex-chat / simplex-chat
SimpleX 是首个无需任何用户标识符的即时通讯网络,设计上实现了 100% 的隐私保护,支持 iOS、Android 和桌面端。
msitarzewski / agency-agents
一个功能完备的 AI 代理集合,涵盖从前端开发到社区运营的各类专家代理,每个代理都具备独特的个性和流程。
cupy / cupy
为 GPU 加速设计的 NumPy 和 SciPy 库,极大提升了科学计算效率。
altic-dev / FluidVoice
FluidVoice 是 macOS 上最快的离线语音转文字应用,所有处理均在本地完成,保护用户隐私。
soxoj / maigret
一款强大的 OSINT 工具,可以通过用户名从 3000 多个网站收集目标人物的数字档案。
commaai / openpilot
openpilot 是一个机器人操作系统,目前已为 300 多款车型提供了先进的驾驶辅助系统升级。
ripienaar / free-for-dev
一份详尽的 SaaS、PaaS 和 IaaS 免费层级列表,对 DevOps 和基础设施开发者极具参考价值。
logto-io / logto
专为 SaaS 和 AI 应用设计的身份认证与授权基础设施,基于 OIDC 和 OAuth 2.1 构建,支持多租户、SSO 和 RBAC。
xbtlin / ai-berkshire
AI 时代的伯克希尔:基于 Claude Code / Codex 的价值投资研究框架,结合了巴菲特、芒格等大师的方法论与多代理并行分析。
browser-use / video-use
利用编程代理进行视频编辑的工具,简化了复杂的视频处理流程。
OpenAI Blog
Mapping Europe’s AI Workforce Opportunity
绘制欧洲 AI 就业机会图谱
OpenAI 发布了一份新报告,分析了 AI 如何重塑欧盟的就业市场,重点探讨了哪些职业面临自动化风险,以及哪些领域将迎来增长或工作流变革。
HP Inc. launches Frontier strategic partnership with OpenAI
惠普与 OpenAI 达成 Frontier 战略合作伙伴关系
惠普公司宣布与 OpenAI 建立 Frontier 战略合作伙伴关系,旨在将 AI 技术部署到客户体验、软件开发及企业运营的各个环节。
Previewing GPT-5.6 Sol: a next-generation model
预览下一代模型 GPT-5.6 Sol
OpenAI 预览了 GPT-5.6 Sol 模型,该模型在编程、科学研究和网络安全领域具备更强的能力,并配备了公司目前最先进的安全堆栈。
How agents are transforming work
AI 代理如何改变工作方式
OpenAI 的最新研究论文展示了 AI 代理如何通过处理更长、更复杂的任务来提升各行各业的生产力。
OpenAI and Broadcom unveil LLM-optimized inference chip
OpenAI 与博通联合推出 LLM 优化推理芯片
OpenAI 与博通合作推出了名为“Jalapeño”的定制 AI 芯片,专为大语言模型推理设计,旨在提升 AI 系统的性能、效率和扩展性。
Helping build shared standards for advanced AI
助力构建先进 AI 的共享标准
OpenAI 正在通过 Appia 基金会支持评估框架、安全实践和全球合作,致力于为先进 AI 技术建立共享标准。
How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery
GPT-5 如何帮助免疫学家 Derya Unutmaz 解决困扰三年的谜题
GPT-5 Pro 为免疫学家 Derya Unutmaz 提供了关于 T 细胞行为的深刻见解,成功解决了困扰其三年的免疫学谜题,该突破有望推动癌症和自身免疫性疾病的研究。
How Omio is building the future of conversational travel
Omio 如何构建对话式旅游的未来
Omio 利用 OpenAI 技术打造对话式旅游体验,加速产品开发,并成功转型为一家 AI 原生公司。
Daybreak: Tools for securing every organization in the world
Daybreak:为全球组织提供安全保障的工具
OpenAI 推出了 Daybreak 工具集,包括 Codex Security 和 GPT-5.5-Cyber,旨在帮助组织大规模发现、验证并修复安全漏洞。
Patch the Planet: a Daybreak initiative to support open source maintainers
Patch the Planet:支持开源维护者的 Daybreak 倡议
OpenAI 发起“Patch the Planet”倡议,旨在利用 AI 和专家评审帮助开源维护者发现并修复安全漏洞。
Anthropic Blog
Statement on the US government directive to suspend access to Fable 5 and Mythos 5
关于美国政府暂停 Fable 5 和 Mythos 5 访问权限的声明
美国政府已发布出口管制指令,要求暂停所有对 Fable 5 和 Mythos 5 模型的访问权限。
Introducing Claude Tag
介绍 Claude Tag
Claude Tag 是一种全新的团队协作方式,旨在提升团队使用 Claude 的效率。
Introducing Claude Corps
介绍 Claude Corps
Anthropic 启动了 Claude Corps 国家奖学金计划,旨在支持早期职业人士,帮助他们将 AI 的益处推广到美国各地的社区。
Expanding Project Glasswing
扩展 Project Glasswing 项目
Anthropic 宣布将 Project Glasswing 项目扩展至全球 15 个国家的约 150 个新组织。
Introducing Claude Opus 4.8
介绍 Claude Opus 4.8
Claude Opus 4.8 进行了重大升级,在编程、代理任务和专业工作方面表现更强,并具备处理长期任务的稳定性。
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
Anthropic 在首尔开设办事处,并宣布与韩国 AI 生态系统建立新合作伙伴关系
Anthropic 正式进军韩国市场,在首尔设立办事处,并与当地 AI 生态系统达成多项合作。
Results from the first Anthropic Public Record
首份 Anthropic 公共记录结果
Anthropic 发布了首份公共记录报告,展示了公司在透明度和合规性方面的进展。
TCS and Anthropic partner to bring Claude to regulated industries
TCS 与 Anthropic 合作,将 Claude 引入受监管行业
TCS 与 Anthropic 达成合作,旨在将 Claude 模型引入银行、航空等受监管行业,提升其业务智能化水平。
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
DXC 将把 Claude 集成到银行、航空及其他受监管行业依赖的系统中
DXC 宣布将 Claude 集成到其核心业务系统中,为受监管行业提供更安全、高效的 AI 解决方案。
Claude Fable 5 and Claude Mythos 5
Claude Fable 5 与 Claude Mythos 5
Anthropic 推出了两款新模型 Claude Fable 5 和 Claude Mythos 5,进一步丰富了其模型产品线。
Google AI Blog
Ask an AI expert: What exactly is the full stack?
询问 AI 专家:什么是全栈?
Google 专家解释了 AI 领域“全栈”方法的含义,并阐述了为何这一理念长期以来一直是 Google AI 工作的基石。
Our latest Google Finance upgrades, including a new app
Google Finance 最新升级,包括一款新应用
Google Finance 结束测试阶段,正式推出全新的 Android 应用程序,提供更优质的金融信息服务。
New research shows how AMIE, our medical AI, could help manage health conditions.
最新研究显示医疗 AI 系统 AMIE 如何助力健康管理
发表在《Nature》上的研究表明,Google 的对话式 AI 系统 AMIE 在复杂疾病管理方面表现出色,能够媲美初级保健医生。
We’re strengthening our presence in Alabama through new investments and community support.
通过新投资和社区支持,加强在阿拉巴马州的布局
Google 宣布在 2026 年和 2027 年投资 15 亿美元,用于扩建其位于阿拉巴马州杰克逊县的数据中心园区。
Our new community investments in Virginia support local jobs and expand energy affordability.
在弗吉尼亚州的新社区投资支持当地就业并提升能源可负担性
Google 正在弗吉尼亚州投资能源项目,并致力于培养下一代劳动力,支持当地经济发展。
The latest AI news we announced in May 2026
2026 年 5 月发布的最新 AI 新闻汇总
本文汇总了 Google 在 2026 年 5 月发布的所有 AI 相关更新。
5 ways Google Search can level up your thrift and vintage shopping
5 种利用 Google 搜索提升二手和复古购物体验的方法
Google 搜索和购物功能引入了 AI 工具,帮助用户更轻松地发现二手好物。
How we used Gemini to build Google I/O 2026
我们如何利用 Gemini 构建 Google I/O 2026
了解 Google 员工如何利用 AI 技术策划并执行 Google I/O 2026 大会。
Take our I/O 2026 quiz, vibe coded in Google AI Studio.
参加我们的 I/O 2026 测验,体验 Google AI Studio 的魅力
Google 使用 AI Studio 制作了一份关于 I/O 2026 重点公告的测验,展示了 AI 在内容创作中的应用。
9 demos of Gemini Omni and Gemini 3.5 in action
9 个 Gemini Omni 和 Gemini 3.5 的演示视频
观看 9 个演示视频,直观了解在 Google I/O 2026 上发布的 Gemini Omni 和 Gemini 3.5 的强大功能。
Hugging Face Blog
DiScoFormer: One transformer for density and score, across distributions
DiScoFormer:跨分布的密度与评分统一 Transformer
Run a vLLM Server on HF Jobs in One Command
一键在 HF Jobs 上运行 vLLM 服务器
Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel
利用 NVIDIA NeMo AutoModel 加速 Transformer 微调
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World
介绍 FFASR 排行榜:真实场景下的 ASR 基准测试
Build real agentic apps using CUGA: two dozen working examples on a lightweight harness
使用 CUGA 构建真实的代理应用:轻量级框架下的 24 个工作示例
Shipping huggingface_hub every week with AI, open tools, and a human in the loop
每周发布 huggingface_hub:AI、开源工具与人工参与的结合
Experimenting with the proposed Cross-Origin Storage API in Transformers.js
在 Transformers.js 中试验跨源存储 API
PP-OCRv6 on Hugging Face: 50-Language OCR from 1.5M to 34.5M Parameters
Hugging Face 上的 PP-OCRv6:支持 50 种语言,参数量从 1.5M 到 34.5M
We got local models to triage the OpenClaw repo for FREE!*
我们利用本地模型免费对 OpenClaw 仓库进行了分类!
MosaicLeaks: Can your research agent keep a secret?
MosaicLeaks:你的研究代理能保守秘密吗?
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
正交性之后:美德伦理代理与 AI 对齐
本文探讨了理性人与理性 AI 的目标设定问题,认为人类行为并非由单一“目标”驱动,而是由实践网络构成,AI 对齐应借鉴美德伦理学。
AGI Is Not Multimodal
AGI 不是多模态的
本文反思了当前生成式 AI 的局限性,指出将语言作为思维模型会导致我们忽视人类智能中具身理解的重要性。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
形状、对称性与结构:数学在机器学习研究中角色的转变
过去十年,机器学习研究从数学驱动转向了算力驱动。本文探讨了这一转变对未来研究的影响。
What’s Missing From LLM Chatbots: A Sense of Purpose
LLM 聊天机器人缺失了什么:使命感
尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升。本文认为,AI 聊天机器人缺乏明确的“使命感”。
We Need Positive Visions for AI Grounded in Wellbeing
我们需要基于福祉的 AI 正向愿景
AI 技术正在深刻改变社会,我们需要构建以人类福祉为核心的 AI 发展愿景。
Financial Market Applications of LLMs
LLM 在金融市场的应用
LLM 在处理序列数据方面的能力使其在金融领域展现出巨大潜力,但也面临着结构性挑战。
A Brief Overview of Gender Bias in AI
AI 中的性别偏见简述
本文简要概述了 AI 系统中存在的性别偏见问题及其影响。
Mamba Explained
Mamba 原理解析
Mamba 作为一种基于状态空间模型(SSM)的新型 AI 模型,为处理长序列数据提供了 Transformer 之外的有力替代方案。
Car-GPT: Could LLMs finally make self-driving cars happen?
Car-GPT:LLM 能否最终实现自动驾驶?
探讨了 LLM 在自动驾驶领域的应用潜力,以及其在安全性与可靠性方面面临的关键挑战。
Do text embeddings perfectly encode text?
文本嵌入能完美编码文本吗?
“Vec2text”技术展示了将嵌入还原为文本的可能性,强调了对嵌入数据进行安全协议审查的紧迫性。
arXiv CS.AI
AI-Model Network: Concept, Current State and Future
AI 模型网络:概念、现状与未来
本文探讨了 AI 模型网络的概念,分析了其在互联网协作与计算处理中的核心价值及未来发展方向。
When Does Personality Composition Matter for Multi-Agent LLM Teams?
多代理 LLM 团队中人格构成何时重要?
研究表明,人格提示会影响 LLM 的沟通方式,进而影响团队协作的客观任务结果。
Internalizing the Future: A Unified Agentic Training Paradigm for World Model Planning
内化未来:用于世界模型规划的统一代理训练范式
针对 LLM 代理在长程任务中反应迟钝的问题,本文提出了一种基于内部世界模型的规划训练范式。
Odyssey: Constructing Verifiable Local Truth-Preserving Foundation Models
Odyssey:构建可验证的局部真值保持基础模型
本文提出了一种名为 ODYSSEY 的分类框架,用于构建可验证且具备局部真值保持特性的基础模型。
DysLexLens: A Low-Resource LLM Framework for Analysing Dyslexic Learners Insights from Online Forums
DysLexLens:用于分析阅读障碍学习者在线论坛见解的低资源 LLM 框架
本文提出了 DysLexLens 框架,旨在分析阅读障碍学习者在使用 AI 工具时的真实体验。
MER-R1: Multimodal Emotion Reasoning via Slow-Fast Thinking Synergy
MER-R1:通过慢思考与快思考协同实现多模态情感推理
研究发现,在多模态情感识别中,直接触发答案的“快思考”往往优于经过深思熟虑的“慢思考”。
ToE: A Hierarchical and Explainable Claim Verification Framework with Dynamic Multi-source Evidence Retrieval and Aggregation
ToE:一种具有动态多源证据检索与聚合的分层可解释声明验证框架
针对 AI 生成的虚假信息,本文提出了 ToE 框架,通过分层检索与聚合来验证声明的真实性。
Towards Reliable and Robust LLM Planning: Symbolic Feedback-Driven Iterative Self-Refinement Framework
面向可靠且鲁棒的 LLM 规划:符号反馈驱动的迭代自优化框架
针对 LLM 在长程规划中的不稳定性,本文提出了一种基于符号反馈的迭代自优化框架。
arXiv CS.CL
Formalizing Latent Thoughts: Four Axioms of Thought Representation in LLMs
形式化潜在思维:LLM 中思维表示的四个公理
本文引入了一个公理化评估框架,用于评估 LLM 中的潜在思维表示,揭示了基准测试无法发现的表示失败。
Position: The Term “Machine Unlearning” Is Overused in LLMs
立场:在 LLM 研究中“机器遗忘”一词被过度使用
本文认为“机器遗忘”在 LLM 研究中被滥用,应将其严格限制在数据集层面的遗忘操作中。
A Survey of Automated Presentation Coaching: Systems, Methods, and Open Challenges
自动化演讲辅导综述:系统、方法与开放挑战
本文系统综述了自动化演讲辅导系统的研究现状,涵盖了发音训练、韵律建模及语音合成等维度。
Causal Connections: Leveraging Multilingual Fine-Tuning for Financial QA@FinCausal 2026
因果连接:利用多语言微调进行金融问答
本文介绍了 HSA_CORAL 团队在 FinCausal 2026 任务中的提交方案,通过多语言微调提取金融叙事中的因果关系。
Developmental approach reveals the statistical learning of Neural Language Models: Transformers generalize from the most abstract statistical patterns
发展视角揭示神经语言模型的统计学习:Transformer 从最抽象的统计模式中泛化
本文通过发展视角研究了 Transformer 模型在合成语法训练中的学习过程。
Supersede: Diagnosing and Training the Memory-Update Gap in LLM Agents
Supersede:诊断并训练 LLM 代理中的记忆更新差距
本文探讨了 LLM 代理在处理动态事实更新时的记忆差距问题,并提出了相应的诊断与训练方法。
The Context-Ready Transformer
上下文就绪 Transformer
本文引入了一种新的循环神经网络架构,通过在进入 Transformer 块之前对每个 token 进行预上下文处理,提升了生成效率。
EntMTP: Accelerating LLM Inference with Entropy Guided Multi Token Prediction
EntMTP:利用熵引导的多 token 预测加速 LLM 推理
本文提出了一种基于熵引导的多 token 预测方法,旨在加速 LLM 的推理过程。
WIRED
Meta Contractors Posed as Teens to Prompt Rival Chatbots About Suicide, Sex, and Drugs
Meta 承包商冒充青少年诱导竞争对手聊天机器人讨论自杀、性和毒品
WIRED 调查发现,Meta 的数百名承包商冒充青少年,测试 ChatGPT 和 Gemini 等竞争对手的聊天机器人在面对高风险话题时的反应。
Buying a Mattress in 2026? We Tested 100+ and These Were the Standouts
2026 年买床垫?我们测试了 100 多款,这些是佼佼者
WIRED 对 100 多款盒装床垫进行了为期一周的测试,Helix Midnight Luxe 混合床垫被评为最佳在线购买选择。
Usernames Are Coming to WhatsApp Soon. Here’s How to Reserve Yours
WhatsApp 即将推出用户名功能:如何预留你的 ID
WhatsApp 即将推出用户名功能,建议用户尽早预留,以避免在交流时必须分享手机号码。
The Busy Bar Is a Gadget to Get People to Leave You Alone
“忙碌条”:一款让你远离干扰的设备
Flipper Devices 推出了一款名为“Busy Bar”的设备,旨在通过物理方式提醒他人不要打扰你,从而帮助用户专注。
Robin Byrd, the Sex Godmother of Millennials, Says the Internet Ruined Porn
千禧一代的“性教母” Robin Byrd:互联网毁了色情业
前色情女星 Robin Byrd 认为,互联网时代的审查制度和缺乏明星气质的表演者,导致了色情行业的衰落。
Yeasound RIC800 Hearing Aids Review: Good Audio, Glitchy App
Yeasound RIC800 助听器评测:音质出色,App 体验不佳
Yeasound RIC800 助听器具备 AI 降噪和自动语音聚焦功能,但其配套 App 的糟糕体验拖累了整体评价。
The Anti-Data-Center Movement Is Reshaping Michigan Politics
反数据中心运动正在重塑密歇根州政治
气候活动家 Will Lawrence 正在竞选密歇根州议员,其核心主张之一是呼吁对数据中心建设实施暂停令。
Top Google Security Staff Warn Search Data Could Be Hacked if EU Rules Change
Google 安全高管警告:若欧盟规则改变,搜索数据可能被黑
Google 安全团队警告称,欧盟的反垄断提案可能导致搜索数据面临严重的安全风险。
Everyone’s Mad at the World Cup’s New ‘Hydration Breaks’—Except Mr. Moneybags Over Here
世界杯新增“补水时间”引发众怒——除了那些商业赞助商
FIFA 在世界杯中引入的“补水时间”被球迷批评为变相的商业广告插播,引发了广泛争议。
I Found Jesus at a Drone Show
我在无人机表演中找到了耶稣
无人机表演正逐渐取代烟花,成为一种新型的视觉盛宴,甚至被赋予了某种宗教般的仪式感。
Lobsters
When Impressive Performance Gains Do Not Matter
当令人印象深刻的性能提升变得无关紧要时
本文探讨了在软件工程中,盲目追求性能优化而忽略业务价值的现象。
What is std::pin::Pin in Rust?
Rust 中的 std::pin::Pin 是什么?
深入解析 Rust 语言中 Pin 的概念及其在异步编程中的重要性。
Loko Scheme 0.13.0
Loko Scheme 0.13.0 版本发布
Loko Scheme 发布了 0.13.0 版本,带来了多项改进与修复。
WATaBoy: JIT-ing Game Boy Instructions to Wasm Beats a Native Interpreter
WATaBoy:将 Game Boy 指令 JIT 编译为 Wasm 比原生解释器更快
本文介绍了 WATaBoy 项目,通过将 Game Boy 指令 JIT 编译为 WebAssembly,实现了比原生解释器更高的运行效率。
Ante: New Way to Blend Borrow Checking and Reference Counting
Ante:融合借用检查与引用计数的新方法
Ante 语言提出了一种结合借用检查与引用计数的新型内存管理机制。
Canvas patch: we need testers
Canvas 补丁:我们需要测试人员
Canvas 项目发布了新补丁,目前正在招募测试人员进行验证。
Type-checked non-empty strings
类型检查的非空字符串
探讨了如何在编程语言中实现类型安全的非空字符串检查。
Evaluation order and nontermination in query languages
查询语言中的求值顺序与非终止性
分析了查询语言在处理求值顺序和非终止性问题时的复杂性。
Typst: Designing for Incrementality
Typst:为增量化而设计
Typst 团队分享了其在排版引擎设计中如何实现增量化处理的经验。
The AT-URI Syntax Mess
AT-URI 语法混乱
探讨了 AT-URI 语法在设计与实现中面临的混乱与挑战。
DEV Community
Build a Stock Dashboard from Three Keyless Public Data Feeds
利用三个无需密钥的公共数据源构建股票仪表盘
本文分享了如何通过三个无需 API 密钥的公共数据源,构建一个功能完备的股票仪表盘。
I Built a Global Opinion Platform in 72 Hours — Here Is What Actually Went Wrong
我在 72 小时内构建了一个全球观点平台——实际出了什么问题
作者分享了在黑客松期间构建平台的真实经历,包括那些未按计划进行的调试过程。
I built a Python ORM with a Rust engine — here’s how the GIL, PyO3, and asyncio actually cooperate
我用 Rust 引擎构建了一个 Python ORM——解析 GIL、PyO3 和 asyncio 的协作机制
本文深入探讨了如何利用 Rust 编写高性能 ORM 引擎,并解析了其与 Python 异步机制的协作原理。
How we parse Apache Airflow DAGs without importing Airflow
我们如何在不导入 Airflow 的情况下解析 Apache Airflow DAG
本文介绍了一种通过结构化 shim 解析 Airflow DAG 的方法,无需安装任何 provider 即可实现。
100 Days of DevOps, Day 4: Permissions That Actually Matter and Why S3 Versioning Shouldn’t Be Optional
DevOps 100 天,第 4 天:权限的重要性与 S3 版本控制的必要性
本文讨论了 Linux 权限管理以及为何 S3 版本控制在生产环境中不应被视为可选功能。
DevOps as a Service Pricing: What Should Businesses Expect to Pay?
DevOps 即服务定价:企业应该预期支付多少费用?
本文为企业提供了关于 DevOps 即服务定价的参考建议,帮助企业更好地进行预算规划。
The SGX Enclave: Building the First Cryptographically Sovereign Smart City
SGX Enclave:构建首个加密主权智慧城市
本文探讨了利用 SGX Enclave 技术构建无需繁琐审计、具备高度经济效率的智慧城市蓝图。
Why Most People Never Discover Their Real Potential
为什么大多数人从未发现自己的真正潜力
本文分析了人们在职业选择中受限于期望与安全感,从而忽视自我理解的问题。
I built detailed directory of selfhostable projects
我构建了一个详细的自托管项目目录
作者推出了 selfhost.directory,收录了超过 2000 个可自托管的项目,方便用户搜索与对比。
A real on-chain order book for perps: a technical look at Margin Trade on Solana
真正的链上永续合约订单簿:Solana 上 Margin Trade 的技术解析
本文深入分析了 Margin Trade 如何在 Solana 上实现真正的链上订单簿,而非传统的 AMM 模型。
Meta Engineering
Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study
AI 原生时代的隐私感知基础设施:资产分类案例研究
Meta 分享了其在 AI 原生时代如何通过资产分类实现隐私控制,确保数据处理符合合规要求。
How Meta Engineered Ultra-Narrow Batteries for AI Glasses
Meta 如何为 AI 眼镜设计超窄电池
Meta 介绍了其在 Ray-Ban Meta 等智能眼镜中如何将高能量密度电池集成到狭窄的镜腿中。
Adopting AV1 for Real-Time Communication (RTC) at Scale
在大规模实时通信中采用 AV1 编码
Meta 分享了其在实时通信中部署 AV1 编码的挑战与解决方案,提升了通话质量。
Lights Out, Systems On: Validating Instant Power Loss Readiness
停电不停机:验证瞬时断电准备能力
Meta 引入了“瞬时断电风暴”测试范式,旨在提升数据中心在零预警断电情况下的容错能力。
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems
SilverTorch:索引即模型——推荐系统的新检索范式
Meta 介绍了 SilverTorch,一种统一的推荐系统检索架构,显著提升了吞吐量并降低了计算成本。
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends:构建可扩展至数十亿用户的社交发现功能
Meta 工程师分享了 Friend Bubbles 功能背后的工程挑战,展示了如何实现大规模社交发现。
Migrating Data Ingestion Systems at Meta Scale
Meta 大规模数据摄取系统的迁移
Meta 分享了其数据摄取系统从旧架构迁移至新架构的策略,提升了系统的可靠性。
Labyrinth 1.1: Making End-to-End Encrypted Backups Even More Reliable
Labyrinth 1.1:让端到端加密备份更可靠
Meta 推出了 Labyrinth 1.1,增强了 Messenger 端到端加密备份的可靠性,确保消息在设备更换时不会丢失。
How Meta Is Strengthening End-to-End Encrypted Backups
Meta 如何加强端到端加密备份
Meta 介绍了基于 HSM 的备份密钥库,确保用户备份数据的安全性,且 Meta 本身无法访问。
DeepMind Blog
Introducing computer use in Gemini 3.5 Flash
在 Gemini 3.5 Flash 中引入计算机使用能力
Unlocking UK house-building with AI-accelerated planning
利用 AI 加速规划,解锁英国住房建设
英国政府与 Google DeepMind 合作,开发 AI 原型以加速住房建设决策。
Securing the future of AI agents
保障 AI 代理的未来
DeepMind 介绍了其 AI 控制路线图,结合传统安全措施与实时监控,保障内部系统安全。
DiffusionGemma: 4x faster text generation
DiffusionGemma:文本生成速度提升 4 倍
Investing in multi-agent AI safety research
投资多代理 AI 安全研究
Google DeepMind 与合作伙伴宣布投入 1000 万美元,用于资助多代理安全研究。
Fluid, natural voice translation with Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 实现流畅自然的语音翻译
Gemini 3.5 Live Translate 为 Google AI Studio、Translate 和 Meet 带来了近乎实时的自然语音翻译体验。
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
介绍 Gemma 4 12B:统一的无编码器多模态模型
Powering the future of robotics in Europe
助力欧洲机器人技术的未来
Measuring the impact of learning with AI in Sierra Leone and beyond
衡量 AI 学习在塞拉利昂及其他地区的影响
随机对照试验显示,