2026-06-27
今日要点
- OpenAI 重磅发布与战略调整:OpenAI 正式推出 GPT-5.6 模型系列(Sol, Terra, Luna),并与 Broadcom 合作研发 Jalapeño 推理芯片,旨在降低对单一供应商的依赖。同时,公司因应政府要求限制了新模型的发布节奏,并积极扩张印度市场。
- AI 代理与基础设施的演进:AI 代理(Agent)技术正从实验走向生产,包括 Anthropic 的 Cowork 桌面代理、OpenAI 的 Agent SDK 应用,以及各类针对 RAG(检索增强生成)和代码自动化的优化方案,标志着 AI 正在从“聊天工具”向“执行任务的生产力引擎”转型。
- 科技巨头的合规与安全挑战:OpenAI 卷入版权争议,且面临政府对 AI 模型发布流程的干预;同时,针对 AI 代理的恶意配置攻击(如 Amazon Q Developer 的漏洞)引发了行业对 AI 系统安全性的高度关注。
- 全球科技动态:欧洲遭遇极端热浪,对电力基础设施造成严重压力;大众汽车(VW)计划重组以应对全球市场(尤其是中国)的销量下滑;俄罗斯黑客被指控对捷豹路虎实施了 25 亿美元的重大黑客攻击。
TechCrunch
Corgi, the buzzy Y Combinator-backed insurance tech startup, says it didn’t steal an open source product
获 Y Combinator 支持的保险科技初创公司 Corgi 否认窃取开源产品
保险科技初创公司 Corgi 近期陷入舆论风波,被软件公司 Papermark 指控窃取其产品代码。Corgi 对此予以坚决否认,并表示其开发过程完全合规。这一事件再次引发了业界关于“氛围编程”(vibe coding,即通过自然语言描述让 AI 生成代码)在版权归属和代码来源透明度方面的新讨论。
Novak Djokovic has a new job — advisor to private equity firm General Atlantic
诺瓦克·德约科维奇出任私募股权公司 General Atlantic 战略顾问
网球传奇巨星诺瓦克·德约科维奇(Novak Djokovic)开启了职业生涯的新篇章,他已受邀担任私募股权巨头 General Atlantic 的全球战略顾问。这一跨界合作显示了顶级运动员在退役后或职业生涯后期,正越来越多地参与到全球金融与投资领域。
OpenAI limits GPT-5.6 rollout after government request, says restrictions shouldn’t be the norm
OpenAI 应政府要求限制 GPT-5.6 发布,并称此类限制不应成为常态
OpenAI 近期发布了 GPT-5.6 模型,但应美国政府要求,其发布节奏受到了一定限制。OpenAI 对此表示,虽然配合政府审查,但并不认为这种政府介入流程应成为长期的行业默认标准,因为这会阻碍开发者、企业及网络安全防御者获取最先进的工具。
OpenAI poaches Uber India chief to lead its biggest market outside the US
OpenAI 挖角 Uber 印度负责人,以开拓美国以外的最大市场
为了进一步扩大在印度的影响力,OpenAI 聘请了前 Uber 印度业务负责人。此举是 OpenAI 全球扩张战略的重要一环,旨在通过加强当地办公室建设、建立合作伙伴关系以及大规模招聘,深耕这一关键的海外市场。
Why everyone from OpenAI to SpaceX is building their own chips (and turning up the heat on Nvidia)
为什么从 OpenAI 到 SpaceX 都在自研芯片(并向英伟达施压)
英伟达在 AI 芯片市场的长期垄断地位正面临挑战。为了摆脱对单一供应商的依赖,OpenAI 宣布与博通(Broadcom)合作研发名为“Jalapeño”的定制推理芯片。谷歌、苹果和 SpaceX 等科技巨头也纷纷加入自研芯片行列,旨在通过垂直整合提升效率并降低供应链风险。
Russian hackers were behind $2.5B hack of Jaguar Land Rover: Report
报告称俄罗斯黑客是捷豹路虎 25 亿美元黑客攻击事件的幕后黑手
据最新报告显示,去年针对汽车巨头捷豹路虎(Jaguar Land Rover)的重大黑客攻击事件是由俄罗斯黑客组织策划的。此次攻击造成了高达 25 亿美元的损失,被认为是近年来最具破坏性和代价最昂贵的企业网络攻击之一。
Tesla settles FSD crash lawsuit as federal investigations continue
特斯拉就 FSD 车祸诉讼达成和解,联邦调查仍在继续
特斯拉已就一起涉及其“全自动驾驶”(FSD)系统的致命车祸诉讼达成和解。尽管诉讼告一段落,但针对特斯拉辅助驾驶系统的联邦调查仍在进行中,监管机构正持续评估该技术的安全性。
TikTok’s road to becoming a super app
TikTok 迈向“超级应用”之路
TikTok 正在积极拓展其业务边界,试图从单一的短视频平台转型为用户处理大部分数字活动的“超级应用”。这一战略调整旨在通过整合更多生活服务功能,提升用户粘性并构建更完整的生态系统。
It’s not about Anthropic vs. OpenAI anymore
竞争已不再局限于 Anthropic 与 OpenAI
AI 模型的进步已达到产生深远政治影响的程度。文章指出,当前的 AI 竞争已超越了单纯的厂商对垒,如何应对 AI 带来的社会与政治后果,需要全球范围内的集体行动与治理。
Xprize founder says ‘humans behave better when they’re being watched’
Xprize 创始人称“人类在被监视时表现更好”
Xprize 创始人彼得·戴曼迪斯(Peter Diamandis)近日发表言论,支持全球监控系统,认为这能促使人类表现得更好。这一观点呼应了拉里·埃里森(Larry Ellison)在 2024 年的类似言论,再次引发了关于隐私与社会秩序的激烈争议。
The Verge
After covering Prime Day for 36 hours over four days, this is the one thing I bought
连续四天报道 36 小时 Prime Day 后,我只买了这一样东西
在经历了长达四天的 Prime Day 促销报道后,作者最终选择购买了一把“Vampliers”(一种日本制造的特殊钳子)。这反映了在海量促销信息中,实用工具往往比那些冲动消费的电子产品更能赢得消费者的青睐。
Our favorite Prime Day gadgets under $100 you don’t need but will really want
我们最喜欢的 Prime Day 百元以下小玩意:你不需要但一定会想要
Prime Day 总是能让人买到一些意料之外的东西。本文盘点了多款售价低于 100 美元的智能家居和创意小工具,虽然并非生活必需品,但其趣味性和实用性足以让人产生强烈的购买欲。
It’s the last day of Prime Day — here are over 140 great deals to choose from
Prime Day 最后一天:这里有超过 140 个超值优惠供你选择
Prime Day 已进入最后一天,促销范围涵盖了电视、智能家居、充电器和耳机等各类产品。随着部分热门商品售罄,作者整理了 140 多项精选优惠,提醒消费者抓紧最后的机会进行升级。
These are the best deals you can still get on MacBooks before Apple’s price hike kicks in
在苹果涨价前,你仍能买到的最佳 MacBook 优惠
由于内存芯片成本上升,苹果近期上调了 Mac 和 iPad 的价格。然而,许多零售商仍保留着旧价格或折扣,这使得目前在售的 MacBook Neo、Air 和 Pro 成为极具性价比的购买选择。
Our 36 favorite gaming deals on Prime Day for Switch, PS5, and Xbox
我们在 Prime Day 挑选的 36 款 Switch、PS5 和 Xbox 游戏优惠
针对任天堂 Switch 2、PlayStation 5 和 Xbox Series X/S 玩家,本文汇总了 36 款热门游戏的折扣信息。无论是实体版还是数字版,目前都是扩充游戏库的绝佳时机。
The beautiful shame
美丽的羞耻
文章探讨了美国在举办世界杯期间的移民政策问题。作者指出,尽管美国欢迎游客,但唐纳德·特朗普政府的排外移民政策导致许多来自非洲、亚洲和中东的潜在观众被拒之门外,这与美国宣扬的开放精神形成了讽刺的对比。
This video bird feeder is the surprise hit of Prime Day
这款视频喂鸟器成为 Prime Day 的意外爆款
BirdBuddy Pro 视频喂鸟器在 Prime Day 期间大受欢迎。尽管原价较高,但其结合了视频门铃技术与太阳能充电功能,为庭院生活增添了趣味,成为了许多科技爱好者的心头好。
OpenAI unveils GPT-5.6 amid US AI regulatory drama
OpenAI 在美国 AI 监管风波中发布 GPT-5.6
在应特朗普政府要求推迟发布后,OpenAI 终于推出了 GPT-5.6 模型系列。该系列包含旗舰模型 Sol、中端模型 Terra 以及主打快速经济的 Luna,旨在平衡性能与合规性要求。
Smart lock maker Level has been gutted and its founders are out
智能锁制造商 Level 被拆解,创始人离职
智能锁公司 Level Home 已被 Assa Abloy 收购并进行大规模裁员,其创始人也已离职。Level 以将电池和电子元件隐藏在传统锁芯内的创新设计而闻名,未来该业务将被整合进 Kwikset 品牌中。
You won’t have long to get these iPad deals before Apple’s price hike
在苹果涨价前,你没多少时间购买这些 iPad 了
随着苹果全线调高 iPad 和 MacBook 价格,零售商手中的库存成为了最后的“低价避风港”。消费者若有购买需求,应尽快行动,因为这些旧价格库存一旦售罄,未来很难再见到同等力度的折扣。
Ars Technica
Doctors suspected man had brain cancer. He actually had worms.
医生怀疑男子患有脑癌,结果竟是寄生虫
一名患者因疑似脑癌接受检查,医生在手术中惊讶地发现其大脑中并非肿瘤,而是寄生虫。这一罕见病例提醒医疗界在诊断复杂脑部病变时,需考虑寄生虫感染的可能性。
Streaming services’ obnoxiously loud ads become illegal on July 1 in California
加州 7 月 1 日起禁止流媒体服务播放音量过大的广告
加州通过新法案,禁止流媒体服务播放音量过大的广告。伊利诺伊州也通过了类似法律,这将迫使流媒体平台优化广告音量控制,提升用户体验。
Russian citizens told “switch to Android” after Apple blocks key Russian apps
苹果封锁关键俄罗斯应用后,俄公民被建议“改用安卓”
在苹果公司封锁了多款关键俄罗斯应用程序后,俄罗斯政府对此表示强烈不满,并建议公民改用安卓设备,以规避苹果的“怪异”决策。
NYT slams Microsoft for building copyright-infringing supercomputer for OpenAI
《纽约时报》抨击微软为 OpenAI 构建侵犯版权的超级计算机
《纽约时报》指控微软为 OpenAI 构建的超级计算机涉嫌侵犯版权。在最高法院针对索尼的裁决后,该报调整了对 OpenAI 和微软的版权诉讼策略,试图从基础设施层面追究责任。
FCC accused of hiding Chairman Carr’s messages with DOGE and Musk
FCC 被指隐瞒主席 Carr 与 DOGE 及马斯克的通信记录
FCC 被指控拒绝提供主席 Carr 与 DOGE(政府效率部)及埃隆·马斯克之间的通信记录。诉讼文件称 FCC 浪费了法院一年的时间,试图掩盖相关沟通细节。
Netflix now requires every user profile to be tied to unique email address
Netflix 现在要求每个用户资料必须绑定唯一的电子邮件地址
Netflix 自 6 月 15 日起实施新规,要求每个用户资料必须绑定唯一的电子邮件地址,此举旨在进一步打击账号共享行为。
Antibiotic “megacluster” discovery provides new strategy to fight superbugs
抗生素“超级簇”的发现为对抗超级细菌提供了新策略
科学家发现了一种新的抗生素“超级簇”,这一进展为对抗耐药性超级细菌提供了全新的研发方向,有望充实人类的抗生素储备库。
Ars Live: What’s the latest in the aftermath of the New Glenn catastrophe?
Ars 直播:New Glenn 火箭灾难后的最新进展
Ars Technica 将进行直播,探讨 New Glenn 火箭事故后的调查进展及后续影响,并回答观众提问。
VW may close four factories to adapt to the future, report says
报告称大众汽车可能关闭四家工厂以适应未来
由于在美国和中国市场的销量下滑,大众汽车集团正计划进行大规模重组,据报道可能关闭四家工厂以应对未来的市场挑战。
Feedbacks upon feedbacks: Rock weathering and the climate
反馈中的反馈:岩石风化与气候
文章探讨了岩石风化对气候的影响。岩石风化既可能释放二氧化碳,也可能吸收二氧化碳,具体取决于岩石的类型,这一过程在调节地球气候中扮演着复杂角色。
Product Hunt
ModuleX
AI 驱动的工作空间,已实现全平台连接。
Sleek Analytics
实时网站访客分析工具。
AI Slide Editor by CubeOne
CubeOne 推出的 AI 幻灯片编辑器,旨在解决 PowerPoint 的痛点。
SquidHub
为人类和 AI 打造的多人协作模式。
LockIn MCP
利用 AI 屏蔽干扰,帮助用户进入深度工作状态。
Basedash for Excel
将任何 Excel 文件转换为实时仪表板。
Aurora Notch
为每台 Mac 提供私有的“刘海”工作空间。
DMV by Agent Community
由社区治理的 AI 代理命名空间。
Gemini Spark
你的 24/7 个人 AI 代理。
note.md
将你的笔记和研究文档转化为本地 LLM 记忆库。
MIT Technology Review
The Download: brain-melting heatwaves and unprecedented OpenAI restrictions
每日下载:令人窒息的热浪与前所未有的 OpenAI 限制
本期简报关注了席卷欧洲的极端热浪对大脑的影响,以及 OpenAI 在政府压力下对模型发布采取的罕见限制措施。
Heat waves mess with your brain. Scientists are trying to figure out why.
热浪正在影响你的大脑,科学家正试图找出原因
伦敦近期录得 6 月份历史最高温。研究表明,极端高温不仅威胁身体健康,还会对认知功能产生负面影响,科学家正在深入研究其背后的生理机制。
Repositioning retail for the AI era
为 AI 时代重新定位零售业
AI 正在重塑零售业,但重点不在于前端的聊天机器人,而在于后端决策的优化,包括库存管理、供应链效率以及代码交付速度的提升。
The Download: Europe’s heat wave hits the grid, and IBM’s chip targets Moore’s Law
每日下载:欧洲热浪冲击电网,IBM 芯片瞄准摩尔定律
本期简报讨论了欧洲热浪导致的电网压力,以及 IBM 研发的新型芯片技术,该技术有望将摩尔定律再延续十年。
What Europe’s heat wave means for the power grid
欧洲热浪对电网意味着什么
极端高温导致空调需求激增,欧洲电网不堪重负,部分发电厂被迫停运,凸显了能源基础设施在气候变化面前的脆弱性。
IBM has unveiled chip technology that could help extend Moore’s Law another decade
IBM 发布芯片新技术,有望将摩尔定律再延续十年
IBM 研发出一种新型原型芯片,在指甲盖大小的面积上集成了约 1000 亿个晶体管,密度是 2021 年技术的两倍,为未来更高效的计算奠定了基础。
Europe’s extreme heat is shutting down power plants
欧洲极端高温导致发电厂停运
法国等国因高温打破历史记录,导致冷却水温过高,部分核电站被迫降低功率或停运,进一步加剧了能源供应紧张。
The Download: introducing the Engineering issue
每日下载:工程特刊介绍
本期简报介绍了《麻省理工科技评论》的工程特刊,探讨如何通过人类智慧解决全球性挑战。
Stripe, Anthropic, and OpenAI are backing an effort to stop respiratory infections
Stripe、Anthropic 和 OpenAI 支持预防呼吸道感染的研究
Stripe 等公司宣布资助一项旨在预防普通感冒及其他呼吸道感染的新研究,试图通过技术手段解决这一困扰人类的公共卫生难题。
The emergence of the web data infrastructure layer for AI
AI 网络数据基础设施层的兴起
随着 AI 需求激增,企业需要大规模、高质量的数据。文章探讨了如何构建网络数据基础设施,以解决数据碎片化和不可访问的问题。
GitHub Trending
simplex-chat / simplex-chat
SimpleX:首个无需任何用户标识符的即时通讯网络,设计上 100% 隐私保护。
google-labs-code / design.md
一种用于向编码代理描述视觉识别系统的格式规范。
commaai / openpilot
openpilot:机器人操作系统,目前支持 300 多款车型的驾驶辅助系统升级。
kunchenguid / no-mistakes
git push no-mistakes。
grafana / grafana
开源且可组合的可观测性和数据可视化平台。
ripienaar / free-for-dev
一份面向 DevOps 和基础设施开发者的免费 SaaS、PaaS 和 IaaS 服务清单。
opendatalab / MinerU
将 PDF 和 Office 文档转换为 LLM 就绪的 Markdown/JSON 格式,适用于代理工作流。
alchaincyf / zhangxuefeng-skill
张雪峰的认知操作系统,涵盖高考志愿、考研及职业规划的实战思维框架。
mauriceboe / TREK
自托管旅行规划器,支持实时协作、交互式地图、PWA 和预算管理。
xbtlin / ai-berkshire
AI 时代的伯克希尔:基于 Claude Code 的价值投资研究框架,结合多代理并行分析。
OpenAI Blog
Previewing GPT-5.6 Sol: a next-generation model
预览 GPT-5.6 Sol:下一代模型
OpenAI 预览了 GPT-5.6 Sol 模型,该模型在编码、科学研究和网络安全方面表现出更强的能力,并配备了最先进的安全防护体系。
How agents are transforming work
AI 代理如何改变工作方式
OpenAI 的最新研究论文展示了 AI 代理如何通过处理更长、更复杂的任务来提升各行各业的生产力。
OpenAI and Broadcom unveil LLM-optimized inference chip
OpenAI 与博通发布 LLM 优化推理芯片
OpenAI 与博通合作推出 Jalapeño 推理芯片,旨在提升大语言模型的推理性能、效率和扩展性。
Helping build shared standards for advanced AI
助力构建先进 AI 的共享标准
OpenAI 通过 Appia 基金会支持评估框架、安全实践和全球合作,致力于构建先进 AI 的行业共享标准。
How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery
GPT-5 如何帮助免疫学家 Derya Unutmaz 解决困扰三年的谜题
GPT-5 Pro 为免疫学研究提供了关键洞察,帮助科学家解析了 T 细胞行为,有望推动癌症和自身免疫性疾病的研究。
How Omio is building the future of conversational travel
Omio 如何构建对话式旅行的未来
Omio 利用 OpenAI 技术打造对话式旅行体验,加速产品开发,并转型为 AI 原生公司。
Patch the Planet: a Daybreak initiative to support open source maintainers
Patch the Planet:支持开源维护者的 Daybreak 倡议
OpenAI 推出 Patch the Planet 倡议,利用 AI 和专家评审帮助开源维护者发现并修复漏洞。
Daybreak: Tools for securing every organization in the world
Daybreak:为全球组织提供安全工具
OpenAI 推出 Daybreak 工具集,包括 Codex Security 和 GPT-5.5-Cyber,帮助组织大规模识别和修复安全漏洞。
Codex-maxxing for long-running work
Codex-maxxing:处理长期运行的工作
文章介绍了 Jason Liu 如何利用 Codex 保持上下文,管理复杂项目,并使工作超越单次提示的限制。
Samsung Electronics brings ChatGPT and Codex to employees
三星电子为员工引入 ChatGPT 和 Codex
三星电子在全球范围内为员工部署 ChatGPT 企业版和 Codex,这是 OpenAI 迄今为止最大规模的企业 AI 部署之一。
Anthropic Blog
Statement on the US government directive to suspend access to Fable 5 and Mythos 5
关于美国政府暂停 Fable 5 和 Mythos 5 访问权限的声明
美国政府已发布出口管制指令,要求暂停所有对 Fable 5 和 Mythos 5 模型的访问权限。
Introducing Claude Tag
推出 Claude Tag
Claude Tag 是一种团队协作使用 Claude 的新方式。
Introducing Claude Corps
推出 Claude Corps
Anthropic 启动了 Claude Corps 国家奖学金计划,旨在帮助职业生涯早期的年轻人将 AI 的益处带给美国各地的社区。
Expanding Project Glasswing
扩展 Project Glasswing 项目
Anthropic 将 Project Glasswing 扩展至全球 15 个国家的约 150 个新组织。
Introducing Claude Opus 4.8
推出 Claude Opus 4.8
Claude Opus 4.8 升级版在编码、代理任务和专业工作方面表现更强,并具备处理长期运行任务的稳定性。
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
Anthropic 在首尔开设办事处,并宣布与韩国 AI 生态系统建立新合作伙伴关系
Anthropic 正式进军韩国市场,通过设立办事处和建立合作,深耕当地 AI 生态。
Results from the first Anthropic Public Record
首份 Anthropic 公共记录结果
公布了 Anthropic 首份公共记录的评估结果。
TCS and Anthropic partner to bring Claude to regulated industries
TCS 与 Anthropic 合作,将 Claude 引入受监管行业
TCS 与 Anthropic 达成合作,旨在为金融、航空等受监管行业提供 Claude AI 服务。
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
DXC 将把 Claude 集成到银行、航空公司及其他受监管行业依赖的系统中
DXC 宣布将 Claude 集成至关键行业系统,以提升受监管行业的自动化水平。
Claude Fable 5 and Claude Mythos 5
Claude Fable 5 和 Claude Mythos 5
介绍了 Anthropic 的最新模型系列 Claude Fable 5 和 Mythos 5。
Google AI Blog
Our latest Google Finance upgrades, including a new app
Google Finance 最新升级,包括一款新应用
Google Finance 结束测试,正式推出全新的 Android 应用程序。
New research shows how AMIE, our medical AI, could help manage health conditions.
新研究显示医疗 AI AMIE 如何帮助管理健康状况
发表在《Nature》上的研究表明,Google 的对话式 AI 系统 AMIE 在复杂疾病管理方面可媲美初级保健医生。
We’re strengthening our presence in Alabama through new investments and community support.
我们通过新投资和社区支持加强在阿拉巴马州的布局
Google 宣布投资 15 亿美元扩建阿拉巴马州的数据中心园区。
Our new community investments in Virginia support local jobs and expand energy affordability.
我们在弗吉尼亚州的新社区投资支持当地就业并扩大能源可负担性
Google 正在通过投资能源项目和劳动力培训,支持弗吉尼亚州的社区发展。
The latest AI news we announced in May 2026
2026 年 5 月发布的最新 AI 新闻汇总
回顾了 Google 在 2026 年 5 月发布的所有 AI 更新。
5 ways Google Search can level up your thrift and vintage shopping
Google 搜索提升二手和复古购物体验的 5 种方式
利用 Google 搜索和购物中的 AI 工具,用户可以更轻松地发现二手好物。
How we used Gemini to build Google I/O 2026
我们如何使用 Gemini 构建 Google I/O 2026
分享了 Google 员工如何利用 AI 技术筹备和执行 Google I/O 2026 大会。
Take our I/O 2026 quiz, vibe coded in Google AI Studio.
参加我们的 I/O 2026 测验,由 Google AI Studio “氛围编程”生成
Google 使用 AI Studio 快速构建了一份关于 I/O 2026 发布内容的测验。
9 demos of Gemini Omni and Gemini 3.5 in action
Gemini Omni 和 Gemini 3.5 的 9 个实战演示
展示了在 Google I/O 2026 上发布的 Gemini Omni 和 Gemini 3.5 的强大功能。
Check out real-life AI prototypes from the Futures Lab.
查看来自 Futures Lab 的真实 AI 原型
滑铁卢大学的学生开发了包括手语导师在内的 AI 原型,旨在重塑教育和工作的未来。
Hugging Face Blog
Run a vLLM Server on HF Jobs in One Command
一键在 HF Jobs 上运行 vLLM 服务器
Which tokens does a hybrid model predict better?
混合模型能更好地预测哪些标记?
Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel
使用 NVIDIA NeMo AutoModel 加速 Transformers 微调
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World
推出 FFASR 排行榜:真实世界中的 ASR 基准测试
Build real agentic apps using CUGA: two dozen working examples on a lightweight harness
使用 CUGA 构建真实的代理应用:轻量级框架上的两打工作示例
Shipping huggingface_hub every week with AI, open tools, and a human in the loop
每周利用 AI、开源工具和人工参与发布 huggingface_hub
Experimenting with the proposed Cross-Origin Storage API in Transformers.js
在 Transformers.js 中试验提议的跨源存储 API
PP-OCRv6 on Hugging Face: 50-Language OCR from 1.5M to 34.5M Parameters
Hugging Face 上的 PP-OCRv6:支持 50 种语言,参数量从 1.5M 到 34.5M
We got local models to triage the OpenClaw repo for FREE!*
我们让本地模型免费对 OpenClaw 仓库进行了分类!
MosaicLeaks: Can your research agent keep a secret?
MosaicLeaks:你的研究代理能保守秘密吗?
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
正交性之后:美德伦理代理与 AI 对齐
文章论证了理性的人不应有“目标”,理性的 AI 也不应有“目标”,并探讨了美德伦理在 AI 对齐中的应用。
AGI Is Not Multimodal
AGI 不是多模态的
文章反思了当前生成式 AI 的局限性,指出仅靠语言模型无法实现真正的 AGI,因为智能需要具身理解。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
形状、对称性与结构:数学在机器学习研究中角色的转变
探讨了机器学习研究从数学驱动向工程驱动的范式转移。
What’s Missing From LLM Chatbots: A Sense of Purpose
LLM 聊天机器人缺失的东西:使命感
尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升,文章认为这是因为 AI 缺乏明确的“使命感”。
We Need Positive Visions for AI Grounded in Wellbeing
我们需要基于福祉的 AI 正面愿景
呼吁构建以人类福祉为核心的 AI 发展愿景,而非仅仅关注技术指标。
Financial Market Applications of LLMs
LLM 在金融市场的应用
探讨了 LLM 在金融序列数据建模中的潜力与挑战。
A Brief Overview of Gender Bias in AI
AI 性别偏见简述
概述了 AI 系统中存在的性别偏见问题及其影响。
Mamba Explained
Mamba 详解
介绍了 Mamba 模型,一种基于状态空间模型(SSM)的 Transformer 替代方案,旨在解决长序列处理效率问题。
Car-GPT: Could LLMs finally make self-driving cars happen?
Car-GPT:LLM 能否最终实现自动驾驶?
探讨了 LLM 在自动驾驶领域的应用前景及关键挑战。
Do text embeddings perfectly encode text?
文本嵌入能完美编码文本吗?
介绍了“Vec2text”技术,该技术能将嵌入还原为文本,强调了嵌入数据安全协议的紧迫性。
arXiv CS.AI
Detecting and Controlling Sycophancy with Cascading Linear Features
利用级联线性特征检测和控制谄媚行为
研究了如何通过激活转向方法检测并控制模型行为,特别是针对模型谄媚(Sycophancy)现象的干预。
Life After Benchmark Saturation: A Case Study of CORE-Bench
基准测试饱和后的生活:CORE-Bench 案例研究
指出基准测试饱和后,应关注代理性能的其他维度,如鲁棒性、泛化能力和效率,而非仅仅追求准确率。
Refusal Lives Downstream of Persona in Chat Models
聊天模型中拒绝行为位于人格设定之后
研究发现,聊天模型的人格设定会影响其拒绝行为, compliant(顺从)的人格设定会抑制模型的拒绝倾向。
AlgoEvolve: LLM-driven Meta-evolution of Algorithmic Trading Programs
AlgoEvolve:LLM 驱动的算法交易程序元进化
将 LLM 作为语义变异算子,应用于算法交易程序的进化发现,应对金融市场的噪声和非平稳性。
Agentic Analysis for Agentic Infrastructure: An LLM-Powered Pipeline for Comparative Governance of DAO and Corporate AI Protocols
代理基础设施的代理分析:用于 DAO 和企业 AI 协议比较治理的 LLM 驱动管道
引入 LLM 驱动的比较管道,用于大规模分析 DAO 和企业 AI 协议的治理话语。
Knowledge-augmented Agentic AI for Mental Health Medication Information Seeking
用于心理健康药物信息检索的知识增强代理 AI
探讨了如何整合权威的药物不良事件记录与患者叙述,为心理健康药物信息检索提供更安全、准确的 AI 支持。
Accelerating Skill Assessment in Chess: A Drift-Diffusion-Enhanced Elo Rating System
加速国际象棋技能评估:漂移扩散增强的 Elo 等级分系统
通过引入逐步移动信息,改进了传统的 Elo 等级分系统,以更准确地评估棋手技能。
Governing Actions, Not Agents: Institutional Attestation as a Governance Model for Autonomous AI Systems
治理行动而非代理:机构证明作为自主 AI 系统的治理模型
提出通过要求独立证明来治理自主 AI 系统的行动,而非仅仅监控其推理过程。
arXiv CS.CL
HierBias: Context-Conditioned Hierarchical Media Bias Detection with Multi-Task Type Classification
HierBias:基于上下文条件的层次化媒体偏见检测与多任务类型分类
提出 HierBias 模型,通过利用句子间的上下文信号,实现更准确的媒体偏见检测。
Know2Guess: A Contamination-Aware Multi-Zone Benchmark for Knowledge-Boundary Evaluation in Large Language Models
Know2Guess:用于 LLM 知识边界评估的污染感知多区域基准
提出 Know2Guess 基准,旨在区分 LLM 的支持性回答与无根据的猜测,并排除数据污染的影响。
Helpfulness Hurts: Domain-Dependent Degradation of Mid-Trained Compassion Values Under Post-Training
乐于助人有害:后训练中 Compassion 价值的领域依赖性退化
研究发现,标准的后训练流程(SFT/RL)可能会无意中削弱模型在预训练中习得的同情心价值。
Investigating LLM’s Problem Solving Capability — a Study on Statics Questions
调查 LLM 的问题解决能力——以静力学问题为例
研究了 LLM 在静力学问题上的表现,揭示了其在教育领域的影响及局限性。
Assert, don’t describe: Linguistic features that shift LLM reasoning about animal welfare
断言而非描述:改变 LLM 关于动物福利推理的语言特征
研究了不同语言特征如何影响 Llama 模型在动物福利问题上的立场偏好。
Context Recycling for Long-Horizon LLM Inference
用于长视距 LLM 推理的上下文回收
提出 ContextForge 系统,通过上下文回收技术,在长对话中保持任务相关信息,克服窗口限制。
Reducing Conversational Escalation in Large Language Model Dialogue with Nonviolent Communication Constraints
利用非暴力沟通约束减少 LLM 对话中的冲突升级
研究了如何通过非暴力沟通约束,减少 LLM 在处理冲突对话时的升级行为。
Low Resource Multimodal Translation of Nepali Spoken Words into Emotion-Conditioned Sign Language Avatars
低资源尼泊尔语口语到情感条件手语化身的模态翻译
提出 NEST-V1 框架,实现了尼泊尔语口语到带有情感表达的手语化身的翻译。
WIRED
Prime Day Deal 2026: Fellow Espresso Series 1 Is $200 Off
Prime Day 2026 优惠:Fellow Espresso Series 1 直降 200 美元
Fellow 系列咖啡机、Aiden 咖啡机和 Stagg 水壶在 Prime Day 期间均有大幅优惠。
Best Prime Day Vacuum Deals Offer Up to 42% Off (2026): Shark, Dyson, Bissell
2026 Prime Day 最佳吸尘器优惠:最高 42% 折扣(Shark, Dyson, Bissell)
盘点了 Prime Day 期间 Shark、Dyson 和 Bissell 等品牌的吸尘器优惠,助力夏季大扫除。
The Best Prime Day Laptop Deals on My Personal Favorites
我个人最喜欢的 Prime Day 笔记本电脑优惠
作者推荐了 Prime Day 期间值得购买的 MacBook 及游戏笔记本电脑。
How People in China Keep Outsmarting Anthropic’s Geolocation Restrictions
中国用户如何持续绕过 Anthropic 的地理位置限制
文章探讨了中国用户如何通过代理服务和 Telegram 购买的虚假身份,绕过 Anthropic 对 Claude 的地理位置限制。
Samsung’s Excellent OLED Monitors Are Up to 36 Percent Off for Prime Day
三星 OLED 显示器 Prime Day 最高 36% 折扣
三星的高端 OLED 游戏显示器在 Prime Day 期间价格创下新低。
Best Ninja Prime Day Deals (2026) Slushi, Creami, Crispi, Cafe Luxe
2026 最佳 Ninja Prime Day 优惠:Slushi, Creami, Crispi, Cafe Luxe
Ninja 系列厨房家电在 Prime Day 期间的促销活动即将结束。
10 Best Prime Day Streaming Deals, Including Half Off Apple TV (2026)
10 个最佳 Prime Day 流媒体优惠,包括半价 Apple TV
除了电视机,Prime Day 还提供了大量流媒体设备和内容的折扣。
How to See the Giant Asteroid That Will Pass by Earth This Weekend
如何观测本周末掠过地球的巨型小行星
文章介绍了观测本周末掠过地球的小行星的时间、地点及所需设备。
I’m Adding These Bose Headphones to My Prime Day Cart (2026)
我把这些 Bose 耳机加入了 Prime Day 购物车
Bose 耳机以其舒适度和降噪效果著称,Prime Day 的折扣使其性价比大增。
The Prime Day MacBook Deals I Recommend (2026)
我推荐的 Prime Day MacBook 优惠
鉴于苹果即将涨价,作者建议消费者抓住 Prime Day 的最后机会购买 MacBook。
Lobsters
Anatomy of a Failed (Nation-State?) Attack
一次失败的(国家级?)攻击剖析
GuixPkgs: every Guix package, as a Nix flake
GuixPkgs:将每个 Guix 包作为 Nix flake
What are you doing this weekend?
这个周末你打算做什么?
Design Patterns Suck
设计模式很烂
All you need is PostgreSQL
你只需要 PostgreSQL
The Exhaustion of Talking to a Tool
与工具对话的疲惫感
Incident Report: CVE-2026-LGTM
事件报告:CVE-2026-LGTM
How PgBouncer Works
PgBouncer 是如何工作的
youre-the-os: A game where you are a computer’s OS
youre-the-os:一款让你扮演计算机操作系统的游戏
Making devenv start fast, and the whole nixpkgs with it - devenv
让 devenv 启动变快,并带动整个 nixpkgs
DEV Community
How I Built a Databricks AI Agent with No Custom Tables (OpenAI Agents SDK + Gradio)
如何在没有自定义表的情况下构建 Databricks AI 代理(OpenAI Agents SDK + Gradio)
作者分享了如何仅使用 Databricks 默认数据集构建 AI 代理,无需复杂的 Unity Catalog 或向量搜索配置。
How Malicious MCP Configs in Amazon Q Developer Could Execute Arbitrary Code — and How to Stop It
Amazon Q Developer 中的恶意 MCP 配置如何执行任意代码——以及如何防范
揭露了 Amazon Q Developer 的一个漏洞,该漏洞允许恶意仓库注入 rogue MCP 配置,从而导致任意代码执行。
Build an AI Audio Translator in Python on Telnyx Inference
在 Telnyx Inference 上使用 Python 构建 AI 音频翻译器
展示了如何利用 Telnyx AI 推理服务构建一个包含转录、翻译和语音生成的完整音频处理循环。
How I built the OSS alternatives directory: GitHub ETL, Turso, and the UPSERT trap I hit
我是如何构建开源替代品目录的:GitHub ETL、Turso 以及我遇到的 UPSERT 陷阱
分享了构建开源替代品目录网站的技术栈及在数据库操作中遇到的挑战。
Four free neural TTS options for CI pipelines — edge-tts, Kokoro, MeloTTS, Bark
CI 流水线的四个免费神经 TTS 选项——edge-tts, Kokoro, MeloTTS, Bark
对比了四种无需 GPU 即可在 GitHub Actions 中运行的免费神经 TTS 方案。
Build a Simple RAG App with Telnyx AI Inference
使用 Telnyx AI Inference 构建简单的 RAG 应用
通过 Python 示例展示了如何利用 Telnyx AI 服务实现端到端的检索增强生成(RAG)流程。
How to Test Email Verification Flows in Python with pytest
如何使用 pytest 在 Python 中测试电子邮件验证流程
探讨了在自动化测试中处理电子邮件验证(如 OTP 或魔法链接)的有效方法。
A Go developer’s take on AI “vibecoding”: Building a secure web utility hub
Go 开发者的“氛围编程”体验:构建安全 Web 工具中心
一名 Go 开发者尝试使用 AI 辅助开发(vibecoding)构建 Node.js 应用,评估其在生产环境中的实用性。
Extract Structured JSON from Messy Text with Telnyx AI Inference
使用 Telnyx AI Inference 从杂乱文本中提取结构化 JSON
展示了如何利用 AI 将非结构化的文本数据转化为可信的 JSON 格式。
I created the simple logger.
我创建了 simple logger
介绍了一个极简的 Go 语言日志记录器,旨在作为标准 logger 的便捷替代品。
Meta Engineering
Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study
AI 原生时代的隐私感知基础设施:资产分类案例研究
探讨了在 AI 系统中如何通过可靠的数据理解来实施隐私控制,以确保数据合规。
How Meta Engineered Ultra-Narrow Batteries for AI Glasses
Meta 如何为 AI 眼镜设计超窄电池
分享了 Meta 如何在智能眼镜有限的镜腿空间内集成高能量密度电池的技术挑战。
Adopting AV1 for Real-Time Communication (RTC) at Scale
在大规模实时通信(RTC)中采用 AV1
介绍了 Meta 在部署 AV1 编解码器以提升实时通信质量方面的技术与运营挑战。
Lights Out, Systems On: Validating Instant Power Loss Readiness
关灯,系统运行:验证瞬时断电准备情况
介绍了 Meta 数据中心应对瞬时断电的测试范式及防御策略。
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems
SilverTorch:索引即模型——推荐系统的新检索范式
介绍了 SilverTorch 架构,通过统一检索组件显著提升了推荐系统的吞吐量和计算效率。
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends:构建可扩展至数十亿用户的社交发现功能
分享了 Facebook 团队在构建“Reel Friends”功能时所做的工程努力。
Migrating Data Ingestion Systems at Meta Scale
Meta 大规模数据摄取系统的迁移
分享了 Meta 在重构数据摄取系统以提升可靠性方面的策略与解决方案。
Labyrinth 1.1: Making End-to-End Encrypted Backups Even More Reliable
Labyrinth 1.1:让端到端加密备份更可靠
介绍了 Labyrinth 1.1 版本,增强了 Messenger 端到端加密备份的可靠性。
How Meta Is Strengthening End-to-End Encrypted Backups
Meta 如何加强端到端加密备份
介绍了基于 HSM 的备份密钥库,为 WhatsApp 和 Messenger 提供 tamper-resistant(防篡改)的加密保护。
DeepMind Blog
Introducing computer use in Gemini 3.5 Flash
在 Gemini 3.5 Flash 中引入计算机使用能力
Unlocking UK house-building with AI-accelerated planning
利用 AI 加速规划,解锁英国住房建设
Securing the future of AI agents
保障 AI 代理的未来
DiffusionGemma: 4x faster text generation
DiffusionGemma:文本生成速度提升 4 倍
Investing in multi-agent AI safety research
投资多代理 AI 安全研究
Fluid, natural voice translation with Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 实现流畅自然的语音翻译
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
推出 Gemma 4 12B:统一的、无编码器的多模态模型
Powering the future of robotics in Europe
助力欧洲机器人技术的未来
Measuring the impact of learning with AI in Sierra Leone and beyond
衡量 AI 学习在塞拉利昂及其他地区的影响
We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks
我们在亚太地区启动 Google DeepMind 加速器计划,以应对环境风险
VentureBeat AI
Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.
谷歌 25 年来首次重新设计搜索框——为什么这比你想象的更重要
谷歌在 I/O 大会上宣布彻底重构搜索框,标志着传统搜索范式的终结。
Railway secures $100 million to challenge AWS with AI-native cloud infrastructure
Railway 融资 1 亿美元,以 AI 原生云基础设施挑战 AWS
Railway 获得 1 亿美元 B 轮融资,旨在通过 AI 原生云平台解决传统云基础设施的局限性。
Claude Code costs up to $200 a month. Goose does the same thing for free.
Claude Code 每月收费高达 200 美元,而 Goose 可以免费实现同样功能
文章对比了 Anthropic 的 Claude Code 与开源替代品 Goose,反映了开发者对高昂 AI 工具费用的不满。
Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews
Listen Labs 在病毒式广告牌招聘活动后融资 6900 万美元,用于扩展 AI 客户访谈
Listen Labs 通过独特的广告牌招聘活动成功吸引人才,并获得融资以扩展其 AI 访谈业务。
Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI
Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域对抗微软和谷歌
Salesforce 重构了 Slackbot,使其从简单的通知工具升级为具备数据搜索和文档处理能力的 AI 代理。
Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required
Anthropic 推出 Cowork,一款无需编码即可处理文件的 Claude 桌面代理
Anthropic 发布 Cowork,旨在让非技术用户也能利用 AI 代理处理本地文件。
Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment
Nous Research 的 NousCoder-14B 是一款开源编码模型,正值 Claude Code 热潮之际发布
Nous Research 发布了 NousCoder-14B,旨在与 proprietary(专有)编码模型竞争。
arXiv CS.LG
Physics-guided Convolutional Neural Network for Domain Growth Prediction in Systems with Conserved Kinetics
用于守恒动力学系统领域增长预测的物理引导卷积神经网络
提出一种物理引导的 CNN 模型,作为传统数值求解器的替代方案,用于预测物理系统的时空演化。
\chisao{}: A GPU-Native Parallel Optimizer for Multimodal Black-Box Functions via Convergence-Anticonvergence Oscillation
\chisao{}:通过收敛-反收敛振荡实现多模态黑盒函数的 GPU 原生并行优化器
提出 \chisao{} 优化器,利用 GPU