2026-06-29
今日要点
- 全球算力格局变动:中国超算“LineShine”登顶全球最快超算榜单,打破了美国长期以来的垄断地位。
- AI 代理与编码工具激战:OpenAI 发布 GPT-5.6 Sol,Anthropic 推出 Cowork,同时开源界出现 Goose 等免费替代方案,AI 编码工具市场竞争进入白热化。
- 监管与合规压力:加州立法禁止流媒体播放过大音量的广告;美国政府对部分高性能 AI 模型(如 Mythos 5)实施出口管制。
- 企业 AI 落地反思:福特汽车因 AI 表现未达预期重新聘用资深工程师;多项研究指出企业在 AI 路由层和 RAG 架构中存在过度优化导致的性能陷阱。
TechCrunch
California law targeting loud streaming ads takes effect on July 1
加州针对流媒体广告音量的法律将于 7 月 1 日生效
加州即将实施一项新规,旨在解决流媒体平台广告音量过大的问题。长期以来,用户在观看流媒体内容时常被突然响起的广告音量困扰,该法律要求流媒体服务商必须将广告音量控制在合理范围内,以提升用户体验。
Ford rehires ‘gray beard’ engineers after AI falls short
福特汽车在 AI 表现不佳后重新聘用资深工程师
福特汽车公司承认,此前过于依赖人工智能来提升产品质量的策略并未达到预期效果。公司高管表示,单纯引入 AI 并不能直接产出高质量产品,因此福特决定重新聘用一批拥有丰富经验的“白胡子”资深工程师,以弥补 AI 在复杂工程决策中的不足。
Writer Ian Bogost says ‘The Small Stuff’ can help us reclaim our lives from too much convenience
作家 Ian Bogost:关注“小事”能帮我们从过度的便利中夺回生活主导权
作家 Ian Bogost 在文章中探讨了硅谷过度追求“便利性”带来的负面影响。他认为,科技行业在构建产品时可能走错了方向,过度追求自动化和便捷反而剥夺了人们生活的质感。他建议人们通过关注生活中的“小事”来重新掌控生活。
TechCrunch Mobility: All eyes on Tesla FSD
TechCrunch 移动出行:特斯拉 FSD 成为焦点
本期 TechCrunch 移动出行专栏聚焦于自动驾驶领域,重点关注特斯拉的全自动驾驶(FSD)技术。随着 AI 在交通领域的深度渗透,特斯拉的进展不仅影响着其自身股价,也成为整个行业衡量自动驾驶技术成熟度的风向标。
Why Wall Street thinks US memory maker Micron is the next Nvidia
华尔街为何认为美国存储芯片制造商美光科技是下一个英伟达
华尔街投资者正在寻找下一个能够从 AI 热潮中获利的芯片巨头,而美光科技(Micron)成为了他们的首选。分析师认为,随着 AI 模型对高性能存储需求的激增,美光在内存市场的地位使其具备了类似英伟达的增长潜力。
Govee’s smart nugget ice maker makes every iced drink feel like a luxury
Govee 推出智能碎冰机,让每一杯冷饮都充满奢华感
Govee 发布了新款 GoveeLife Smart Nugget Ice Maker Pro,售价 500 美元。这款高端智能家居设备专为追求“好冰”(即那种柔软、可咀嚼的碎冰)的用户设计,旨在提升家庭饮品的品质感。
Indian payments chief thinks AI will be heavily involved in next era of digital payment growth
印度支付主管认为 AI 将深度参与数字支付增长的下一个时代
印度统一支付接口(UPI)负责人 Dilip Asbe 表示,AI 将在数字支付的下一阶段发挥关键作用。他认为,通过引入 AI,新型 UPI 应用将能够建立更具竞争力的商业模式,进一步推动数字金融的普及。
Instagram is testing more ways to customize ‘Your Algorithm’
Instagram 正在测试更多自定义“算法”的方法
Instagram 正在开发新的功能,允许用户更精细地调整其信息流算法。此举旨在让用户对所看到的内容拥有更多控制权,从而改善用户在平台上的个性化体验。
SoftBank’s CEO isn’t the only one with questions about Elon Musk’s orbital data center hype
软银 CEO 并非唯一质疑埃隆·马斯克轨道数据中心炒作的人
埃隆·马斯克关于建设轨道数据中心的愿景引发了广泛讨论,但并非所有人都买账。软银 CEO 及其他行业观察家对该项目的可行性、成本效益以及实际需求提出了质疑,认为这可能更多是营销炒作。
Apple Vision Pro exec is reportedly leaving for OpenAI
苹果 Vision Pro 高管据传将离职加入 OpenAI
据报道,负责苹果 Vision Pro 头显业务的副总裁 Paul Meade 即将离职,并将加入 OpenAI 的硬件团队。这一人事变动被视为 OpenAI 进一步加强其硬件研发能力的信号。
The Verge
China’s Z.ai claims it can match Mythos on cybersecurity
中国智谱 AI 声称其模型在网络安全领域可媲美 Mythos
中国智谱 AI(Z.ai)发布了开源模型 GLM-5.2。研究人员指出,该模型在漏洞挖掘和网络安全场景下的表现已能与 Mythos 模型相媲美。尽管在通用任务上仍落后于 Anthropic 和 OpenAI,但中国在 AI 模型能力上的追赶速度令美国政府感到担忧。
Suno launches Spark incubator program to feed independent artists to its AI machine
Suno 推出 Spark 孵化器项目,旨在将独立艺术家引入其 AI 系统
Suno 正在从单纯的 AI 生成工具向流媒体平台转型。其新推出的 Spark 孵化器项目为独立艺术家提供资金、指导和营销支持。然而,该项目附带的条款引发了外界对艺术家版权和 AI 训练数据使用的担忧。
China claims the world’s fastest supercomputer
中国宣称拥有全球最快超级计算机
尽管面临美国的技术贸易限制,中国仍凭借“LineShine”超级计算机重回全球 TOP500 榜首,将美国的 El Capitan 挤下第一名。这是自 2018 年以来中国首次夺回该头衔,且该系统未使用任何 GPU,显示出中国在高性能计算架构上的独特突破。
The Cube is Jim Henson’s little-known proto-Black Mirror masterpiece
《立方体》:吉姆·亨森鲜为人知的《黑镜》原型杰作
文章回顾了吉姆·亨森 1969 年制作的电视短片《立方体》。这部作品风格诡异且具有深刻的哲学隐喻,被认为是现代科幻剧《黑镜》的先驱,展现了亨森在木偶戏之外的艺术深度。
Prosecutors used ChatGPT logs as evidence in the Palisades fire trial
检察官在帕利塞德火灾审判中将 ChatGPT 日志作为证据
在针对 2025 年帕利塞德火灾的纵火案审判中,检察官提交了被告 Jonathan Rinderknecht 的 ChatGPT 使用日志作为证据。日志显示被告曾要求 AI 生成火灾图像,并询问“为什么我总是这么生气”,这些内容被用于证明其作案动机。
Nest’s quest to fix your thermostat
Nest 改造恒温器的探索
本期节目回顾了 Nest 的创业故事。创始人 Tony Fadell 在离开苹果后,通过重新设计恒温器这一看似简单的设备,彻底改变了智能家居行业的格局,并探讨了其对现代家庭自动化带来的深远影响。
Ad-free streaming is a luxury now
无广告流媒体现已成为一种奢侈品
流媒体行业正在发生巨变。曾经作为有线电视替代品的流媒体平台,如今纷纷引入广告模式。文章指出,无广告体验已逐渐演变为一种昂贵的奢侈品,用户不得不为清净的观看环境支付更高费用。
TMD’s keyless bike lock is a $280 solution to a $60 problem
TMD 的无钥匙自行车锁:用 280 美元解决 60 美元的问题
TMD 公司推出了一款售价 280 美元的智能自行车锁。尽管价格昂贵,但凭借其源自 ATM 安全技术的材料、蓝牙近场解锁功能以及保险认可的 ART-2 认证,这款产品试图为高端电动自行车提供更可靠的防盗方案。
Teenage Engineering adds lo-fi mode, USB audio, and more to its KO II sampler
Teenage Engineering 为其 KO II 采样器增加 Lo-Fi 模式、USB 音频等功能
Teenage Engineering 对其 EP-133 KO II 采样器进行了重大更新。OS 2.5 版本增加了 USB 音频传输、采样率选择、采样反转和琶音器等功能,并将单声道采样时长从 20 秒延长至 40 秒,极大地提升了设备的创作灵活性。
Margaret Atwood says the problem with AI is ‘garbage in, garbage out’
玛格丽特·阿特伍德:AI 的问题在于“垃圾进,垃圾出”
著名作家玛格丽特·阿特伍德在采访中直言不讳地批评了 AI。她认为 AI 的核心问题在于其训练数据质量,即“垃圾进,垃圾出”。她对 AI 生成内容的原创性和伦理影响持怀疑态度。
Ars Technica
Why did this journal retract two 1940s papers by Max Planck?
该期刊为何撤回了马克斯·普朗克 1940 年代的两篇论文?
学术界近期撤回了物理学家马克斯·普朗克在 1940 年代发表的两篇论文。期刊方表示,这些论文在学术严谨性上已无法满足现代标准,撤回是为了维护科学记录的纯洁性。
Apple and Audi alumni have made a luxe EV based on the moon buggy
苹果和奥迪校友打造了一款基于月球车的豪华电动车
由苹果和奥迪前员工创立的团队推出了“Amble One”,这是一款售价 2.5 万美元的街头合法电动越野车。其设计灵感源自阿波罗计划的月球车,主要面向高端度假村市场。
South Korea plans to train entire military as “drone warriors”
韩国计划将全军训练为“无人机战士”
韩国国防部宣布了一项雄心勃勃的计划,旨在将 50 万现役军人全部训练为无人机操作员,将无人机打造为军队的“通用作战工具”,以应对现代战争中日益增长的无人化作战需求。
Doctors suspected man had brain cancer. He actually had worms.
医生怀疑男子患有脑癌,结果发现是寄生虫
一名男子因疑似脑癌接受检查,医生在手术中惊恐地发现其大脑中并非肿瘤,而是寄生虫。这一罕见病例提醒医疗界在诊断神经系统疾病时需考虑寄生虫感染的可能性。
Streaming services’ obnoxiously loud ads become illegal on July 1 in California
加州 7 月 1 日起禁止流媒体服务播放音量过大的广告
继伊利诺伊州之后,加州也通过法律禁止流媒体平台播放音量过大的广告。此举旨在迫使广告商和平台优化音频标准,避免对用户造成听觉干扰。
Russian citizens told “switch to Android” after Apple blocks key Russian apps
苹果封锁关键俄语应用后,俄罗斯公民被建议“改用安卓”
在苹果公司因制裁封锁了多款俄罗斯关键应用后,俄罗斯政府公开呼吁民众放弃 iPhone,转而使用安卓设备,以规避西方科技巨头的限制。
NYT slams Microsoft for building copyright-infringing supercomputer for OpenAI
《纽约时报》抨击微软为 OpenAI 构建侵犯版权的超级计算机
《纽约时报》指控微软在为 OpenAI 构建超级计算机的过程中,使用了未经授权的版权内容进行模型训练。该诉讼引用了最高法院关于索尼案的裁决,试图挑战 AI 训练数据的合法性。
FCC accused of hiding Chairman Carr’s messages with DOGE and Musk
FCC 被指隐瞒主席 Carr 与 DOGE 及马斯克的通信记录
美国联邦通信委员会(FCC)被指控拒绝提供主席 Carr 与 DOGE(政府效率部)及埃隆·马斯克之间的通信记录。诉讼称 FCC 浪费了法院一年的时间,试图掩盖其与私人利益相关者之间的互动。
Netflix now requires every user profile to be tied to unique email address
Netflix 现在要求每个用户资料必须绑定唯一的电子邮件地址
Netflix 更新了账户管理政策,要求每个用户资料必须绑定独立的电子邮件地址。此举旨在进一步打击账户共享行为,确保每个用户账户的合规性。
Antibiotic “megacluster” discovery provides new strategy to fight superbugs
抗生素“超级簇”的发现为对抗超级细菌提供了新策略
科学家发现了一组新的抗生素“超级簇”,这为对抗耐药性超级细菌提供了全新的研发方向,被认为是抗生素领域的一项重大进展。
Product Hunt
discode.ai
集成 100 多种 AI 模型于单一界面的环保型 AI 平台。
GetCompress
无需上下文切换的无损媒体压缩工具。
Persona.js
为任何前端应用添加 WebMCP 原生 AI 聊天功能的开发库。
Dotient
本地化语义搜索应用,保护用户隐私。
Lyto
跨浏览器、工具和消息平台的统一 AI 代理。
Nada
仅通过语音即可进行音乐创作的 AI 工具。
RetroMac
将 Mac 电脑变身为“时间机器”的复古风格应用。
Supra Player
快速对比与同步视频的播放器。
Epilogue. Write novels, scripts & poetry
Epilogue:专为严肃作家打造的小说、剧本与诗歌写作应用
Folio AI
号称“类 Claude 的强力版 PowerPoint 插件”。
MIT Technology Review
The Download: brain-melting heatwaves and unprecedented OpenAI restrictions
每日下载:大脑融化的热浪与前所未有的 OpenAI 限制
本期简报关注欧洲极端热浪对人类认知能力的影响,以及 OpenAI 在安全与合规方面面临的最新监管压力。
Heat waves mess with your brain. Scientists are trying to figure out why.
热浪正在扰乱你的大脑,科学家正试图找出原因
研究表明,极端高温不仅影响身体健康,还会直接干扰大脑的认知功能。科学家正在研究高温导致注意力下降和决策失误的生理机制。
Repositioning retail for the AI era
为 AI 时代重新定位零售业
AI 正在重塑零售业,但重点不在于前端的虚拟试衣,而在于后台的供应链优化、库存管理和代码交付效率。
The Download: Europe’s heat wave hits the grid, and IBM’s chip targets Moore’s Law
每日下载:欧洲热浪冲击电网,IBM 芯片挑战摩尔定律
简报讨论了欧洲热浪导致电网负荷过重,以及 IBM 发布的新型高密度芯片如何有望延续摩尔定律。
What Europe’s heat wave means for the power grid
欧洲热浪对电网意味着什么
极端高温导致欧洲电力需求激增,同时高温也迫使部分发电厂停工,电网面临严峻考验。
IBM has unveiled chip technology that could help extend Moore’s Law another decade
IBM 发布芯片技术,有望将摩尔定律再延长十年
IBM 开发出一种新型原型芯片,在指甲盖大小的面积上集成了 1000 亿个晶体管,密度是 2021 年技术的两倍,为未来计算性能的提升奠定了基础。
Europe’s extreme heat is shutting down power plants
欧洲极端高温导致发电厂停工
法国等国因高温导致冷却水温过高,迫使部分核电站和火电站降低功率或停工,加剧了能源供应紧张。
The Download: introducing the Engineering issue
每日下载:工程特刊发布
本期简报介绍了《麻省理工科技评论》的工程特刊,探讨人类如何通过工程创新解决全球性挑战。
Stripe, Anthropic, and OpenAI are backing an effort to stop respiratory infections
Stripe、Anthropic 和 OpenAI 支持对抗呼吸道感染的研究
Stripe 创始人兄弟资助了一项旨在预防普通感冒等呼吸道感染的新研究,旨在通过技术手段解决这一长期困扰人类的健康问题。
The emergence of the web data infrastructure layer for AI
AI 网络数据基础设施层的兴起
随着 AI 对大规模数据的需求增加,构建能够高效处理非结构化网络数据的基础设施层已成为企业竞争的关键。
GitHub Trending
simplex-chat / simplex-chat
首个无需用户标识符的私密即时通讯网络,支持 iOS、Android 和桌面端。
ripienaar / free-for-dev
为 DevOps 和基础设施开发者整理的 SaaS、PaaS 和 IaaS 免费层级清单。
commaai / openpilot
一款机器人操作系统,可为 300 多种车型提供高级驾驶辅助系统升级。
xbtlin / ai-berkshire
基于 Claude Code/Codex 的价值投资研究框架,结合巴菲特、芒格等大师方法论的多 Agent 并行分析系统。
Robbyant / lingbot-map
一种前馈 3D 基础模型,用于从流式数据中重建场景。
DeusData / codebase-memory-mcp
高性能代码智能 MCP 服务器,将代码库索引为持久化知识图谱,支持毫秒级查询。
cupy / cupy
专为 GPU 加速设计的 NumPy 和 SciPy 兼容库。
altic-dev / FluidVoice
macOS 上最快的离线语音转文字应用,完全本地化运行。
opendatalab / MinerU
将 PDF 和 Office 文档转换为 LLM 友好的 Markdown/JSON 格式的工具。
HKUDS / Vibe-Trading
个人交易代理工具,旨在通过 AI 辅助交易决策。
OpenAI Blog
Previewing GPT-5.6 Sol: a next-generation model
预览 GPT-5.6 Sol:下一代模型
OpenAI 预览了 GPT-5.6 Sol,该模型在编码、科学研究和网络安全方面表现出更强的能力,并配备了目前最先进的安全堆栈。
How agents are transforming work
AI 代理如何改变工作方式
OpenAI 的最新研究论文展示了 AI 代理如何通过处理更长、更复杂的任务来提升各行各业的生产力。
OpenAI and Broadcom unveil LLM-optimized inference chip
OpenAI 与博通联合发布 LLM 优化推理芯片
双方共同推出了名为“Jalapeño”的定制 AI 芯片,旨在提升大模型推理的性能、效率和扩展性。
Helping build shared standards for advanced AI
助力构建先进 AI 的共享标准
OpenAI 通过 Appia 基金会支持评估框架和安全实践,推动全球在先进 AI 领域的合作与标准化。
How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mystery
GPT-5 如何帮助免疫学家 Derya Unutmaz 解决困扰三年的谜题
GPT-5 Pro 为免疫学研究提供了关于 T 细胞行为的新见解,帮助科学家解决了困扰三年的科研难题,有望推动癌症和自身免疫疾病的研究。
How Omio is building the future of conversational travel
Omio 如何构建对话式旅行的未来
Omio 利用 OpenAI 技术打造对话式旅行体验,加速产品开发,并转型为 AI 原生公司。
Patch the Planet: a Daybreak initiative to support open source maintainers
“修补地球”:Daybreak 倡议支持开源维护者
OpenAI 推出“Patch the Planet”计划,利用 AI 和专家评审帮助开源维护者发现并修复安全漏洞。
Daybreak: Tools for securing every organization in the world
Daybreak:为全球组织提供安全保障的工具
OpenAI 发布了包括 Codex Security 和 GPT-5.5-Cyber 在内的一系列 Daybreak 工具,帮助企业大规模识别和修补漏洞。
Codex-maxxing for long-running work
Codex 助力长周期工作
文章介绍了 Jason Liu 如何利用 Codex 保持上下文,管理复杂项目,使工作能够跨越单一提示词的限制持续进行。
Samsung Electronics brings ChatGPT and Codex to employees
三星电子为全球员工部署 ChatGPT 和 Codex
三星电子在全球范围内为员工部署了 ChatGPT 企业版和 Codex,这是 OpenAI 迄今为止最大规模的企业 AI 部署之一。
Anthropic Blog
Statement on the US government directive to suspend access to Fable 5 and Mythos 5
关于美国政府暂停 Fable 5 和 Mythos 5 访问权限的声明
美国政府发布出口管制指令,要求暂停所有对 Fable 5 和 Mythos 5 模型的访问权限。
Introducing Claude Tag
推出 Claude Tag
Claude Tag 是一种全新的团队协作方式,旨在提升 Claude 在团队工作流中的应用效率。
Introducing Claude Corps
推出 Claude Corps
Anthropic 启动了 Claude Corps 奖学金项目,旨在支持早期职业人士,将 AI 的益处推广到美国各地的社区。
Expanding Project Glasswing
扩展 Project Glasswing 项目
Anthropic 将 Project Glasswing 项目扩展至全球 15 个国家的约 150 个新组织。
Introducing Claude Opus 4.8
推出 Claude Opus 4.8
Opus 系列模型的升级版,在编码、代理任务和专业工作方面表现更强,并具备处理长周期工作的稳定性。
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
Anthropic 在首尔开设办事处,并宣布与韩国 AI 生态系统建立新合作伙伴关系
Anthropic 正式进军韩国市场,旨在通过本地化合作深化其在亚洲 AI 领域的影响力。
Results from the first Anthropic Public Record
首份 Anthropic 公共记录结果
公布了 Anthropic 在透明度与 AI 安全评估方面的首份公开记录结果。
TCS and Anthropic partner to bring Claude to regulated industries
TCS 与 Anthropic 合作,将 Claude 引入受监管行业
双方合作旨在将 Claude 的能力集成到金融、航空等受监管行业的关键系统中。
DXC will integrate Claude into the systems banks, airlines, and other regulated industries rely on
DXC 将把 Claude 集成到银行、航空公司及其他受监管行业依赖的系统中
DXC 科技公司宣布将 Claude 深度集成至其为大型企业提供的核心业务系统中。
Claude Fable 5 and Claude Mythos 5
Claude Fable 5 与 Claude Mythos 5
Anthropic 推出的两款高性能 AI 模型,旨在处理复杂的逻辑推理与创意任务。
Google AI Blog
Our latest Google Finance upgrades, including a new app
Google 财经最新升级,包括一款新应用
Google 财经正式结束测试,并推出了全新的 Android 应用,提供更强大的金融数据分析功能。
New research shows how AMIE, our medical AI, could help manage health conditions.
新研究显示医疗 AI AMIE 如何助力健康状况管理
发表在《Nature》上的研究表明,Google 的对话式医疗 AI 系统 AMIE 在复杂疾病管理方面的表现已能媲美初级保健医生。
We’re strengthening our presence in Alabama through new investments and community support.
我们通过新投资和社区支持加强在阿拉巴马州的布局
Google 宣布投资 15 亿美元扩建其位于阿拉巴马州杰克逊县的数据中心园区。
Our new community investments in Virginia support local jobs and expand energy affordability.
我们在弗吉尼亚州的新社区投资支持当地就业并扩大能源可负担性
Google 致力于通过投资能源项目和劳动力培训,支持弗吉尼亚州的社区发展。
The latest AI news we announced in May 2026
2026 年 5 月 Google AI 最新动态汇总
回顾了 Google 在 5 月份发布的各项 AI 技术更新。
5 ways Google Search can level up your thrift and vintage shopping
Google 搜索提升二手与复古购物体验的 5 种方法
利用 AI 工具,Google 搜索和购物功能现在能更精准地帮助用户发现二手商品。
How we used Gemini to build Google I/O 2026
我们如何利用 Gemini 构建 Google I/O 2026
分享了 Google 团队如何利用 AI 技术辅助策划和执行 Google I/O 2026 大会。
Take our I/O 2026 quiz, vibe coded in Google AI Studio.
参与我们的 I/O 2026 测验,体验 Google AI Studio 的“氛围编程”
Google 使用 AI Studio 快速构建了一款关于 I/O 大会公告的互动测验。
9 demos of Gemini Omni and Gemini 3.5 in action
9 个 Gemini Omni 和 Gemini 3.5 的实战演示
展示了在 Google I/O 2026 上发布的 Gemini Omni 和 Gemini 3.5 的强大功能。
Check out real-life AI prototypes from the Futures Lab.
探索 Futures Lab 的真实 AI 原型
展示了滑铁卢大学学生开发的 AI 原型,如手语导师,旨在重塑教育和工作的未来。
Hugging Face Blog
Run a vLLM Server on HF Jobs in One Command
一键在 HF Jobs 上运行 vLLM 服务器
Which tokens does a hybrid model predict better?
混合模型在哪些 Token 上的预测表现更好?
Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel
使用 NVIDIA NeMo AutoModel 加速 Transformer 微调
Introducing the FFASR Leaderboard: Benchmarking ASR in the Real World
推出 FFASR 排行榜:真实世界中的 ASR 基准测试
Build real agentic apps using CUGA: two dozen working examples on a lightweight harness
使用 CUGA 构建真实的代理应用:轻量级框架下的 24 个工作示例
Shipping huggingface_hub every week with AI, open tools, and a human in the loop
每周发布 huggingface_hub:结合 AI、开源工具与人工审核
Experimenting with the proposed Cross-Origin Storage API in Transformers.js
在 Transformers.js 中试验跨源存储 API
PP-OCRv6 on Hugging Face: 50-Language OCR from 1.5M to 34.5M Parameters
Hugging Face 上的 PP-OCRv6:支持 50 种语言,参数量从 1.5M 到 34.5M
We got local models to triage the OpenClaw repo for FREE!*
我们利用本地模型免费对 OpenClaw 仓库进行了分类整理!
MosaicLeaks: Can your research agent keep a secret?
MosaicLeaks:你的研究代理能保守秘密吗?
The Gradient
After Orthogonality: Virtue-Ethical Agency and AI Alignment
正交性之后:美德伦理代理与 AI 对齐
文章探讨了理性代理的本质,认为人类行为并非由单一目标驱动,而是由实践网络构成,并以此视角审视 AI 对齐问题。
AGI Is Not Multimodal
AGI 不是多模态的
文章反驳了“多模态即 AGI”的观点,强调人类智能根植于具身理解,单纯的语言模型无法完全模拟人类思维。
Shape, Symmetries, and Structure: The Changing Role of Mathematics in Machine Learning Research
形状、对称性与结构:数学在机器学习研究中角色的转变
探讨了机器学习研究从数学驱动向工程驱动的范式转移,分析了大规模计算对架构设计的影响。
What’s Missing From LLM Chatbots: A Sense of Purpose
LLM 聊天机器人缺失的东西:目标感
尽管 LLM 在基准测试中表现优异,但用户体验并未同步提升,文章认为 AI 缺乏真正的“目标感”是核心瓶颈。
We Need Positive Visions for AI Grounded in Wellbeing
我们需要基于福祉的 AI 正向愿景
呼吁科技界超越技术炒作,构建以人类福祉为核心的 AI 发展愿景。
Financial Market Applications of LLMs
LLM 在金融市场的应用
分析了 LLM 在金融序列数据建模、市场分析及自动化交易中的潜力与挑战。
A Brief Overview of Gender Bias in AI
AI 性别偏见简述
概述了 AI 模型中存在的性别偏见问题及其对社会公平的影响。
Mamba Explained
Mamba 模型详解
解释了 Mamba 这一基于状态空间模型(SSM)的新型架构,及其在处理长序列任务中优于 Transformer 的特性。
Car-GPT: Could LLMs finally make self-driving cars happen?
Car-GPT:LLM 能否最终实现自动驾驶?
探讨了将大语言模型引入自动驾驶系统的可行性及其面临的关键挑战。
Do text embeddings perfectly encode text?
文本嵌入能完美编码文本吗?
通过“Vec2text”技术展示了嵌入向量还原为文本的可能性,强调了嵌入数据安全协议的紧迫性。
WIRED
What to Do in Houston If You’re Here for Business (2026)
2026 年休斯顿商务旅行指南
为前往“太空城”休斯顿进行商务活动的读者提供餐饮、住宿及工作建议。
The ‘Almost Homeless’ Subreddit Is a Stark Glimpse at Soaring Wealth Inequality
“准无家可归者” Subreddit:财富不平等加剧的严峻缩影
随着亿万富翁阶层财富激增,在线社区中关于如何以极低成本生存的讨论日益增多,反映了社会贫富差距的扩大。
Why Wear Anything Other Than a Sun Hoodie This Summer? Our Picks for the Best
为什么夏天不穿防晒连帽衫?最佳防晒衣推荐
防晒连帽衫被认为是继传统连帽衫之后最伟大的服装发明,文章推荐了多款适合夏季穿着的防晒单品。
This Is the Most Detailed Image Yet of the Milky Way’s Center
银河系中心最详细的图像
欧几里得空间望远镜拍摄了银河系“拥挤心脏”的震撼照片,捕捉到了超过 6000 万颗恒星。
The Ebike Accessories You Need to Help You Haul the Most Stuff
提升电动自行车货运能力的必备配件
为电动自行车用户提供最大化载货和载人能力的配件选购指南。
China Defies US Restrictions and Builds the World’s Fastest Supercomputer
中国无视美国限制,建成全球最快超级计算机
中国超级计算机 LineShine 在不使用 GPU 的情况下登顶全球最快超算榜单,显示出中国在高性能计算领域的韧性。
62 Last Minute Prime Day Weekend Deals: Up to 45% Off (2026)
62 个 Prime Day 周末限时优惠:最高 4.5 折
Prime Day 虽然结束,但部分精选优惠在周末依然有效。
Duer’s Wear-Everywhere Pants Are on Sale This Weekend
Duer 的全能长裤周末特惠
加拿大户外品牌 Duer 的高性能长裤正在进行罕见的折扣促销。
Does DeleteMe Actually Get Your Info off the Internet? I Tried It
DeleteMe 真能从互联网上删除你的信息吗?我的实测
测试了个人信息删除服务 DeleteMe 的实际效果,探讨其在应对垃圾信息和隐私泄露方面的作用。
Security News This Week: LastPass Users Had Their Data Stolen—Again
本周安全新闻:LastPass 用户数据再次被盗
报道了 LastPass 数据泄露事件、前国家安全顾问约翰·博尔顿认罪案以及微软打击信息窃取基础设施的行动。
Lobsters
Towards Understandable Software
迈向可理解的软件
探讨如何构建更易于理解和维护的软件系统。
How VictoriaLogs Stores Your Logs in a Columnar Layout
VictoriaLogs 如何以列式布局存储日志
技术解析 VictoriaLogs 的列式存储架构及其性能优势。
A peek into Reddit’s anti-spam internals
深入了解 Reddit 的反垃圾邮件内部机制
揭秘 Reddit 如何利用内部系统识别和过滤垃圾信息。
A Typed, Algebraic Approach to Parsing (2019)
一种类型化的代数解析方法
回顾 2019 年关于解析器构建的经典学术论文。
Regular expressions that work “everywhere”
在任何地方都能工作的正则表达式
探讨如何编写跨平台兼容的正则表达式。
Data Access Patterns That Makes Your CPU Really Angry
让 CPU 愤怒的数据访问模式
分析导致 CPU 缓存失效和性能下降的低效数据访问模式。
Installing SerenityOS on My Old ThinkPad T60
在我的旧 ThinkPad T60 上安装 SerenityOS
分享在老旧硬件上安装 SerenityOS 的折腾经历。
The feature in OxCaml that more languages should steal
OxCaml 中值得其他语言借鉴的特性
介绍 OxCaml 语言中一个独特且高效的编程特性。
Building an Open-Source Robot Vacuum — Meet oomwoo
构建开源扫地机器人:认识 oomwoo
介绍一个开源扫地机器人项目 oomwoo 的开发过程。
Prism: An Impure Functional Language With Typed Effects
Prism:一种带有类型化效应的非纯函数式语言
介绍 Prism 语言的设计理念及其在处理副作用方面的创新。
DEV Community
Every Dream Has a Limit
每个梦想都有极限
探讨 AI 代理在处理复杂任务时遇到的瓶颈,提醒开发者不要过度沉迷于“代理自动化”的幻觉。
Building a Production Grade Authentication System with NestJS
使用 NestJS 构建生产级身份验证系统
详细指南:如何利用 NestJS 的架构优势构建安全、可扩展的身份验证系统。
Slack or Telegram for solo founder alerts? I was asking the wrong question.
独立开发者报警用 Slack 还是 Telegram?我问错了问题
分析了不同报警工具的适用场景,指出选择工具应基于触发的动作而非个人习惯。
Building PocketDex Tracker: A Next.js and Supabase App for Pokemon TCG Pocket Collections
构建 PocketDex Tracker:基于 Next.js 和 Supabase 的宝可梦卡牌收集应用
分享了一个全栈应用的开发过程,涵盖了 Next.js、Supabase 及 UI 组件的使用。
State of FinTech Compliance Cost 2026: What Industry Data Tells Us About PCI DSS, SOC 2 and Multi-State MTL
2026 年金融科技合规成本现状:行业数据揭示的 PCI DSS、SOC 2 与 MTL 支出
分析了金融科技公司在合规方面的成本构成及驱动因素。
Meet Cozy Café
认识 Cozy Café
Discord 机器人开发系列教程第二部分,介绍如何为机器人构建基础架构。
Give Your Claude an Email Mailbox
给你的 Claude 一个电子邮箱
教程:如何通过代码为 Claude 代理配置专属邮箱,实现自动化邮件处理。
World Cup 2026: The 48-Team Format Just Created a Statistical Trap Nobody’s Talking About [Jun 29]
2026 世界杯:48 队赛制制造了一个无人提及的统计陷阱
分析了世界杯 16 组 3 队赛制下存在的统计学漏洞,指出该赛制可能导致强队被意外淘汰。
Internal First, Portfolio Second
先内部后投资组合
探讨私募股权公司在 AI 转型中的策略顺序,强调内部试点对成功的重要性。
How to Implement AI in Business Without Wasting a Quarter
如何在不浪费一个季度的情况下在业务中实施 AI
强调 AI 实施应聚焦于利润、吞吐量和客户体验,而非盲目进行实验。
Meta Engineering
Privacy-Aware Infrastructure in the AI-Native Era: An Asset Classification Case Study
AI 原生时代的隐私感知基础设施:资产分类案例研究
探讨了在 AI 时代如何通过资产分类实现有效的隐私控制和数据治理。
How Meta Engineered Ultra-Narrow Batteries for AI Glasses
Meta 如何为 AI 眼镜设计超窄电池
揭秘 Meta 如何在智能眼镜的镜腿中塞入足够驱动 AI 工作负载的电池。
Adopting AV1 for Real-Time Communication (RTC) at Scale
在大规模实时通信中采用 AV1 编码
分享了 Meta 在 RTC 系统中部署 AV1 编码的技术挑战及优化方案。
Lights Out, Systems On: Validating Instant Power Loss Readiness
关灯,系统运行:验证瞬时断电准备情况
介绍 Meta 的“瞬时断电风暴”测试范式,用于提升数据中心对突发断电的容错能力。
SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems
SilverTorch:索引即模型——推荐系统的新检索范式
介绍一种统一的推荐系统架构,显著提升了吞吐量和计算效率。
Reel Friends: Building Social Discovery that Scales to Billions
Reel Friends:构建可扩展至数十亿用户的社交发现功能
分享 Facebook 如何通过工程手段实现大规模社交发现功能。
Migrating Data Ingestion Systems at Meta Scale
Meta 大规模数据摄取系统的迁移
分享了 Meta 在重构数据摄取系统时的策略与技术实践。
Labyrinth 1.1: Making End-to-End Encrypted Backups Even More Reliable
Labyrinth 1.1:让端到端加密备份更可靠
介绍 Messenger 加密存储系统 Labyrinth 的更新,提升了备份在设备更换等场景下的可靠性。
How Meta Is Strengthening End-to-End Encrypted Backups
Meta 如何加强端到端加密备份
介绍基于 HSM 的备份密钥库,确保用户备份数据的安全性与隐私性。
DeepMind Blog
Introducing computer use in Gemini 3.5 Flash
在 Gemini 3.5 Flash 中引入计算机使用能力
Unlocking UK house-building with AI-accelerated planning
利用 AI 加速规划,解锁英国住房建设
Securing the future of AI agents
保障 AI 代理的未来
DiffusionGemma: 4x faster text generation
DiffusionGemma:文本生成速度提升 4 倍
Investing in multi-agent AI safety research
投资多代理 AI 安全研究
Fluid, natural voice translation with Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 实现流畅自然的语音翻译
Introducing Gemma 4 12B: a unified, encoder-free multimodal model
推出 Gemma 4 12B:统一的无编码器多模态模型
Powering the future of robotics in Europe
助力欧洲机器人技术的未来
Measuring the impact of learning with AI in Sierra Leone and beyond
衡量 AI 学习在塞拉利昂及其他地区的影响
We’re launching the Google DeepMind Accelerator program in Asia Pacific to tackle environmental risks
我们在亚太地区启动 Google DeepMind 加速器项目以应对环境风险
VentureBeat AI
Google just redesigned the search box for the first time in 25 years — here’s why it matters more than you think.
Google 25 年来首次重新设计搜索框——其重要性远超你的想象
Google 在 I/O 大会上正式退休了经典的搜索框范式,将其转变为更具交互性的 AI 界面。
Railway secures $100 million to challenge AWS with AI-native cloud infrastructure
Railway 融资 1 亿美元,以 AI 原生云基础设施挑战 AWS
Railway 完成 1 亿美元 B 轮融资,旨在解决传统云基础设施在 AI 应用需求下的局限性。
Claude Code costs up to $200 a month. Goose does the same thing for free.
Claude Code 每月收费高达 200 美元,而 Goose 提供免费替代方案
开源工具 Goose 的出现为开发者提供了 Claude Code 的免费替代选择,引发了对 AI 编码工具定价的讨论。
Listen Labs raises $69M after viral billboard hiring stunt to scale AI customer interviews
Listen Labs 融资 6900 万美元,此前曾通过病毒式广告牌招聘活动扩大 AI 客户访谈规模
Listen Labs 通过独特的招聘广告牌吸引了大量人才,并成功完成融资。
Salesforce rolls out new Slackbot AI agent as it battles Microsoft and Google in workplace AI
Salesforce 推出全新 Slackbot AI 代理,在办公 AI 领域与微软和 Google 展开竞争
Salesforce 重构了 Slackbot,使其从通知工具升级为具备数据搜索、文档起草和任务执行能力的 AI 代理。
Anthropic launches Cowork, a Claude Desktop agent that works in your files — no coding required
Anthropic 发布 Cowork,一款无需编码即可在本地文件工作的 Claude 桌面代理
Cowork 允许非技术用户直接通过 Claude 桌面端处理本地文件,进一步降低了 AI 代理的使用门槛。
Nous Research’s NousCoder-14B is an open-source coding model landing right in the Claude Code moment
Nous Research 的 NousCoder-14B:一款在 AI 编码热潮中发布的开源模型
Nous Research 发布了高性能开源编程模型 NousCoder-14B,旨在与 proprietary 系统竞争。
Towards Data Science
Tail Control: The Counterintuitive Engineering of Reliable Agentic Workflows
尾部控制:可靠代理工作流的反直觉工程
探讨如何通过控制延迟的“尾部”分布,而非单纯追求速度,来构建可靠的 AI 代理工作流。
I Pitted XGBoost Against Logistic Regression on 358 Matches. The Boring Model Won.
我在 358 场比赛中对比了 XGBoost 和逻辑回归,结果“无聊”的模型赢了
通过实战案例分析偏差-方差权衡,指出在特定场景下简单模型往往优于复杂模型。
We Built a Routing Layer to Cut Our AI Costs. It Broke the Product.
我们构建了路由层以削减 AI 成本,结果产品崩溃了
分析了 AI 路由层带来的 Pareto 陷阱,指出过度优化成本会导致产品质量下降。
How to Build a Powerful LLM Knowledge Base
如何构建强大的 LLM 知识库
分享如何利用编码代理来增强知识库的构建与管理。
From Local LLM to Tool-Using Agent
从本地 LLM 到工具使用代理
教程:利用 Gemma 4、Ollama 和 OpenAI Agents SDK 构建轻量级研究代理。
Water Cooler Small Talk, Ep. 11: Overfitting in RAG evaluation
饮水机闲谈第 11 期:RAG 评估中的过拟合
探讨 RAG 评估中存在的“死记硬背”现象及其对模型理解能力的误导。
Amplify the Expert: A Philosophy for Building Enterprise RAG
放大专家:构建企业级 RAG 的哲学
探讨企业级文档智能架构设计的核心理念。
How to Ace Data and ML Behavioural Interviews
如何在数据与 ML 行为面试中脱颖而出
提供数据科学与机器学习岗位行为面试的准备策略。
Vector RAG Isn’t Enough — I Built a Context Graph Layer for Multi-Agent Memory
向量 RAG 不够用——我为多代理记忆构建了上下文图层
对比了向量 RAG 与上下文图层在多代理对话中的表现,揭示了关系检索的优势。
The Hot Path Belongs to GBDTs, Agents Own the Cold Path: A Payment-Fraud Benchmark
热路径属于 GBDT,冷路径属于代理:支付欺诈基准测试
通过基准测试分析了 GBDT 与 AI 代理在不同业务路径下的性能与成本表现。