AI 日报 2026-06-01

今日热点

Anthropic 完成 650 亿美元 H 轮融资,估值逼近 9000 亿美元超越 OpenAI;OpenAI Codex 正式登陆 Windows,AI 操控电脑时代到来;GitHub 上多个 AI Agent 框架和工具集中爆发——Compound Engineering 插件、Oh-My-Pi 终端 Agent 等新项目强势崛起。与此同时,NVIDIA 发布 Cosmos 3 物理 AI 世界模型,1-Bit 图像生成模型让 4B 参数模型也能跑在本地设备上。AI 领域正在从”大模型竞赛”转向”Agent + 工具 + 端侧智能”的全面落地阶段。


GitHub 热门 AI 项目

1. supermemoryai/supermemory 🌟

⭐ 23,737 stars | +660 today | TypeScript

超级记忆引擎,号称”AI 时代的 Memory API”。这个项目提供了一个极速、可扩展的记忆存储和检索层,让 AI 应用能够持久化用户记忆并在对话中回忆。对于构建个性化 AI 助手来说,这是基础设施级别的项目。它的核心卖点就是速度可扩展性——不是简单包装向量数据库,而是从底层做了深度优化。

技术栈: TypeScript, Vector DB, OpenAI/Anthropic Embeddings

应用场景:

  • 长期记忆型聊天机器人
  • 跨会话用户偏好管理
  • Agent 知识召回系统

2. D4Vinci/Scrapling 🕷️

⭐ 57,602 stars | +1,475 today | Python

自适应的 Web 抓取框架,能处理从单次请求到全站爬虫的所有需求。今天暴增 1475 stars,热度爆炸。对于 AI 应用来说,高质量数据源是稀缺资源,Scrapling 解决了从网页中提取结构化数据的痛点。

应用场景: AI 训练数据采集、RAG 系统的数据管道、竞争情报监控

3. EveryInc/compound-engineering-plugin 🔌

⭐ 18,980 stars | +428 today | TypeScript

Compound Engineering 的官方插件,支持 Claude Code、Codex、Cursor 等多个 AI 编码工具。它提供了一种”组合式工程”的方法论——将复杂任务拆解为多个子 Agent 各司其职,每个 Agent 专注于特定领域。这是一个典型的 Agent 编排框架。

graph TD
A[开发者需求] --> B[Compound Engineering Plugin]
B --> C[Claude Code Agent]
B --> D[Codex Agent]
B --> E[Cursor Agent]
C --> F[前端模块]
D --> G[后端API]
E --> H[数据库操作]
F --> I[最终产品]
G --> I
H --> I
style A fill:#f9f,stroke:#333,stroke-width:2px
style B fill:#bbf,stroke:#333,stroke-width:2px
style I fill:#bfb,stroke:#333,stroke-width:2px

4. can1357/oh-my-pi 💻

⭐ 9,311 stars | +333 today | TypeScript

一个面向终端的 AI 编码 Agent,特色是 hash-anchored edits(哈希锚定编辑)、优化的工具链、集成 LSP、浏览器、子 Agent 等功能。可以理解为”终端里的 Cursor”——直接在命令行中通过 AI 辅助编写和修改代码。

技术亮点:

  • 哈希锚定编辑:确保 AI 修改的文件版本准确,避免并发冲突
  • 多工具集成:LSP 智能提示 + 浏览器自动化 + 文件系统操作
  • 子 Agent 架构:复杂任务可派生子 Agent 并行处理

5. revfactory/harness 🔧

⭐ 4,977 stars | +527 today | HTML

一个”元技能(meta-skill)”工具,用于设计领域特定的 Agent 团队。它定义专门化的 Agent,并生成 Agent 所需的技能。本质上是Agent 的制造工厂——你只需要描述业务需求,Harness 就会自动设计出由多个专精 Agent 组成的协作团队。

flowchart LR
A[业务需求描述] --> B[Harness 元技能引擎]
B --> C{Agent 团队设计}
C --> D[数据分析 Agent]
C --> E[代码开发 Agent]
C --> F[测试验证 Agent]
D --> G[技能生成]
E --> G
F --> G
G --> H[可部署的 Agent 团队]
style A fill:#e1f5fe
style B fill:#ffcc80
style H fill:#c8e6c9

6. FareedKhan-dev/train-llm-from-scratch 🤖

⭐ 3,472 stars | +860 today | Jupyter Notebook

一个从零训练 LLM 的实用教程,涵盖从数据下载到文本生成的全流程。860 的日增显示社区对”理解 LLM 底层”的需求依然强烈。项目特点是注重实操——不是堆理论,而是提供可运行的代码和清晰的步骤说明。

覆盖内容:

  • 数据采集与清洗
  • Tokenization 方案
  • 模型架构搭建(Transformer)
  • 训练与微调
  • 推理部署

7. TauricResearch/TradingAgents 💹

多 Agent LLM 金融交易框架

结合 LLM 和多智能体系统的量化交易框架。每个 Agent 负责不同的分析角色(技术分析、基本面分析、风险管理等),通过 Agent 间的协作达成交易决策。这是 AI Agent 在金融领域的一个落地标杆。

8. OpenBMB/VoxCPM 🗣️

无 Tokenizer 的多语言语音生成

清华 OpenBMB 团队的新作,VoxCPM2 主打 Tokenizer-Free TTS。无需分词器即可生成多语言语音,支持创意语音设计和真实人声克隆。在 TTS 领域是一次重要的架构简化。

9. p-e-w/heretic ✂️

语言模型的自动审查移除

一个颇有争议但技术含量很高的项目——自动移除语言模型中的审查机制。该项目本质上是做模型编辑(model editing),在保持模型性能的同时抹去安全对齐层。


新工具/产品速览

OpenAI Codex 正式登陆 Windows

Codex 的计算机使用(Computer Use)功能扩展到 Windows 平台。它能”看”到屏幕并执行操作——打开应用、操作文件、填写表单。更贴心的是:你可以通过 ChatGPT App 远程查看和审批 Codex 的任务进度。

Microsoft AI “超级应用” 正在酝酿

据 Fortune 报道,微软正在打造一个整合 GitHub Copilot、Copilot 聊天机器人、Copilot Cowork 以及内部名为 “Autopilot” 的新 Agent 工作流能力的超级应用。这将是微软版本的 OpenAI 超级应用战略。

Anthropic H 轮融资 650 亿,估值 9000 亿

Anthropic 完成 650 亿美元 Series H 融资,估值 9000 亿美元,超越 OpenAI 的 7300 亿估值。资金将投入安全研究、算力扩展和产品规模化。AI 军备竞赛进入资本密集阶段。

NVIDIA Cosmos 3 — 物理 AI 世界模型

NVIDIA 发布 Cosmos 3,面向物理 AI 推理的世界模型和行动模型。这是为机器人、自动驾驶等物理世界应用准备的视觉推理基础模型。

Figma Make 现在能编辑生产代码了

Figma Make 连接生产或沙箱仓库,用可视化界面直接编辑真实代码。设计师和开发者之间的墙正在倒塌。

OpenAI 正在淘汰 Canvas 界面

GPT-5.5 不再支持 Canvas,原因是新模型本身的交互方式已足够高效。同时 OpenAI 正在精简 GPT-5.5 Instant 的回复长度,减少”弹幕式”文本。


行业动态

🏛️ 伊利诺伊州 AI 安全法通过

伊利诺伊州议会通过 AI 安全法案,要求 AI 公司进行独立审计并设立举报人保护制度。该法案比加州和纽约的类似法律覆盖面更广,州长 Pritzker 已表示将签署。AI 立法正在从”自愿承诺”走向”强制执行”。

🚨 ChatGPT for Google Sheets 数据泄露事件

安全公司 PromptArmor 披露,ChatGPT for Google Sheets 插件存在数据外泄风险——它会将整个工作簿内容传输至外部服务器。267 points 的 HN 热度说明社区对 AI 插件安全的关注度持续升高。

💡 Google 新增 Gemini 聊天分享功能

Google Workspace 即将允许用户通过 Google Drive 分享 Gemini 对话快照。接收方可继续对话,但修改不会影响原拥有者的对话线程。6 月 3 日起逐步推送。

🔥 Amazon 关停 AI 使用排行榜

Amazon 内部曾有一个追踪员工 AI 使用率的排行榜,结果导致员工为了让 AI Agent 做无意义任务以刷排名。最终 Amazon 关停了该工具,高管明确表示”不要为了用 AI 而用 AI”。


技术洞见

趋势一:Agent 架构从”单体”走向”技能工厂”

今天 GitHub 上的多个热门项目指向同一个趋势:Agent 不再是一个黑盒,而是一个被动态组装的能力单元

项目 核心理念
revfactory/harness 根据需求自动生成 Agent 团队和技能
Compound Engineering Plugin 跨工具 Agent 编排
oh-my-pi 终端内子 Agent 协作
TradingAgents 金融领域的多角色 Agent 协作

这些项目的共同思路是:Agent = 技能 + 协作协议,而非一个巨大的 prompt。

flowchart TB
subgraph "传统单体 Agent"
A1[巨大 Prompt] --> A2[单一 LLM]
A2 --> A3[有限能力]
end

subgraph "新型技能工厂架构"
B1[需求描述] --> B2[元技能引擎]
B2 --> B3[技能1: 代码编写]
B2 --> B4[技能2: 数据分析]
B2 --> B5[技能3: 浏览器操作]
B2 --> B6[技能4: 文件管理]
B3 & B4 & B5 & B6 --> B7[编排层/协议]
B7 --> B8[输出]
end

style A1 fill:#ffcdd2
style A3 fill:#ffcdd2
style B2 fill:#bbdefb
style B7 fill:#c8e6c9
style B8 fill:#c8e6c9

趋势二:端侧 AI + 物理世界落地加速

从 NVIDIA Cosmos 3(物理世界模型)、1-Bit Bonsai Image 4B(本地图像生成)、到 VoxCPM(端侧 TTS),再到 “A 10 year old Xeon is all you need”(2016 年的 Xeon 也能跑 Gemma 4)——AI 正在从云端的”巨无霸”走向本地的”小精灵”。端侧推理、物理世界交互、老旧硬件焕新,这些信号说明 AI 的部署范式正在发生根本性转变。


结语

2026 年 6 月的第一天,AI 领域的步伐没有停歇。Anthropic 的估值神话、Agent 技术的”工厂化”演进、AI 立法从州到联邦的铺开,以及端侧部署的加速——这一天向我们展示了一个正在快速裂变和落地的 AI 生态。明天又会有什么惊喜?敬请关注。


本文由 AI 自动生成,数据来源:GitHub Trending、Hacker News、The Verge