AI 日报 2026-06-01

今日热点

Anthropic 完成 650 亿美元 H 轮融资，估值逼近 9000 亿美元超越 OpenAI；OpenAI Codex 正式登陆 Windows，AI 操控电脑时代到来；GitHub 上多个 AI Agent 框架和工具集中爆发——Compound Engineering 插件、Oh-My-Pi 终端 Agent 等新项目强势崛起。与此同时，NVIDIA 发布 Cosmos 3 物理 AI 世界模型，1-Bit 图像生成模型让 4B 参数模型也能跑在本地设备上。AI 领域正在从”大模型竞赛”转向”Agent + 工具 + 端侧智能”的全面落地阶段。

GitHub 热门 AI 项目

1. supermemoryai/supermemory 🌟

⭐ 23,737 stars | +660 today | TypeScript

超级记忆引擎，号称”AI 时代的 Memory API”。这个项目提供了一个极速、可扩展的记忆存储和检索层，让 AI 应用能够持久化用户记忆并在对话中回忆。对于构建个性化 AI 助手来说，这是基础设施级别的项目。它的核心卖点就是速度和可扩展性——不是简单包装向量数据库，而是从底层做了深度优化。

技术栈： TypeScript, Vector DB, OpenAI/Anthropic Embeddings

应用场景：

长期记忆型聊天机器人
跨会话用户偏好管理
Agent 知识召回系统

2. D4Vinci/Scrapling 🕷️

⭐ 57,602 stars | +1,475 today | Python

自适应的 Web 抓取框架，能处理从单次请求到全站爬虫的所有需求。今天暴增 1475 stars，热度爆炸。对于 AI 应用来说，高质量数据源是稀缺资源，Scrapling 解决了从网页中提取结构化数据的痛点。

应用场景： AI 训练数据采集、RAG 系统的数据管道、竞争情报监控

3. EveryInc/compound-engineering-plugin 🔌

⭐ 18,980 stars | +428 today | TypeScript

Compound Engineering 的官方插件，支持 Claude Code、Codex、Cursor 等多个 AI 编码工具。它提供了一种”组合式工程”的方法论——将复杂任务拆解为多个子 Agent 各司其职，每个 Agent 专注于特定领域。这是一个典型的 Agent 编排框架。

graph TD
    A[开发者需求] --> B[Compound Engineering Plugin]
    B --> C[Claude Code Agent]
    B --> D[Codex Agent]
    B --> E[Cursor Agent]
    C --> F[前端模块]
    D --> G[后端API]
    E --> H[数据库操作]
    F --> I[最终产品]
    G --> I
    H --> I
    style A fill:#f9f,stroke:#333,stroke-width:2px
    style B fill:#bbf,stroke:#333,stroke-width:2px
    style I fill:#bfb,stroke:#333,stroke-width:2px

4. can1357/oh-my-pi 💻

⭐ 9,311 stars | +333 today | TypeScript

一个面向终端的 AI 编码 Agent，特色是 hash-anchored edits（哈希锚定编辑）、优化的工具链、集成 LSP、浏览器、子 Agent 等功能。可以理解为”终端里的 Cursor”——直接在命令行中通过 AI 辅助编写和修改代码。

技术亮点：

哈希锚定编辑：确保 AI 修改的文件版本准确，避免并发冲突
多工具集成：LSP 智能提示 + 浏览器自动化 + 文件系统操作
子 Agent 架构：复杂任务可派生子 Agent 并行处理

5. revfactory/harness 🔧

⭐ 4,977 stars | +527 today | HTML

一个”元技能（meta-skill）”工具，用于设计领域特定的 Agent 团队。它定义专门化的 Agent，并生成 Agent 所需的技能。本质上是Agent 的制造工厂——你只需要描述业务需求，Harness 就会自动设计出由多个专精 Agent 组成的协作团队。

flowchart LR
    A[业务需求描述] --> B[Harness 元技能引擎]
    B --> C{Agent 团队设计}
    C --> D[数据分析 Agent]
    C --> E[代码开发 Agent]
    C --> F[测试验证 Agent]
    D --> G[技能生成]
    E --> G
    F --> G
    G --> H[可部署的 Agent 团队]
    style A fill:#e1f5fe
    style B fill:#ffcc80
    style H fill:#c8e6c9

6. FareedKhan-dev/train-llm-from-scratch 🤖

⭐ 3,472 stars | +860 today | Jupyter Notebook

一个从零训练 LLM 的实用教程，涵盖从数据下载到文本生成的全流程。860 的日增显示社区对”理解 LLM 底层”的需求依然强烈。项目特点是注重实操——不是堆理论，而是提供可运行的代码和清晰的步骤说明。

覆盖内容：

数据采集与清洗
Tokenization 方案
模型架构搭建（Transformer）
训练与微调
推理部署

7. TauricResearch/TradingAgents 💹

多 Agent LLM 金融交易框架

结合 LLM 和多智能体系统的量化交易框架。每个 Agent 负责不同的分析角色（技术分析、基本面分析、风险管理等），通过 Agent 间的协作达成交易决策。这是 AI Agent 在金融领域的一个落地标杆。

8. OpenBMB/VoxCPM 🗣️

无 Tokenizer 的多语言语音生成

清华 OpenBMB 团队的新作，VoxCPM2 主打 Tokenizer-Free TTS。无需分词器即可生成多语言语音，支持创意语音设计和真实人声克隆。在 TTS 领域是一次重要的架构简化。

9. p-e-w/heretic ✂️

语言模型的自动审查移除

一个颇有争议但技术含量很高的项目——自动移除语言模型中的审查机制。该项目本质上是做模型编辑（model editing），在保持模型性能的同时抹去安全对齐层。

新工具/产品速览

OpenAI Codex 正式登陆 Windows

Codex 的计算机使用（Computer Use）功能扩展到 Windows 平台。它能”看”到屏幕并执行操作——打开应用、操作文件、填写表单。更贴心的是：你可以通过 ChatGPT App 远程查看和审批 Codex 的任务进度。

Microsoft AI “超级应用” 正在酝酿

据 Fortune 报道，微软正在打造一个整合 GitHub Copilot、Copilot 聊天机器人、Copilot Cowork 以及内部名为 “Autopilot” 的新 Agent 工作流能力的超级应用。这将是微软版本的 OpenAI 超级应用战略。

Anthropic H 轮融资 650 亿，估值 9000 亿

Anthropic 完成 650 亿美元 Series H 融资，估值 9000 亿美元，超越 OpenAI 的 7300 亿估值。资金将投入安全研究、算力扩展和产品规模化。AI 军备竞赛进入资本密集阶段。

NVIDIA Cosmos 3 — 物理 AI 世界模型

NVIDIA 发布 Cosmos 3，面向物理 AI 推理的世界模型和行动模型。这是为机器人、自动驾驶等物理世界应用准备的视觉推理基础模型。

Figma Make 现在能编辑生产代码了

Figma Make 连接生产或沙箱仓库，用可视化界面直接编辑真实代码。设计师和开发者之间的墙正在倒塌。

OpenAI 正在淘汰 Canvas 界面

GPT-5.5 不再支持 Canvas，原因是新模型本身的交互方式已足够高效。同时 OpenAI 正在精简 GPT-5.5 Instant 的回复长度，减少”弹幕式”文本。

行业动态

🏛️ 伊利诺伊州 AI 安全法通过

伊利诺伊州议会通过 AI 安全法案，要求 AI 公司进行独立审计并设立举报人保护制度。该法案比加州和纽约的类似法律覆盖面更广，州长 Pritzker 已表示将签署。AI 立法正在从”自愿承诺”走向”强制执行”。

🚨 ChatGPT for Google Sheets 数据泄露事件

安全公司 PromptArmor 披露，ChatGPT for Google Sheets 插件存在数据外泄风险——它会将整个工作簿内容传输至外部服务器。267 points 的 HN 热度说明社区对 AI 插件安全的关注度持续升高。

💡 Google 新增 Gemini 聊天分享功能

Google Workspace 即将允许用户通过 Google Drive 分享 Gemini 对话快照。接收方可继续对话，但修改不会影响原拥有者的对话线程。6 月 3 日起逐步推送。

🔥 Amazon 关停 AI 使用排行榜

Amazon 内部曾有一个追踪员工 AI 使用率的排行榜，结果导致员工为了让 AI Agent 做无意义任务以刷排名。最终 Amazon 关停了该工具，高管明确表示”不要为了用 AI 而用 AI”。

技术洞见

趋势一：Agent 架构从”单体”走向”技能工厂”

今天 GitHub 上的多个热门项目指向同一个趋势：Agent 不再是一个黑盒，而是一个被动态组装的能力单元。

项目	核心理念
revfactory/harness	根据需求自动生成 Agent 团队和技能
Compound Engineering Plugin	跨工具 Agent 编排
oh-my-pi	终端内子 Agent 协作
TradingAgents	金融领域的多角色 Agent 协作

这些项目的共同思路是：Agent = 技能 + 协作协议，而非一个巨大的 prompt。

flowchart TB
    subgraph "传统单体 Agent"
        A1[巨大 Prompt] --> A2[单一 LLM]
        A2 --> A3[有限能力]
    end
    
    subgraph "新型技能工厂架构"
        B1[需求描述] --> B2[元技能引擎]
        B2 --> B3[技能1: 代码编写]
        B2 --> B4[技能2: 数据分析]
        B2 --> B5[技能3: 浏览器操作]
        B2 --> B6[技能4: 文件管理]
        B3 & B4 & B5 & B6 --> B7[编排层/协议]
        B7 --> B8[输出]
    end
    
    style A1 fill:#ffcdd2
    style A3 fill:#ffcdd2
    style B2 fill:#bbdefb
    style B7 fill:#c8e6c9
    style B8 fill:#c8e6c9

趋势二：端侧 AI + 物理世界落地加速

从 NVIDIA Cosmos 3（物理世界模型）、1-Bit Bonsai Image 4B（本地图像生成）、到 VoxCPM（端侧 TTS），再到 “A 10 year old Xeon is all you need”（2016 年的 Xeon 也能跑 Gemma 4）——AI 正在从云端的”巨无霸”走向本地的”小精灵”。端侧推理、物理世界交互、老旧硬件焕新，这些信号说明 AI 的部署范式正在发生根本性转变。

结语

2026 年 6 月的第一天，AI 领域的步伐没有停歇。Anthropic 的估值神话、Agent 技术的”工厂化”演进、AI 立法从州到联邦的铺开，以及端侧部署的加速——这一天向我们展示了一个正在快速裂变和落地的 AI 生态。明天又会有什么惊喜？敬请关注。

本文由 AI 自动生成，数据来源：GitHub Trending、Hacker News、The Verge