AI 日报 2026-06-01
今日热点
Anthropic 完成 650 亿美元 H 轮融资,估值逼近 9000 亿美元超越 OpenAI;OpenAI Codex 正式登陆 Windows,AI 操控电脑时代到来;GitHub 上多个 AI Agent 框架和工具集中爆发——Compound Engineering 插件、Oh-My-Pi 终端 Agent 等新项目强势崛起。与此同时,NVIDIA 发布 Cosmos 3 物理 AI 世界模型,1-Bit 图像生成模型让 4B 参数模型也能跑在本地设备上。AI 领域正在从”大模型竞赛”转向”Agent + 工具 + 端侧智能”的全面落地阶段。
GitHub 热门 AI 项目
1. supermemoryai/supermemory 🌟
⭐ 23,737 stars | +660 today | TypeScript
超级记忆引擎,号称”AI 时代的 Memory API”。这个项目提供了一个极速、可扩展的记忆存储和检索层,让 AI 应用能够持久化用户记忆并在对话中回忆。对于构建个性化 AI 助手来说,这是基础设施级别的项目。它的核心卖点就是速度和可扩展性——不是简单包装向量数据库,而是从底层做了深度优化。
技术栈: TypeScript, Vector DB, OpenAI/Anthropic Embeddings
应用场景:
- 长期记忆型聊天机器人
- 跨会话用户偏好管理
- Agent 知识召回系统
2. D4Vinci/Scrapling 🕷️
⭐ 57,602 stars | +1,475 today | Python
自适应的 Web 抓取框架,能处理从单次请求到全站爬虫的所有需求。今天暴增 1475 stars,热度爆炸。对于 AI 应用来说,高质量数据源是稀缺资源,Scrapling 解决了从网页中提取结构化数据的痛点。
应用场景: AI 训练数据采集、RAG 系统的数据管道、竞争情报监控
3. EveryInc/compound-engineering-plugin 🔌
⭐ 18,980 stars | +428 today | TypeScript
Compound Engineering 的官方插件,支持 Claude Code、Codex、Cursor 等多个 AI 编码工具。它提供了一种”组合式工程”的方法论——将复杂任务拆解为多个子 Agent 各司其职,每个 Agent 专注于特定领域。这是一个典型的 Agent 编排框架。
graph TD |
4. can1357/oh-my-pi 💻
⭐ 9,311 stars | +333 today | TypeScript
一个面向终端的 AI 编码 Agent,特色是 hash-anchored edits(哈希锚定编辑)、优化的工具链、集成 LSP、浏览器、子 Agent 等功能。可以理解为”终端里的 Cursor”——直接在命令行中通过 AI 辅助编写和修改代码。
技术亮点:
- 哈希锚定编辑:确保 AI 修改的文件版本准确,避免并发冲突
- 多工具集成:LSP 智能提示 + 浏览器自动化 + 文件系统操作
- 子 Agent 架构:复杂任务可派生子 Agent 并行处理
5. revfactory/harness 🔧
⭐ 4,977 stars | +527 today | HTML
一个”元技能(meta-skill)”工具,用于设计领域特定的 Agent 团队。它定义专门化的 Agent,并生成 Agent 所需的技能。本质上是Agent 的制造工厂——你只需要描述业务需求,Harness 就会自动设计出由多个专精 Agent 组成的协作团队。
flowchart LR |
6. FareedKhan-dev/train-llm-from-scratch 🤖
⭐ 3,472 stars | +860 today | Jupyter Notebook
一个从零训练 LLM 的实用教程,涵盖从数据下载到文本生成的全流程。860 的日增显示社区对”理解 LLM 底层”的需求依然强烈。项目特点是注重实操——不是堆理论,而是提供可运行的代码和清晰的步骤说明。
覆盖内容:
- 数据采集与清洗
- Tokenization 方案
- 模型架构搭建(Transformer)
- 训练与微调
- 推理部署
7. TauricResearch/TradingAgents 💹
多 Agent LLM 金融交易框架
结合 LLM 和多智能体系统的量化交易框架。每个 Agent 负责不同的分析角色(技术分析、基本面分析、风险管理等),通过 Agent 间的协作达成交易决策。这是 AI Agent 在金融领域的一个落地标杆。
8. OpenBMB/VoxCPM 🗣️
无 Tokenizer 的多语言语音生成
清华 OpenBMB 团队的新作,VoxCPM2 主打 Tokenizer-Free TTS。无需分词器即可生成多语言语音,支持创意语音设计和真实人声克隆。在 TTS 领域是一次重要的架构简化。
9. p-e-w/heretic ✂️
语言模型的自动审查移除
一个颇有争议但技术含量很高的项目——自动移除语言模型中的审查机制。该项目本质上是做模型编辑(model editing),在保持模型性能的同时抹去安全对齐层。
新工具/产品速览
OpenAI Codex 正式登陆 Windows
Codex 的计算机使用(Computer Use)功能扩展到 Windows 平台。它能”看”到屏幕并执行操作——打开应用、操作文件、填写表单。更贴心的是:你可以通过 ChatGPT App 远程查看和审批 Codex 的任务进度。
Microsoft AI “超级应用” 正在酝酿
据 Fortune 报道,微软正在打造一个整合 GitHub Copilot、Copilot 聊天机器人、Copilot Cowork 以及内部名为 “Autopilot” 的新 Agent 工作流能力的超级应用。这将是微软版本的 OpenAI 超级应用战略。
Anthropic H 轮融资 650 亿,估值 9000 亿
Anthropic 完成 650 亿美元 Series H 融资,估值 9000 亿美元,超越 OpenAI 的 7300 亿估值。资金将投入安全研究、算力扩展和产品规模化。AI 军备竞赛进入资本密集阶段。
NVIDIA Cosmos 3 — 物理 AI 世界模型
NVIDIA 发布 Cosmos 3,面向物理 AI 推理的世界模型和行动模型。这是为机器人、自动驾驶等物理世界应用准备的视觉推理基础模型。
Figma Make 现在能编辑生产代码了
Figma Make 连接生产或沙箱仓库,用可视化界面直接编辑真实代码。设计师和开发者之间的墙正在倒塌。
OpenAI 正在淘汰 Canvas 界面
GPT-5.5 不再支持 Canvas,原因是新模型本身的交互方式已足够高效。同时 OpenAI 正在精简 GPT-5.5 Instant 的回复长度,减少”弹幕式”文本。
行业动态
🏛️ 伊利诺伊州 AI 安全法通过
伊利诺伊州议会通过 AI 安全法案,要求 AI 公司进行独立审计并设立举报人保护制度。该法案比加州和纽约的类似法律覆盖面更广,州长 Pritzker 已表示将签署。AI 立法正在从”自愿承诺”走向”强制执行”。
🚨 ChatGPT for Google Sheets 数据泄露事件
安全公司 PromptArmor 披露,ChatGPT for Google Sheets 插件存在数据外泄风险——它会将整个工作簿内容传输至外部服务器。267 points 的 HN 热度说明社区对 AI 插件安全的关注度持续升高。
💡 Google 新增 Gemini 聊天分享功能
Google Workspace 即将允许用户通过 Google Drive 分享 Gemini 对话快照。接收方可继续对话,但修改不会影响原拥有者的对话线程。6 月 3 日起逐步推送。
🔥 Amazon 关停 AI 使用排行榜
Amazon 内部曾有一个追踪员工 AI 使用率的排行榜,结果导致员工为了让 AI Agent 做无意义任务以刷排名。最终 Amazon 关停了该工具,高管明确表示”不要为了用 AI 而用 AI”。
技术洞见
趋势一:Agent 架构从”单体”走向”技能工厂”
今天 GitHub 上的多个热门项目指向同一个趋势:Agent 不再是一个黑盒,而是一个被动态组装的能力单元。
| 项目 | 核心理念 |
|---|---|
| revfactory/harness | 根据需求自动生成 Agent 团队和技能 |
| Compound Engineering Plugin | 跨工具 Agent 编排 |
| oh-my-pi | 终端内子 Agent 协作 |
| TradingAgents | 金融领域的多角色 Agent 协作 |
这些项目的共同思路是:Agent = 技能 + 协作协议,而非一个巨大的 prompt。
flowchart TB |
趋势二:端侧 AI + 物理世界落地加速
从 NVIDIA Cosmos 3(物理世界模型)、1-Bit Bonsai Image 4B(本地图像生成)、到 VoxCPM(端侧 TTS),再到 “A 10 year old Xeon is all you need”(2016 年的 Xeon 也能跑 Gemma 4)——AI 正在从云端的”巨无霸”走向本地的”小精灵”。端侧推理、物理世界交互、老旧硬件焕新,这些信号说明 AI 的部署范式正在发生根本性转变。
结语
2026 年 6 月的第一天,AI 领域的步伐没有停歇。Anthropic 的估值神话、Agent 技术的”工厂化”演进、AI 立法从州到联邦的铺开,以及端侧部署的加速——这一天向我们展示了一个正在快速裂变和落地的 AI 生态。明天又会有什么惊喜?敬请关注。
本文由 AI 自动生成,数据来源:GitHub Trending、Hacker News、The Verge