@include('layouts.partials.header')

GitHub AI 开源项目每日播报 2026年05月20日

GitHub AI 开源项目每日播报(2026年5月20日)

今日重点关注:Google I/O 2026 开发者大会于北京时间今天凌晨1点开幕,谷歌发布了一系列重磅 AI 产品,对开源生态影响深远。


1. Gemini 3.5 Flash(Google 官方发布)

项目地址:https://blog.google/technology/google-deepmind/google-io-2026/

简介:谷歌在 Google I/O 2026 上发布的新一代高效率 AI 模型,专为大规模代理(Agent)和编码任务优化,输出速度达到每秒 289 tokens,是 GPT-5.5 和 Claude Opus 4.7 的 4 倍。

星标/增长趋势:即日起成为 Gemini 应用和搜索 AI 模式的默认模型,面向全体用户开放,覆盖谷歌全系产品及开放 API。

推荐理由:Gemini 3.5 Flash 是 Google I/O 2026 最核心的模型发布。它在多项基准测试中全面超越上一代旗舰 Gemini 3.1 Pro——Terminal-Bench 2.1 得分 76.2%(3.1 Pro 为 70.3%),GDPval-AA 达到 1656 Elo,MCP Atlas 得分 83.6% 位列全场最高,多模态理解测试 CharXiv Reasoning 得分 84.2%。输出速度达到 289 tokens/秒,是竞品的 4 倍,而使用成本通常不到其他前沿模型的一半。谷歌 CEO Sundar Pichai 在主题演讲中特别强调,Gemini 3.5 Flash 是"谷歌迄今为止最强的代理和编码模型"。对于开发者而言,这意味着可以用更低的成本、更快的速度构建 AI Agent 应用。更强大的 Gemini 3.5 Pro 预计下月推出。此外,谷歌内部团队还展示了 Antigravity 工具的能力——在 12 小时内协同 93 个子智能体,生成 26 亿 tokens,成功构建了一个可运行的操作系统核心,充分证明了 Gemini 3.5 Flash 在复杂系统工程中的自主协作能力。


2. OpenHuman(tinyhumansai/openhuman)

项目地址:https://github.com/tinyhumansai/openhuman

简介:开源桌面 AI 超级智能助手,一键连接 118 个第三方服务,集成桌面 UI、持久记忆系统、智能工具集、模型路由和语音功能,核心理念是"Context in minutes, not weeks"。

星标/增长趋势:约 15,000+ Stars(5月17日为 11,401,持续每天 +1,600),连续多日 GitHub Trending 榜首。核心语言:Rust + TypeScript,基于 Tauri 桌面框架。

推荐理由:OpenHuman 是 2026 年 5 月 GitHub 社区最现象级的 AI Agent 项目。"虾(OpenClaw)和马(Hermes Agent)之后,人类(OpenHuman)登场"——这个比喻在中文技术社区广为流传。它的核心创新在于彻底解决主流 AI 助手的"失忆问题":通过记忆树系统,AI 能在数分钟内全面了解用户的工作与生活上下文,而不是每次对话都从零开始。灵感来源于前特斯拉 AI 总监 Andrej Karpathy 的"LLM Wiki"工作流理念。与 OpenClaw 和 Hermes Agent 的"你教 AI"模式不同,OpenHuman 反其道而行之——它主动了解你。118+ 第三方服务一键集成,自动以 20 分钟为周期拉取数据,有效整合用户的完整工作环境。值得警惕的是,也有自媒体发出警示(企鹅号文章"OpenHuman 刷屏硅谷,但我越用越后怕"),提醒用户关注数据隐私和权限范围。对于希望拥有真正"懂你"的个人 AI 助手的用户,OpenHuman 是目前最值得关注的开源方案。搜狐报道指出该项目"在 GitHub Trending 排行中持续霸榜,每日新增星标超过 1600 个,并登上 Product Hunt 精选推荐"。


3. Antigravity 2.0(Google 官方发布)

项目地址:https://blog.google/technology/developers/antigravity-io-2026/

简介:谷歌在 Google I/O 2026 上发布的升级版 AI 编程桌面应用,核心定位从"面向开发者的智能体式 IDE"转向"通用智能体优先工作平台",可作为统一中枢管理多个数字智能体。

星标/增长趋势:新发布产品,已随 Google I/O 2026 同步推出,Antigravity CLI 同步上线,建议旧版 Gemini CLI 用户迁移。

推荐理由:Antigravity 2.0 是谷歌在 AI 编程工具赛道正式狙击 Claude Code 和 OpenAI Codex 的宣言式产品。核心升级包括:(1)定时任务(Scheduled Tasks)——用户可通过"/schedule"命令设置一次性或周期性任务,让智能体按预设时间自动执行;(2)多智能体协同——开发者可同时部署多个子智能体分别处理不同编程任务,也能安排后台自动化例程;(3)斜杠命令体系——"/goal"连续执行、"/grill-me"先澄清需求、"/browser"显式调用浏览器能力,减少误判并提升任务可控性;(4)项目制管理——取消智能体与代码仓库的强绑定,改为按"project"管理,一个项目可对应多个文件夹,并拥有独立智能体设置与权限边界。谷歌还同步推出了 Antigravity CLI(更轻量、更高速度)和 Gemini API 中的托管智能体(Managed Agents)——开发者只需 1 次 API 请求,就能启动一个运行在隔离 Linux 环境中的软件智能体,具备持续保存能力(编译文件、记忆日志、项目状态均保留)。这标志着 AI 编程工具从"单智能体对话"向"多智能体协同操作系统"的演进。


4. Agency Agents(msitarzewski/agency-agents)

项目地址:https://github.com/msitarzewski/agency-agents

简介:一次性给你一整家 AI 公司——55 个专业 AI Agent 角色,9 大部门(工程、设计、营销、测试、产品、数据、财务、法务、管理),全部打包开源,可直接集成到 Claude Code 使用。

星标/增长趋势:约 39,000+ Stars,曾于 2026 年 3 月以单周 +2.3 万星登顶全球 GitHub 周增长榜首,近期再次爆发。语言:Shell(Markdown 格式的 Agent 定义文件)。

推荐理由:Agency Agents 是 2026 年 GitHub 上最具想象力的 AI Agent 角色库项目。它源于 Reddit 上的一次深度讨论——作者 msitarzewski 发帖后 12 小时内就有 50 多人求资源,然后他就真的做出来了,并且花了数月时间迭代打磨。这不是简单的提示词模板堆砌,每个 Agent 文件都包含完整的身份认同(角色名称、性格特点、沟通风格)、核心使命(主要职责、关键目标、协作关系)、技术交付样板(代码示例、工作流程、输出物格式)和成功指标(质量衡量、验收标准、改进方向)。9 大部门覆盖从产品开发到市场营销的全流程,其中营销部甚至有专门负责 Twitter、TikTok、Reddit、Instagram 的细分 Agent。支持 Claude Code 一键安装,也提供转换脚本适配 Cursor、Aider、Windsurf、Gemini CLI、OpenCode 等工具。腾讯云开发者社区评价其"重新定义 AI 落地姿势"。随着 Antigravity 2.0 的发布,这类 Agent 角色库与谷歌新工具的集成值得期待。


5. Gemma 4(Google 开源权重模型,即将发布)

项目地址:https://github.com/google-gemini/gemma(预计发布后更新)

简介:Google 在 Google I/O 2026 上确认即将发布的开源权重大模型,27B 参数,基于 Gemini 3.2 Flash 架构优化,4-bit 量化后约 16GB VRAM,可在消费级 GPU(如 RTX 4090)上运行。

星标/增长趋势:尚未正式发布到 GitHub,但已在 Google I/O 2026 上确认,开源社区高度期待。

推荐理由:Gemma 4 是 Google I/O 2026 上对开源 LLM 生态影响最大的发布之一。27B 参数的规模恰好在消费级 GPU 可运行和高质量输出之间取得了最佳平衡——4-bit 量化后仅需约 16GB VRAM,RTX 4090(24GB)完全可以运行,甚至可以同时加载两个实例做模型并行。对比竞品:Llama 3.1 70B 需要约 48GB(量化后),DeepSeek V4 Pro 需要 284GB(量化版),Qwen3.6 35B-A3B 需要约 3.5B 激活参数。Gemma 4 在 Apache 2.0 等效的开源协议下免费商用、可微调,并原生集成 Keras/TensorFlow 工具链,支持 TPU v7 微调和 Vertex AI 部署流水线。随着 Gemini 3.5 Flash 的发布,Gemma 4 将成为谷歌"从芯片到模型到产品"全栈 AI 战略的重要开源支点。对于希望在本地或低成本环境部署高质量 LLM 的开发者、研究者和企业团队,Gemma 4 是最值得关注的新选项。


6. Superpowers(obra/superpowers)

项目地址:https://github.com/obra/superpowers

简介:Claude Code 核心技能库(Core Skills Library),用 Shell 脚本为核心大模型注入专业级工程能力,让 AI 助手从"代码生成器"升级为真正的 AI 开发环境搭档。

星标/增长趋势:123,000+ Stars,2025 年 10 月开源,2026 年初进入 Anthropic 官方插件市场后迅速爆发,曾登顶 GitHub Trending 榜首。语言:Shell。

推荐理由:Superpowers 是目前 Claude Code 生态中 Star 数最高的第三方技能库,也是 Anthropic 官方插件市场的明星项目。它用精心设计的 Shell 脚本为 Claude Code 注入了一套专业级工程实践能力——流程规范化、代码健壮性提升、Bug 大幅减少,真正实现 AI 原生工程开发。随着 Anthropic 于 5 月 18 日悄悄上线官方插件 claude-code-setup(自动扫描项目并推荐对应的 hooks、skills、MCP servers 和 subagents),Superpowers 这类技能库的安装和配置将进一步自动化,大幅降低使用门槛。在谷歌 Antigravity 2.0 今天发布的背景下,Claude Code + Superpowers 的组合仍然是最成熟、最完整的 AI 编程助手方案之一,值得新用户上手和老用户持续关注。


7. Hermes Agent(NousResearch/hermes-agent)

项目地址:https://github.com/NousResearch/hermes-agent

简介:自进化 AI Agent 框架,内置"经验转 Skills、Skills 再进化"的闭环学习系统,支持 20+ 平台部署和多种国产大模型,日 Token 调用量全球第一。

星标/增长趋势:约 145,000+ Stars,日 Token 调用量 2,910 亿(5月12日 OpenRouter 数据),超越 OpenClaw 登顶全球应用 Token 消耗榜。语言:Python。

推荐理由:Hermes Agent 是目前全球 Token 消耗量最大的开源 Agent 框架,其"自进化"能力(AI 在与用户交互中积累经验、提炼可复用技能并持续优化自身能力)构成了核心差异化优势。支持 $5 VPS 到 GPU 集群多种部署方式,支持 Telegram、Discord、飞书、钉钉等 20+ 平台,适配 Qwen3-Max、GLM-5、Kimi K2.5 等国产大模型。自带 hermes claw migrate 命令可一键导入 OpenClaw 配置,迁移成本极低。在谷歌 Antigravity 2.0 今天入局 AI 编程工具的背景下,Hermes Agent 作为开源社区的标杆项目,其多平台支持和自进化能力仍然是独特优势。对于需要构建个人 AI 助手或企业级 Agent 系统的开发者来说,Hermes Agent 提供了成熟、灵活且快速增长的开源方案。


8. Firebase AI Logic GA + Genkit 2.0(Google 官方发布)

项目地址:https://firebase.google.com/docs/ai-logic(官方文档)

简介:谷歌在 Google I/O 2026 上宣布 Firebase AI Logic(原 Vertex AI in Firebase)正式 GA(一般可用),同时发布 Firebase Genkit 2.0,为移动和 Web 开发者提供生产级 AI 能力集成方案。

星标/增长趋势:作为 Google 官方服务发布,无独立 GitHub 星标,但对开发者生态影响重大。

推荐理由:Firebase AI Logic GA 是谷歌将 AI 能力"下沉"到广大移动和 Web 开发者群体的关键一步。此前开发者若要在应用中集成 Gemini,需要自行搭建后端、管理 API Key、处理安全规则,门槛较高。Firebase AI Logic 内置安全规则、用量监控、API Key 自动管理,无需自己搭建后端,适合中小团队快速上线 AI 功能。配合今天发布的 Gemini 3.5 Flash(成本低、速度快),开发者可以用极低的门槛和成本构建生产级 AI 应用。Genkit 2.0 则新增了流式支持、Cloud Trace 可观测性和原生 MCP Server 集成——开发者可以像写普通 Firebase 函数一样写 AI 工具,并自动暴露为 MCP Server 供 Claude/Cursor/OpenClaw 等工具调用。示例:通过 Genkit 2.0 的 MCP 集成,只需几行代码就能让 Gemini 直接调用第三方 CRM 系统的工具(如 searchCustomers、createOrder)。这是谷歌在 AI 应用开发生态上最重要的基础设施更新之一。

需要任何帮助联系我们