Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

编程开发 adgersong 2025-07-17 467 0

Gemini Balance 以 Python + FastAPI 为核心,整合多 Key 轮询、负载均衡、权限过滤与 健康 监控,并向下兼容 OpenAI 接口格式。最新版在性能、文档与安全性上全面升级,引入 countTokens 端点、自动 思考 配置优化、本地与云端双向代理指南,以及 ARM/AMD Docker 镜像,帮助 开发 者快速构建高可用的 Gemini 服务栈。

Gemini Balance介绍

Gemini Balance 是一个开源 Gemini API 代理与负载均衡器,支持在同一实例中 管理 多组 Gemini API Key,并通过轮询 算法 分摊流量,显著降低单 Key 触发速率限制的 风险 。相比上游版本,当前 Fork 进一步修复配置缺陷、强化安全策略,并补全繁体中文与 英文 文档,方便跨地区 团队 协作。

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance关键功能

多 Key 轮询与负载均衡

  • 自动按顺序轮询多个 Gemini API Key,均衡请求负载并提升并发能力

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

  • 可配置最大重试次数与失败自动禁用策略,定时检测恢复失效 Key

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

实时状态监控

  • 提供认证访问的 /keys_status 页面,实时展示各 Key 的使用情况与健康指标

  • 详细日志记录帮助快速排查错误与性能瓶颈

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡 Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

灵活的协议与模型支持

  • 同时兼容 Gemini 和 OpenAI 格式的 CHAT、画图及 embeddings 接口

  • 支持 IMAGE_MODELS、SEARCH_MODELS 等配置,分别用于图文对话、联网搜索和修图功能

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

  • 可过滤不常用模型,自动从 API 获取最新模型列表

新增与优化功能

  • countTokens API 支持:在发送前预估 token 数量

  • 智能 thinkingConfig 处理:当 thinkingBudget 为 0 时自动省略该配置

  • 反向代理与本地开发指南:包含 nginx、SSL 证书、hosts 配置等

  • 管理脚本:支持一键切换代理、更新端口与完整移除

技术 实现与兼容性

栈与架构

  • Python + FastAPI:利用异步特性高效处理并发请求,性能优于传统同步框架。
  • Nginx + SSL/mkcert:官方示例脚本一键生成本地证书,快速配置 HTTPS 反向代理。

容器化部署

  • 官方镜像适配 AMD 与 ARM 架构, docker pull ghcr.io/snailyp/gemini-balance:latest 即可落地生产 环境 ;也可自行构建镜像定制插件。

网络 与代理支持

  • 可为每个请求单独指定 HTTP/SOCKS5 代理;亦支持将 Gemini 官方或自建 Cloudflare Worker 代理作为上游端点,灵活适配不同网络场景。

快速上手

  • 配置环境变量:在 .env 中写入 API_KEYS="key1,key2",按需填写 PROXIES 与 FILTERED_MODELS。
  • 启动服务:本地执行 python main.py 或使用 docker compose up -d。
  • 调用接口: # OpenAI 格式 curl http://localhost:8000/v1/chat/completions -H "Authorization: Bearer sk-..." # Gemini 格式 curl http://localhost:8000/gemini/v1beta/models/gemini-pro:generateContent

    两种协议均支持图文对话、联网搜索与自定义模型过滤。

  • Gemini Balance适用场景

    • 个人 或团队需要统一管理多把 Gemini Key,提升调用上限。
    • AI 应用希望无缝迁移自 OpenAI,兼顾 Gemini 最新多模态能力。
    • 对安全合规、可观测性与高可用性有硬性要求的生产部署。

    借助 Gemini Balance,你可以在最短 时间 内获得稳定、易扩展且对开发者友好的 Gemini 代理服务,为应用接入最新多模态模型扫清障碍。

    Gemini Balance 项目地址

    官网地址:https://gb-docs.snaily.top/

    GitHub:https://github.com/yulin0629/gemini-balance

    夸克资源精选合集

    (0)
    (0)

    评论列表

    冲上云霄
    • 冲上云霄
    • 冲上云霄
    • 冲上云霄
    • 冲上云霄