Glide

为您的GenAI应用开放的模型网关

2024-02-02

Glide
- Unified Chat API - 低延迟弹性路由和四种策略的回退:最低延迟、轮询、加权轮询、基于优先级 - 模型特定的提示 - 还有更多 ✨
Glide是一款专为GenAI应用设计的开源高性能模型网关,提供统一的聊天API和高效的LLMOps管理。它通过最低延迟、轮询和基于优先级的路由等策略,以及模型特定的提示,确保低延迟、弹性路由。专为云原生环境构建,Glide简化了应用的弹性,降低了延迟,并集中管理API密钥。其可配置设计支持具有不同需求的多种应用,而开源特性允许无缝切换模型提供商,避免供应商锁定。Glide还通过原生OpenTelemetry支持提供生产就绪的可观测性,确保高可用性和可扩展性。对于寻求轻量级、快速且弹性解决方案以管理大型语言模型的开发者来说,Glide是理想选择,可通过Docker、CLI或Kubernetes在Apache 2.0许可证下使用。
Developer Tools Artificial Intelligence GitHub