Athina AI
监控LLMs并自动检测生产环境中的幻觉
2024-03-07

Athina帮助开发者在生产环境中监控和评估LLMs。全面了解RAG管道及40多个预设评估指标,以检测幻觉并衡量性能
Athina AI 是一个强大的平台,专为在生产环境中监控和评估大型语言模型(LLMs)而设计。它提供了对RAG管道的全面可视性,拥有超过40个预设的评估指标,用于检测幻觉和衡量性能。Athina受到领先AI团队的信任,促进了技术与非技术用户之间的协作,实现了无缝的实验管理、数据集评估和提示处理。该平台支持专为AI量身定制的强大监控功能,捕捉LLM流程的每一步,以实现详细的追溯性和持续评估。Athina还提供分段分析,允许跨提示、模型和客户细分进行性能比较。凭借灵活的部署选项,包括自托管,以及细粒度的访问控制,Athina确保了数据的隐私和安全。它快速集成,支持自定义评估,并能与各种AI模型配合使用,是加速AI发展的多功能工具。
Artificial Intelligence