PandaAI 是一个强大的Python平台,旨在消除复杂数据分析与自然语言交互之间的鸿沟。它允许用户用通俗英语向数据提问,既让非技术人员也能轻松进行数据分析,又为技术人员节省时间和精力。
核心功能:
- 自然语言查询:用简单的英语问题与数据交互
- 多样化集成:可在Jupyter笔记本、Streamlit应用或客户端-服务器架构中使用
- 端到端分析:与强大的数据平台无缝集成,实现全面的对话式分析
- 图表生成:根据自然语言请求自动生成可视化图表
- 多数据框支持:提出涉及多个数据集的关联性问题
- 安全执行:在Docker沙箱中运行查询以增强安全性
安装方法简单,支持pip或poetry:
pip install "pandasai>=3.0.0b2"
或
poetry add "pandasai>=3.0.0b2"
使用示例:
import pandasai as pai
# 示例数据框
df = pai.DataFrame({
"country": ["美国", "英国", "法国", "德国", "意大利", "西班牙", "加拿大", "澳大利亚", "日本", "中国"],
"revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})
pai.api_key.set("您的pai-api密钥")
# 简单查询
print(df.chat('销售额最高的5个国家是哪些?'))
# 复杂查询
print(df.chat("销售额前三国家的总销售额是多少?"))
# 可视化请求
df.chat("绘制各国收入的直方图,每根柱子使用不同颜色")
PandaAI还支持Docker沙箱安全执行,并提供企业级解决方案,支持云托管或自托管部署。该平台目前处于测试阶段,欢迎参与开发和社区贡献。