PandaAI

用自然语言向你的数据提问

2025-03-14

PandaAI 是一个强大的Python平台,旨在消除复杂数据分析与自然语言交互之间的鸿沟。它允许用户用通俗英语向数据提问,既让非技术人员也能轻松进行数据分析,又为技术人员节省时间和精力。

核心功能:

  • 自然语言查询:用简单的英语问题与数据交互
  • 多样化集成:可在Jupyter笔记本、Streamlit应用或客户端-服务器架构中使用
  • 端到端分析:与强大的数据平台无缝集成,实现全面的对话式分析
  • 图表生成:根据自然语言请求自动生成可视化图表
  • 多数据框支持:提出涉及多个数据集的关联性问题
  • 安全执行:在Docker沙箱中运行查询以增强安全性

安装方法简单,支持pip或poetry:

pip install "pandasai>=3.0.0b2"

poetry add "pandasai>=3.0.0b2"

使用示例:

import pandasai as pai

# 示例数据框
df = pai.DataFrame({
    "country": ["美国", "英国", "法国", "德国", "意大利", "西班牙", "加拿大", "澳大利亚", "日本", "中国"],
    "revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})

pai.api_key.set("您的pai-api密钥")

# 简单查询
print(df.chat('销售额最高的5个国家是哪些?'))

# 复杂查询
print(df.chat("销售额前三国家的总销售额是多少?"))

# 可视化请求
df.chat("绘制各国收入的直方图,每根柱子使用不同颜色")

PandaAI还支持Docker沙箱安全执行,并提供企业级解决方案,支持云托管或自托管部署。该平台目前处于测试阶段,欢迎参与开发和社区贡献。

Data Analysis Natural Language Processing Python Machine Learning Conversational AI