想象一下,你可以像和你最好的朋友聊天一样和你的数据交谈。这就是Panda AI所做的!这个Python库具有生成人工智能功能,可以将您的数据框架转换为会话功能。不用再无休止地盯着行和列了。
但别担心,Pandas AI不会取代你心爱的Pandas。它在这里起到了增强的作用!借助Pandas AI,您可以将数据分析和操作提升到一个新的水平。把它想象成一个超级英雄的助手——它会帮助你拯救一天,让你的生活更轻松(好的,知道了,讲重点)。
Pandas AI的可能性是无限的。想象一下,拥有一个可以编写自己的报告的数据框架,或者一个可以分析复杂数据并为您提供易于理解的摘要的数据框架。
在这个快速指南中,无论您在该领域的经验水平如何,您都将逐步了解如何使用这个尖端库。
无论您是经验丰富的数据分析师还是初学者,本指南都将为您提供所需的所有工具,让您充满信心地深入Pandas AI的世界。所以坐下来,放松,让我们探索Pandas AI所提供的令人兴奋的可能性!
GitHub Repository — https://github.com/gventuri/pandas-ai
Colab代码— https://colab.research.google.com/drive/1rKz7TudOeCeKGHekw7JFNL4sagN9hon-?usp=sharing
使用pip安装Pandas AI
1 | pip install pandasai |
我们的数据框架包含了关于各个国家的信息,包括他们的GDP(以百万美元计)和幸福指数得分。它由10行3列组成:
导入pandasai和OpenAI
在下一步中,我们将导入之前安装的pandasai库,然后导入LLM(大型语言模型)特性。截至2023年5月,pandasai 只支持OpenAI模型,我们将利用该模型来理解数据。
要使用OpenAI API,您必须生成自己唯一的API密钥。如果你还没有这样做,你可以在平台的官方网站platform.openai.com上轻松创建一个帐户。一旦您创建了您的帐户,您将获得即时5美元的信用额度,可用于探索和实验API。
初始化PandasAI和提问
之后,我们将向Pandas AI提供我们的OpenAI模型,并提出各种问题。
当使用pandas_ai.run
时,两个参数是必需的:您正在使用的数据框和您正在寻求答案的问题,它根据提供的数据框返回前5个最幸福的国家。
提更复杂的问题
让我们检查一下它是否可以为我们绘制图形。
是的,根据我问的问题,它确实画出了图表。
让我们执行一个复杂的任务,从下面的数据集中删除NAN值:
这是我们获得输出:
但是当我再次打印df变量时,它确实从数据集中删除了那些NAN值,完全删除了那一行
Pandasai库提供了广泛的可能性,您可以通过访问我之前分享的官方存储库页面来探索它们。