题目
brief_alternate.pdf
superstore_transaction.csv
思想:
自学pandas进行数据处理,比之前import csv
好用多了。
其中的知识点需要记住的是:
- df[“列名”] 可以直接将第一行判定为列的名字,并且返回一个只包含列名的列表。
- idxmax()返回包含最大值的index,max()饭回最大值
.loc
函数是 pandas 中的一个重要函数,用于选择和定位数据框中的数据。它允许您选择某些行和列,并将其以 DataFrame 或 Series 的形式返回。
通过使用行标签和列标签作为索引,您可以在数据框中执行如下操作:
.选择单行数据
.选择多行数据
.选择单列数据
.选择多列数据
语法:df.loc[row_indexer, column_indexer]
其中,row_indexer 是要选择的行的标签,column_indexer 是要选择的列的标签。- unique()返回不重复的value的number计数。
代码如下:
1 | # Import pandas library as pd |
1 | import requests |
1 | import pandas as pd |