江东的笔记

Be overcome difficulties is victory

0%

Pandas基础

DataFrame是一个表格型的数据结构,它含有一组 有序 的列,每列可以是不同的值类型

DataFrame介绍:

DataFrame是一个表格型的数据结构,它含有一组 有序 的列,每列可以是不同的值类型(数值、字符串、布尔值等)。

导入包:

在这里插入图片描述

1.将字典转化为DataFrame

定义字典:

1
2
data = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"],
"score":[1,2,3,4,5,6,7,10]}

将字典转化为DataFrame:

1
df = pd.DataFrame(data)
得到:

在这里插入图片描述

2.提取含有字符串“Python”行:

方法一:

1
2

df[df['grammer'] == 'Python']

方法二:

1
2
3
results = df['grammer'].str.contains("Python")
results.fillna(value=False,inplace = True)
df[results]

得到的结果:
在这里插入图片描述

3.输出列名:

1
print(df.columns)

得到的结果:

1
Out[28]: Index(['grammer', 'score'], dtype='object')

4.将第二列改成“popularity”:

1
2

df.rename(columns = {'score':'popularity'}, inplace = True)

输出df:

在这里插入图片描述

5.统计grammer每一列中编程语言出现的次数:

1
df['grammer'].value_counts()

结果:

在这里插入图片描述

6.提取popularity中大于三的:

1
df[df['score']>3]

结果:

在这里插入图片描述

7.按照grammer列进行去除重复值:

1
2

df.drop_duplicates(['grammer'])

图片

8.计算popularity列的平均值:

1
df['score'].mean()

9.将grammer列转化为list:

1
2

df['grammer'].tolist()

10.将DataFrame保存为csv

1
df.to_csv("text.csv")

结果得到了一个csv文件:

图片

task来源于和鲸训练营