DataFrame是一个表格型的数据结构,它含有一组 有序 的列,每列可以是不同的值类型
DataFrame介绍:
DataFrame是一个表格型的数据结构,它含有一组 有序 的列,每列可以是不同的值类型(数值、字符串、布尔值等)。
导入包:

1.将字典转化为DataFrame
定义字典:
1  | data = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"],  | 
将字典转化为DataFrame:
1  | df = pd.DataFrame(data)  | 
得到:
 
2.提取含有字符串“Python”行:
方法一:
1  | 
  | 
方法二:
1  | results = df['grammer'].str.contains("Python")  | 
得到的结果:
3.输出列名:
1  | print(df.columns)  | 
得到的结果:
1  | Out[28]: Index(['grammer', 'score'], dtype='object')  | 
4.将第二列改成“popularity”:
1  | 
  | 
输出df:

5.统计grammer每一列中编程语言出现的次数:
1  | df['grammer'].value_counts()  | 
结果:

6.提取popularity中大于三的:
1  | df[df['score']>3]  | 
结果:

7.按照grammer列进行去除重复值:
1  | 
  | 

8.计算popularity列的平均值:
1  | df['score'].mean()  | 
9.将grammer列转化为list:
1  | 
  | 
10.将DataFrame保存为csv
1  | df.to_csv("text.csv")  | 
结果得到了一个csv文件:
