Python Data.Frame
panadas
导入数据
1  | import pandas as pd  | 
- 查看前10行
 
1  | print(data.head[10])  | 
- 数据集中有多少个列(columns)
 
1  | print(data.shape[1])  | 
- 打印出全部的列名称
 
1  | print(data.columns)  | 
- 数据集的索引
 
1  | print(data.index)  | 
- panadas.DataFrame 构造函数
 
1  | pandas.DataFrame( data, index, columns, dtype, copy)  | 
| 参数 | 描述 | 
|---|---|
| data | 数据采取各种形式,如ndarray:series,map,lists,dict, ,constant和另一个DataFrame | 
| index | 对于行标签,要用于结果帧的索引是可选缺省值np.arrange(n),如果没有传递索引值 | 
| columns | 对于列标签,可选的默认语法是 - np.arange(n)。这只有在没有索引传递的情况下才是这样 | 
| dtype | 每列的数据类型 | 
| copy | 如果默认值为False,则此命令(或任何它)用于复制数据 | 
创建数据帧
列表创建数据框
- 空数据帧
 
1  | # 空数据帧  | 
- 有数据
 
1  | import pandas as pd  | 
- 有表头
 
1  | import pandas as pd  | 
- df = pd.DataFrame(data,columns=[‘Name’,’Age’],dtype=float)(设置数据类型)
 
从ndarrays /列表的字典来创建数据帧
1  | import pandas as pd  | 
- 所有的ndarrays必须具有相同的长度。如果传递了索引(index),则索引的长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将为range(n),其中n为数组长度。
 
数组创建一个索引的数据帧(DataFrame)
1  | import pandas as pd  | 
字典列表来创建数据帧
1  | import pandas as pd  | 
- 字典,行索引和列索引列表创建数据帧
 
1  | import pandas as pd  | 
从系列的字典来创建
1  | import pandas as pd  | 
- 字典的系列可以传递以形成一个DataFrame。 所得到的索引是通过的所有系列索引的并集。
 
列操作
列选择
1  | import pandas as pd  | 
列添加
1  | import pandas as pd  | 
列删除
1  | # Using the previous DataFrame, we will delete a column  | 
行操作
行选择
1  | import pandas as pd  | 
按整数位置选择
1  | import pandas as pd  | 
行切片
1  | mport pandas as pd  | 
附加行
1  | import pandas as pd  | 
删除行
1  | import pandas as pd  | 
Via