Python Data.Frame
panadas
导入数据
1 | import pandas as pd |
- 查看前10行
1 | print(data.head[10]) |
- 数据集中有多少个列(columns)
1 | print(data.shape[1]) |
- 打印出全部的列名称
1 | print(data.columns) |
- 数据集的索引
1 | print(data.index) |
- panadas.DataFrame 构造函数
1 | pandas.DataFrame( data, index, columns, dtype, copy) |
参数 | 描述 |
---|---|
data | 数据采取各种形式,如ndarray:series,map,lists,dict, ,constant和另一个DataFrame |
index | 对于行标签,要用于结果帧的索引是可选缺省值np.arrange(n),如果没有传递索引值 |
columns | 对于列标签,可选的默认语法是 - np.arange(n)。这只有在没有索引传递的情况下才是这样 |
dtype | 每列的数据类型 |
copy | 如果默认值为False,则此命令(或任何它)用于复制数据 |
创建数据帧
列表创建数据框
- 空数据帧
1 | # 空数据帧 |
- 有数据
1 | import pandas as pd |
- 有表头
1 | import pandas as pd |
- df = pd.DataFrame(data,columns=[‘Name’,’Age’],dtype=float)(设置数据类型)
从ndarrays /列表的字典来创建数据帧
1 | import pandas as pd |
- 所有的ndarrays必须具有相同的长度。如果传递了索引(index),则索引的长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将为range(n),其中n为数组长度。
数组创建一个索引的数据帧(DataFrame)
1 | import pandas as pd |
字典列表来创建数据帧
1 | import pandas as pd |
- 字典,行索引和列索引列表创建数据帧
1 | import pandas as pd |
从系列的字典来创建
1 | import pandas as pd |
- 字典的系列可以传递以形成一个DataFrame。 所得到的索引是通过的所有系列索引的并集。
列操作
列选择
1 | import pandas as pd |
列添加
1 | import pandas as pd |
列删除
1 | # Using the previous DataFrame, we will delete a column |
行操作
行选择
1 | import pandas as pd |
按整数位置选择
1 | import pandas as pd |
行切片
1 | mport pandas as pd |
附加行
1 | import pandas as pd |
删除行
1 | import pandas as pd |
Via