网站优化成都哪里好,网页升级访问中未满十八岁,wordpress知更鸟主题,直播做ppt的网站有哪些1.DataFrame介绍
DataFrame 是一个【表格型】的数据结构#xff0c;可以看作是【由Series组成的字典】#xff08;共用同一个索引#xff09;。DataFrame 由按一定顺序排列的多列数据组成。设计初衷是将 Series 的使用场景从一维扩展到多维。DataFrame 既有行索引#xff… 1.DataFrame介绍
DataFrame 是一个【表格型】的数据结构可以看作是【由Series组成的字典】共用同一个索引。DataFrame 由按一定顺序排列的多列数据组成。设计初衷是将 Series 的使用场景从一维扩展到多维。DataFrame 既有行索引也有列索引。 行索引index 列索引columns 值valuesNumPy的二维数组
2.DataFrame的创建 最常见的方法是传递一个字典来创建。DataFrame 以字典的创建作为每一【列】的名称以字典的值一个数组作为每一列。此外DataFrame 会自动加上每一行的索引和Series一样。 同Series一样若传入的列与字典的键不匹配则相应的值为NaN。
d {name:[tfos,Python,Pandas],age:[11,30,20],
}
df pd.DataFrame(d)
df
# 执行结果
# 每一行是一条数据
# 每一列表示一种属性 DataFrame的基本属性和方法 values 值二维 ndarray 数组 columns 列索引 index 行索引 shape 形状 head() 查看前几条数据默认5条 tail() 查看后几条数据默认5条
display(df)
# 二维数组的数据
df.values
# 执行结果
array([[tfos, 11],[Python, 30],[Pandas, 20]], dtypeobject)# 列索引
df.columns
# 执行结果
Index([name, age], dtypeobject)# 行索引
df.index
# 执行结果
RangeIndex(start0, stop3, step1)# 形状3行2列
df.shape
# 执行结果
(3, 2)# 查看前2条数据
df.head(2)
# 查看最后2条数据
df.tail(2)
# 设置 index 行索引
df.index list(ABC)
df
# 设置 columns 列索引
df.columns [name2,age2]
df
# 创建 DataFrame 时同时设置行和列的索引
d {name:[tfos,Python,Pandas],age:[11,30,20]
}
df pd.DataFrame(d,indexlist(ABC))
df 其他创建 DataFrame 的方式
df pd.DataFrame(data np.random.randint(10,100,size(4,6)),index [小明,小红,小黄,小绿],columns [语文,数学,英语,化学,物理,生物]
)
df
3.对列进行索引 通过类似字典的方式 通过属性的方式
可以将 DataFrame 的列获取为一个 Series。返回的 Series 拥有原 DataFrame 相同的索引且 name 属性也已经设置好了就是相应的列名。
df pd.DataFrame(data np.random.randint(10,100,size(4,6)),index [小明,小红,小黄,小绿],columns [语文,数学,英语,化学,物理,生物]
)
df# Series类型
df.语文
# 执行结果
小明 47
小红 32
小黄 12
小绿 33
Name: 语文, dtype: int32df[语文]
# 执行结果
小明 47
小红 32
小黄 12
小绿 33
Name: 语文, dtype: int32# 使用2个中括号得到的类型是 DataFrame
df[[语文,化学]]df[[语文]]
4.对行进行索引 使用 .loc[] 加 index 来进行行索引 使用 .iloc[] 加整数来进行行索引
同样返回一个Series, index为原来的columns。
# 不可以直接取行索引
# df.小明
# df[小明]
# DataFrame默认是先取列索引
# 取行索引值为 Series 类型
df.loc[小明]
# 执行结果
语文 47
数学 63
英语 62
化学 17
物理 84
生物 24
Name: 小明, dtype: int32df.iloc[0]
# 执行结果
语文 47
数学 63
英语 62
化学 17
物理 84
生物 24
Name: 小明, dtype: int32# 使用2个中括号取到的值是 DataFrame 类型
df.loc[[小明,小绿]]df.loc[[小明]]df.iloc[[0,-1]]df.iloc[[0,3]]df.iloc[[0]]
5.对元素索引的方法 使用列索引 使用行索引iloc[3,1]相对于两个参数iloc[[3,3]]里面的[3,3]看作一个参数 使用 values 属性二维 NumPy 数组
# 先取列再取行
df[语文][小明]
# 执行结果
47df[语文][0]
# 执行结果
47df.语文[0]
# 执行结果
47df.语文.小明
# 执行结果
47# 先取行再取列
df.loc[小明][语文]
# 执行结果
47df.loc[小明,语文]
# 执行结果
47df.loc[小明][0]
# 执行结果
47df.iloc[0][0]
# 执行结果
47df.iloc[0,0]
# 执行结果
47df.iloc[0][语文]
# 执行结果
47