网站域名的意思,网站建设的验收,如何做试玩类网站,网站主体备案信息查询目录 准备数据
Series数据去重
DataFrame数据和Series数据去重对比 在pandas中#xff0c;Series.drop_duplicates(keep, inplace)方法用于删除Series对象中的重复值。 keep#xff1a; 决定保留哪些重复值。可以取以下三个值之一#xff1a; first#xff08;默认值Series.drop_duplicates(keep, inplace)方法用于删除Series对象中的重复值。 keep 决定保留哪些重复值。可以取以下三个值之一 first默认值保留第一次出现的重复值。 last保留最后一次出现的重复值。 False删除所有重复值。 inplace 这是一个布尔值参数。如果为True则直接在原始Series上进行修改不会返回新的Series。如果为False默认值则会返回一个新的Series原始的Series保持不变。 准备数据
import pandas as pd
df pd.read_csv(../data/b_LJdata.csv)
df.head() Series数据去重
1) 对 朝向 构成的 Series对象 去重, 保留第一条, 不影响原始对象
# 1 对 朝向 构成的 Series对象 去重, 保留第一条, 不影响原始对象
# 1.1 准备数据
chaoxiang_series df.head()[朝向]
print(------------ 去重前 ----------------)
print(chaoxiang_series)# 1.2 去重
new_series chaoxiang_series.drop_duplicates(keepfirst, inplaceFalse)
print()
print(new_series)
print()print(------------ 去重后 ----------------)
print(chaoxiang_series) 2) 对 朝向 构成的 Series对象 去重, 保留最后一条, 不影响原始对象
# 2 对 朝向 构成的 Series对象 去重, 保留最后一条, 不影响原始对象
# 2.1 准备数据
chaoxiang_series df.head()[朝向]
print(------------ 去重前 ----------------)
print(chaoxiang_series)# 2.2 去重
new_series chaoxiang_series.drop_duplicates(keeplast, inplaceFalse)
print()
print(new_series)
print()print(------------ 去重后 ----------------)
print(chaoxiang_series) 3) 对 朝向 构成的 Series对象 去重, 删除所有重复, 不影响原始对象
# 3 对 朝向 构成的 Series对象 去重, 删除所有重复, 不影响原始对象
# 3.1 准备数据
chaoxiang_series df.head()[朝向]
print(------------ 去重前 ----------------)
print(chaoxiang_series)# 3.2 去重
new_series chaoxiang_series.drop_duplicates(keepFalse, inplaceFalse)
print()
print(new_series)
print()print(------------ 去重后 ----------------)
print(chaoxiang_series) 4) 对 朝向 构成的 Series对象 去重, 保留第一条, 影响原始对象
# 4 对 朝向 构成的 Series对象 去重, 保留第一条, 影响原始对象
# 4.1 准备数据
chaoxiang_series df.head()[朝向]
print(------------ 去重前 ----------------)
print(chaoxiang_series)# 4.2 去重
new_series chaoxiang_series.drop_duplicates(keepfirst, inplaceTrue)
print()
print(new_series)
print()print(------------ 去重后 ----------------)
print(chaoxiang_series) 5) 对 朝向 构成的 Series对象 去重, 保留最后一条, 影响原始对象 # 5 对 朝向 构成的 Series对象 去重, 保留最后一条, 影响原始对象
# 5.1 准备数据
chaoxiang_series df.head()[朝向]
print(------------ 去重前 ----------------)
print(chaoxiang_series)# 5.2 去重
new_series chaoxiang_series.drop_duplicates(keeplast, inplaceTrue)
print()
print(new_series)
print()print(------------ 去重后 ----------------)
print(chaoxiang_series) 6) 对 朝向 构成的 Series对象 去重, 删除所有重复, 影响原始对象
# 6 对 朝向 构成的 Series对象 去重, 删除所有重复, 影响原始对象
# 6.1 准备数据
chaoxiang_series df.head()[朝向]
print(------------ 去重前 ----------------)
print(chaoxiang_series)# 6.2 去重
new_series chaoxiang_series.drop_duplicates(keepFalse, inplaceTrue)
print()
print(new_series)
print()print(------------ 去重后 ----------------)
print(chaoxiang_series) 7) 简化
# 7 简化
# 7.1 准备数据
chaoxiang_series df.head()[朝向]
print(------------ 去重前 ----------------)
print(chaoxiang_series)# 7.2 去重
new_series chaoxiang_series.drop_duplicates()
print()
print(new_series)
print()print(------------ 去重后 ----------------)
print(chaoxiang_series) DataFrame数据和Series数据去重对比 DataFrame数据去重,最终呈现的是数据集合
temp_df df.head().copy()# 对df所有列去重, 当前df没有重复的行数据
print(temp_df.drop_duplicates())
print()
# 根据指定列对df去重, 默认保留第一条数据
# 第1行和第5行、第2行和第3行重复
print(temp_df.drop_duplicates(subset[户型, 朝向])) Series数据去重,最终呈现是一列数据
temp_df df.head().copy()# 默认保留第一条数据
print(temp_df.drop_duplicates())
print()
print(temp_df[[户型,朝向]].drop_duplicates())