当前位置: 首页 > news >正文

天津企业网站设计制作如何做网络营销推广唯选一 诺

天津企业网站设计制作,如何做网络营销推广唯选一 诺,凡科做商品网站的教学视频,公司介绍模板怎么写目录 groupby——分组 本例 apply——对每个分组应用一个函数 等价用法 reset_index——重置索引 使用前​编辑 注意事项 groupby必须配合聚合函数、 关于agglist 一些groupby试验 1. groupby对象之后。sum#xff08;一个列名#xff09; 2. groupby对象…目录 groupby——分组 本例         apply——对每个分组应用一个函数 等价用法 reset_index——重置索引 使用前​编辑 注意事项 groupby必须配合聚合函数、 关于agglist 一些groupby试验 1. groupby对象之后。sum一个列名 2. groupby对象之后。sum2个列名 3. groupby对象之后。sum空​编辑 sum添加一个列明 一样只有数字上榜​编辑  sum添加俩列名​编辑 书上官方apply后自己定义列名 是否有列表框住很重要  其他用法 np。nansum 例axis0 未指定列名把他们放到了一个列表​编辑 axis0指定列名只有这个咧 ​编辑axis1报错1啊​编辑  df_g df.groupby(uid) # 按照uid进行分组 gn pd.DataFrame() # 创建一个空的DataFrame用于存储结果 for i in agg_list: # 遍历agg_list列表if isinstance(i, str): # 如果i是字符串类型tp pd.DataFrame(df_g.groupby(uid).apply(lambda df: len(df[i])).reset_index()) # 对每个组应用lambda函数计算长度并将索引重置tp.columns [uid, i _cnt] # 设置列名if gn.empty True: # 如果gn为空gn tp # 将tp赋值给gnelse:gn pd.merge(gn, tp, onuid, howleft) # 合并gn和tpelif isinstance(i, int): # 如果i是整数类型tp pd.DataFrame(df_g.groupby(uid).apply(lambda df: np.where(df[i] 0, 1, 0).sum()).reset_index()) # 对每个组应用lambda函数计算满足条件的元素的和并将索引重置tp.columns [uid, i _num]if gn.empty True:gn tpelse:gn pd.merge(gn, tp, onuid, howleft)elif isinstance(i, float): # 如果i是浮点数类型tp pd.DataFrame(df_g.groupby(uid).apply(lambda df: np.nansum(df[i])).reset_index()) # 对每个组应用lambda函数计算非NaN值的和并将索引重置tp.columns [uid, i _tot]if gn.empty True:gn tpelse:gn pd.merge(gn, tp, onuid, howleft)elif isinstance(i, list): # 如果i是列表类型tp pd.DataFrame(df_g.groupby(uid).apply(lambda df: np.nanmean(df[i])).reset_index()) # 对每个组应用lambda函数计算平均值并将索引重置tp.columns [uid, i _avg]if gn.empty True:gn tpelse:gn pd.merge(gn, tp, onuid, howleft)else: # 其他情况tp pd.DataFrame(df_g.groupby(uid).apply(lambda df: np.nanmax(df[i])).reset_index()) # 对每个组应用lambda函数计算最大值并将索引重置tp.columns [uid, i _max]if gn.empty True:gn tpelse:gn pd.merge(gn, tp, onuid, howleft)groupby——分组 groupby 是 pandas 库中一个非常重要的功能它用于将数据分组并对每个组应用函数。groupby 的基本用法是将 DataFrame 分成多个组每个组由一个或多个唯一值定义。 语法 DataFrame.groupby(byNone, axis0, levelNone, as_indexTrue, sortTrue, group_keysTrue, squeezeFalse, observedFalse, **kwargs)关键参数 by: 用于分组的键可以是列名、列名的列表或一个返回分组键的函数。axis: 指定分组是在哪个轴上进行的默认为 0行。as_index: 默认为 True表示返回的 DataFrame 中的分组键作为索引。如果设置为 False则分组键将作为列返回。 本例         df.groupby(uid)这会按照 ‘uid’ 列的值对 DataFrame 进行分组。 apply——对每个分组应用一个函数 apply 函数用于对 DataFrame 中的每个组应用一个函数。这个函数可以是自定义的也可以是 pandas 中的内置函数。 语法 DataFrameGroupBy.apply(func, *args, **kwargs)关键参数 func: 应用于每个组的函数。 例子 df_g.apply(lambda df: np.sum(df[value]))这会对每个组应用一个 lambda 函数计算 ‘value’ 列的总和。 返回这个函数的结果dataframe 等价用法 其中.df_g.apply(lambda df: np.sum(df[value]))等价于groupby对象.sum(列名即“value”) 例pd.DataFrame(customers_df.groupby([Time]).sum(CustomerID)) reset_index——重置索引 reset_index 用于重置 DataFrame 的索引或者将索引的级别转换为列。这在 groupby 操作后特别有用因为 groupby 默认会将分组键作为索引。 语法 DataFrame.reset_index(levelNone, dropFalse, inplaceFalse, col_level0, col_fill)关键参数 level: 如果是多级索引可以指定要重置的级别。drop: 如果为 True则重置索引后原始索引将不会作为列添加到 DataFrame 中。inplace: 如果为 True则直接在原始 DataFrame 上修改不返回新的 DataFrame。 例子 df_g.reset_index()这会将分组后的 DataFrame 的索引重置并将原来的索引作为 DataFrame 的一列。 返回重置后的dataframe 使用前 使用后  结合以上三个功能代码中的例子可以这样解释 df_g df.groupby(uid) # 按照列 uid 对 DataFrame 进行分组 gn pd.DataFrame() # 创建一个空的 DataFrame 用于存储结果 for i in agg_list: # 遍历一个聚合操作的列表# ... 对每个分组应用不同的聚合函数 ...tp pd.DataFrame(df_g[i].apply(lambda df: np.sum(df)).reset_index()) # 应用聚合函数并重置索引# ... 合并结果到 gn DataFrame ...在这个例子中groupby 用于创建分组apply 用于对每个分组执行聚合操作而 reset_index 用于将聚合后的结果转换为 DataFrame并保留原始的分组键作为一列。 注意事项 groupby必须配合聚合函数、 聚合函数可以是groupby对象后面。后缀 、也可以是。apply自定义 当你使用 pd.DataFrame(customers_df.groupby([Time, CustomerID])) 时你实际上是将 groupby 对象转换成了一个 DataFrame。groupby 对象本身是一个中间对象用于表示分组操作它包含了原始 DataFrame 的分组信息但并不包含聚合后的结果。 import pandas as pd# 客户信息 DataFrame customers_df pd.DataFrame({CustomerID: [1, 2, 3, 4],CustomerName: [Alice, Bob, Charlie, David],Time: [10, 20, 10, 40] })# 将 groupby 对象转换为 DataFrame grouped_df pd.DataFrame(customers_df.groupby([Time, CustomerID]))print(grouped_df)输出将是一个包含两个列的 DataFrame这两个列是 Time 和 CustomerID它们表示分组键。这个 DataFrame 的每一行代表一个唯一的分组。但是由于没有应用任何聚合函数这个 DataFrame 不会包含任何关于分组内容的聚合信息。 输出看起来像这样 Time CustomerID 0 10 1 1 1 20 2 2 2 10 3 3 3 40 4 4解释 groupby([Time, CustomerID]) 创建了一个分组对象这个对象根据 ‘Time’ 和 ‘CustomerID’ 的每个唯一组合对数据进行分组。由于没有指定聚合函数转换成 DataFrame 后它只是显示了分组键的组合并没有显示每个组中的数据。在这个特定的例子中由于 ‘CustomerID’ 是唯一的所以每个 ‘Time’ 和 ‘CustomerID’ 的组合都是唯一的因此这个操作并没有实际上的分组效果它只是简单地展示了每一行数据的 ‘Time’ 和 ‘CustomerID’。 如果你想要查看每个组中的数据你应该在 groupby 后面应用聚合函数例如 .size()、.sum()、.mean() 等然后可能需要使用 .reset_index() 来将结果转换成一个 DataFrame。例如 grouped_df customers_df.groupby([Time, CustomerID]).size().reset_index(nameCount) print(grouped_df)这将输出每个分组中的元素数量。 关于agglist 在Python中当你在循环中使用for i in agg_list:时agg_list通常是包含要处理的项或值的列表。在这个上下文中agg_list可能包含一些聚合函数的名字或者是其他与数据处理相关的参数。具体来说这取决于你正在进行的任务和你如何定义和使用agg_list。 例如如果你的程序涉及到数据分析并且你想对不同列的数据进行某种形式的聚合如求和、平均值等那么agg_list可能会包含字符串形式的函数名称如[sum, mean]然后在循环内部对这些函数进行处理。 再举一个具体的例子假设你有如下代码片段 python 复制 agg_list [sum, mean] dataframe pd.DataFrame(...) # 假设这是一个已经存在的DataFramefor func_name in agg_list:if func_name sum:result dataframe.sum()elif func_name mean:result dataframe.mean()# ... 其他可能的聚合函数处理 ...print(fThe {func_name} of the data is: {result})在这个例子中agg_list就是一个包含字符串的列表其中每个字符串代表一种聚合函数的名称。通过遍历这个列表我们可以依次调用相应的聚合函数来处理数据。 总结一下agg_list通常是一个列表其中包含你要执行的某些操作的相关信息如函数名称、参数等。具体的内容取决于你的编程需求和上下文。 书上:agg_listoil_amount,discount_amount,sale_amount,amount,,pay_amount,coupon_amount等等。并不是前面所说的sum average之流 一些groupby试验 1. groupby对象之后。sum一个列名 仅显示为数字的列name这列没写并且另一列也作用了这个sum函数即使没有写这一列的名字 2. groupby对象之后。sum2个列名 比1多了name一列三列统统使用了sum操作name是字符串的相加 3. groupby对象之后。sum空 与1相同的结果name又没了  sum添加一个列明 一样只有数字上榜  sum添加俩列名 2or3结果一样name上榜 这个用法似乎不太正规 书上官方apply后自己定义列名 这个结合apply及lambda自定义函数的方法会丢失列名且仅有此列 是否有列表框住很重要  无 name赫然在列 有 name消失 。且保留有其他数字的列 哪怕是只有一个列名的列表 其他用法 np。nansum 只能给他一列多了会报错。  np.nanmin 是 NumPy 库中的一个函数 ——忽略nan的某函数们具体有nanmin nanmax nanvar nansum nanmean 他们通常作用在一维nparray上 如果用到多维需要指定axis 例axis0 未指定列名把他们放到了一个列表 axis0指定列名只有这个咧 axis1报错1啊  用于计算数组中非 NaN (Not a Number) 值的最小值。当数组中包含 NaN 值时标准的 min 函数会返回 NaN而 np.nanmin 会忽略这些 NaN 值并返回剩余非 NaN 值中的最小值。 以下是 np.nanmin 的基本用法 import numpy as np# 创建一个包含 NaN 值的数组 arr np.array([1, 2, np.nan, 4, np.nan, 6])# 使用 np.nanmin 计算非 NaN 值的最小值 min_value np.nanmin(arr)print(min_value) # 输出: 1以下是 np.nanmin 的一些其他特性 它可以接受一个 axis 参数用于计算指定轴上的最小值。它可以接受一个 out 参数用于指定输出数组。 例子 # 创建一个二维数组 arr_2d np.array([[1, 2, np.nan], [np.nan, 4, 6], [7, np.nan, 9]])# 计算每一列的非 NaN 最小值 min_values_per_column np.nanmin(arr_2d, axis0)print(min_values_per_column) # 输出: [1 2 6]# 计算每一行的非 NaN 最小值 min_values_per_row np.nanmin(arr_2d, axis1)print(min_values_per_row) # 输出: [1 4 7]在这个例子中axis0 表示沿着列的方向计算最小值而 axis1 表示沿着行的方向计算最小值。np.nanmin 会自动忽略每列或每行中的 NaN 值。
http://www.w-s-a.com/news/447635/

相关文章:

  • 最牛论坛网站app生成链接
  • 用jsp做的网站源代码网站优化说明
  • 网站建设公司名字甘肃省和住房建设厅网站
  • 做外贸网站需要什么卡网站建设公司怎样
  • 网站关键词密度怎么计算的中文版wordpress
  • asp网站建设教程如何在线上推广自己的产品
  • 电脑网站你懂我意思正能量济南网站建设公司熊掌号
  • 杂志社网站建设萧山区网站建设
  • 电商网站前端制作分工网站怎做百度代码统计
  • 免费的html大作业网站网站开发心得500字
  • 临时工找工作网站做美缝帮别人做非法网站
  • 深圳网站建设 设计创公司新昌网站开发
  • 唐山教育平台网站建设上海装修网官网
  • 一个公司做多个网站什么行业愿意做网站
  • 成都龙泉建设网站免费域名app官方下载
  • xss网站怎么搭建如何用wordpress站群
  • 怎样做网站外链supercell账号注册网站
  • 阿里巴巴网站是用什么技术做的哪些网站做推广比较好
  • 做网站go和python手机如何创网站
  • 网站开发进修网站做301将重定向到新域名
  • 公司网站开发费用账务处理ucenter wordpress
  • 六站合一的优势少儿编程机构
  • 软件开发与网站开发学做美食网站哪个好
  • 网站搜索 收录优化百度推广页面投放
  • 响应式网站的优点浙江省网站域名备案
  • 网站安全 扫描深圳被点名批评
  • 在哪个网站可以一对一做汉教网站优化策略
  • 龙岩做网站的顺企网宁波网站建设
  • 昆山网站建设河北连锁餐厅vi设计公司
  • 新蔡县住房和城乡建设局网站南昌租房网地宝网