网站设计的主要机构有哪些,网站设计风格有几种,网络营销的具体方法,网站建设公司的问答营销案例当我们的数据涉及日期和时间时#xff0c;分析随时间变化变得非常重要。Pandas提供了一种方便的方法#xff0c;可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。 在Pandas中#xff0c;有几种基于日期对数据进行分组的方法。我们将…当我们的数据涉及日期和时间时分析随时间变化变得非常重要。Pandas提供了一种方便的方法可以按不同的基于时间的间隔(如分钟、小时、天、周、月、季度或年)对时间序列数据进行分组。 在Pandas中有几种基于日期对数据进行分组的方法。我们将使用这些虚拟数据进行演示: importpandasaspdimportnumpyasnp# generating data consisting of weekly sales for the timeperiod Jan,2022 to Jan,2023dates pd.date_range(2022-01-01, 2023-01-05, freq1 W)sales_valnp.linspace(1000, 2000,len(dates) )data {date:dates,sales: sales_val} # Load the data dfpd.DataFrame(data) # Convert the date column to a datetime type df[date] pd.to_datetime(df[date]) df.sample(5)一些最常用的时间序列数据分组方法是:
1、resample
pandas中的resample 方法用于对时间序列数据进行重采样可以将数据的频率更改为不同的间隔。例如将每日数据重新采样为每月数据。Pandas中的resample方法可用于基于时间间隔对数据进行分组。它接收frequency参数并返回一个Resampler对象该对象可用于应用各种聚合函数如mean、sum或count。resample()只在DataFrame的索引为日期或时间类型时才对数据进行重新采样。 importmatplotlib.pyplotaspltimportseabornassns# Set the date column as the index,# and Group the data by month using resample groupeddf.set_index(date).resample(M).mean() print(Grouping is done on monthly basis using resample method:\n, grouped)# plot the average of monthly salessns.lineplot(grouped.index, grouped[sales])plt.xlabel(Date)plt.ylabel(Average Monthly Sales)plt.grid(True)plt.title(Average Monthly sales with respect to month)在本例中我们首先将’ date 列转换为日期类型然后将其设置为DataFrame的索引。然后使用重采样方法按月分组数据并计算每个月的“sales”列的平均值。结果是一个新的DF每个月有一行还包含该月“sales”列的平均值。
2、使用Grouper
pandas的Grouper 函数可以与 groupby 方法一起使用以根据不同的时间间隔例如分钟、小时、天、周、月、季度或年对数据进行分组。Grouper 包含了key 包含日期的列、frequency 分组依据的间隔、closed 关闭间隔的一侧和label 标记间隔等参数。Pandas 中的 Grouper 函数提供了一种按不同时间间隔例如分钟、小时、天、周、月、季度或年对时间序列数据进行分组的便捷方法。通过与Pandas 中的 groupby 方法 一起使用可以根据不同的时间间隔对时间序列数据进行分组和汇总。
Grouper函数接受以下参数:
key:时间序列数据的列名。
freq:时间间隔的频率如“D”表示日“W”表示周“M”表示月等等。
closed:间隔是否应该在右侧(右)、左侧(左)或两侧(两个)闭合。
label :用它的结束(右)或开始(左)日期标记间隔。
Grouper函数和groupby一起按月间隔对数据进行分组: importmatplotlib.pyplotaspltimportseabornassns# Group the data by month using pd.Grouper and calculate monthly averagegroupeddf.groupby(pd.Grouper(keydate, freqM)).mean()print(Grouping is done on monthly basis using pandas.Grouper and groupby method:\n, grouped)# plot the average of monthly salessns.lineplot(grouped.index, grouped[sales])plt.xlabel(Date)plt.ylabel(Average Monthly Sales)plt.grid(True)plt.title(Average Monthly sales with respect to month using pd.Grouper and groupby )3.Usingdtaccessorwithgroupby:3、dt 访问器和 groupby
Pandas中的dt访问器可以从日期和时间类列中提取各种属性例如年、月、日等。所以我们可以使用提取的属性根据与日期相关的信息对数据进行分组。
在Pandas中使用dt访问器从DataFrame中的date和time对象中提取属性然后使用groupby方法将数据分组为间隔。 importmatplotlib.pyplotaspltimportseabornassns# Group the data by month using dt and calculate monthly averagegroupeddf.groupby(df[date].dt.to_period(M)).mean()print(Grouping is done on monthly basis using dt and groupby method:\n, grouped)总结
这三种常用的方法可以汇总时间序列数据所有方法都相对容易使用。在时间复杂度方面所有方法对于中小型数据集都是有效的。对于较大的数据集resample的性能更好因为它针对时间索引进行了优化。而Grouper和dt提供了更大的灵活性可以进行更复杂的分组操作。可以根据自己喜欢的语法或者特定的需求选择一种方法使用。
https://avoid.overfit.cn/post/9a7eac8d7fcb40709fae990f933609cf
作者R. Gupta