南阳市建网站公,跨境电商saas,建设银行朝阳支行网站,国内网站为什么要备案本文介绍基于Python语言#xff0c;针对一个文件夹下大量的Excel表格文件#xff0c;基于其中每一个文件#xff0c;随机从其中选取一部分数据#xff0c;并将全部文件中随机获取的数据合并为一个新的Excel表格文件的方法。 首先#xff0c;我们来明确一下本文的具体需求。… 本文介绍基于Python语言针对一个文件夹下大量的Excel表格文件基于其中每一个文件随机从其中选取一部分数据并将全部文件中随机获取的数据合并为一个新的Excel表格文件的方法。 首先我们来明确一下本文的具体需求。现有一个文件夹其中有大量的Excel表格文件在本文中我们就以.csv格式的文件为例如下图所示。 其中每一个Excel表格文件都有着如下图所示的数据格式其中的第1行表示每一列的名称第1列则表示时间。 我们希望实现的就是从每一个Excel表格文件中随机选取10行数据第1行数据肯定不能被选进去因为其为列名第1列数据也不希望被选进去因为这个是表示时间的数据我们后期不需要并将这一文件夹中全部的Excel表格文件中每一个随机选出的10行数据合并到一起作为一个新的Excel表格文件。 明白了需求我们即可开始代码的撰写本文用到的具体代码如下所示。 # -*- coding: utf-8 -*-Created on Fri May 19 01:47:06 2023author: fkxxgis
import os
import pandas as pdoriginal_path E:/01_Reflectivity/99_Model_Training/00_Data/02_Extract_Data/19_2022Data
result_path E:/01_Reflectivity/99_Model_Training/00_Data/02_Extract_Data/20_Train_Modelresult_df pd.DataFrame()for file in os.listdir(original_path):if file.endswith(.csv):df pd.read_csv(os.path.join(original_path, file))sample_df df.sample(n 10, axis 0)sample_df sample_df.iloc[ : , 1 : ]result_df pd.concat([result_df, sample_df])result_df.to_csv(os.path.join(result_path, Train_Model_1.csv), index False) 代码中首先定义了原始数据文件夹也就是有大量Excel表格文件的文件夹路径和结果数据文件夹路径。然后创建了一个空的DataFrame用于存储抽样后的数据。 接下来是一个for循环遍历了原始数据文件夹中的所有.csv文件如果文件名以.csv结尾则读取该文件。然后使用Pandas中的sample()函数随机抽取了该文件中的10行数据并使用iloc[]函数删除了10行数据中的第1列为了防止第1列表示时间的列被选中因此需要删除。最后使用Pandas中的concat()函数将抽样后的数据添加到结果DataFrame中。 最后使用Pandas中的to_csv()函数将结果DataFrame保存到结果数据文件夹中文件名为Train_Model_1.csv并设置index False表示不保存索引。 运行上述代码我们即可获得数据合并后的文件且第1列数据也已经被剔除了。 至此大功告成。 文章转载自疯狂学习GIS 原文链接https://www.cnblogs.com/fkxxgis/p/18600993 体验地址引迈 - JNPF快速开发平台_低代码开发平台_零代码开发平台_流程设计器_表单引擎_工作流引擎_软件架构