安徽网站优化厂家报价,小程序软件开发,荆州网站开发,群晖wordpress建站教程1. 函数功能
将连续性数值进行离散化处理#xff1a;如对年龄、消费金额等进行分组
2. 函数语法
pandas.cut(x, bins, rightTrue, labelsNone, retbinsFalse, precision3, include_lowestFalse, duplicatesraise, orderedTrue)3. 函数参数
参数含义x要离散分箱操作的数组如对年龄、消费金额等进行分组
2. 函数语法
pandas.cut(x, bins, rightTrue, labelsNone, retbinsFalse, precision3, include_lowestFalse, duplicatesraise, orderedTrue)3. 函数参数
参数含义x要离散分箱操作的数组必须是一维的bins取值为1整数n将数据x划分为组距相等的n组2标量组成的序列指定每组的分界值3IntervalIndex间隔索引right布尔值默认为True包括每组的右边边界值当“ right True”默认值时则“ bins”[1、2、3、4]表示1,2]2,3],3,4]labels指定离散化后返回每组的标签长度与组数一致。默认为None以分界值组成的左开右闭区间展示取值为False时返回一个区分箱的整数组成的序列。retbins布尔值默认为False不返回分箱情况该参数在bins取值为整数时起作用precision分箱数值的精度取值为整数默认为3include_lowest布尔值默认为False不包括每组的左侧分界值即左开区间duplicates可选参数当bins的边界值存在重复采取的措施raise(报错:默认或者drop(删除ordered布尔值默认为True:对labels标签排序属于定序型变量优秀良好取值为False时得到的标签labels属于定类型变量如汉族、维吾尔族
4. 返回值
返回值包括两个
返回值含义out返回值取决于labels参数的取值1labels参数取值为None默认输入为Series时返回一个Series其他输入类型返回categorical2labels取值为标量组成的序列输入为Series时返回一个Series其他输入类型返回categorical(3)labels取值为False时返回一个整数组成的数组bins计算得到或者制定的每组分界值当retbinsTrue时才会返回该值
5. 示例 其实标签为上述数字边界组成时不需要通过Labels特别指定取值为None时默认即是上述形式。见下例