当前位置：首页 > news >正文

兰州网站开发在哪里网络规划设计师下午题2023估分

news 2025/12/20 17:07:51

兰州网站开发在哪里,网络规划设计师下午题2023估分,饭店餐厅网站建设,门户网站开发语言路过了学校花店荒野到海边有一种浪漫的爱是浪费时间徘徊到繁华世界才发现你背影平凡得特别绕过了城外边界还是没告别爱错过了太久反而错得完美无缺幸福兜了一个圈 #x1f3b5; 林宥嘉《兜圈》 import pandas as pd import numpy as np from sklearn.model_selecti… 路过了学校花店荒野到海边有一种浪漫的爱是浪费时间徘徊到繁华世界才发现你背影平凡得特别绕过了城外边界还是没告别爱错过了太久反而错得完美无缺幸福兜了一个圈林宥嘉《兜圈》 import pandas as pd import numpy as np from sklearn.model_selection import cross_val_score from sklearn.linear_model import LogisticRegression# 示例数据 data {feature1: np.random.rand(1000),feature2: np.random.rand(1000),feature3: np.random.rand(1000),target: np.random.randint(0, 2, 1000) } df pd.DataFrame(data)# 自动选择最佳分箱数量的函数 def find_best_bins(df, feature, target, max_bins10):best_bins 2best_score -np.inffor bins in range(2, max_bins 1):df[bin] pd.cut(df[feature], binsbins, labelsFalse)model LogisticRegression()# 使用分箱后的特征进行交叉验证评分scores cross_val_score(model, df[[bin]], df[target], scoringroc_auc, cv5)mean_score scores.mean()if mean_score best_score:best_score mean_scorebest_bins binsreturn best_bins# 计算 WoE 和 IV 的函数 def calculate_woe_iv(df, feature, target, bins):epsilon 1e-6 # 平滑处理避免除零df[bin] pd.cut(df[feature], binsbins)# 计算每个箱的总数、正样本数和负样本数binned df.groupby(bin)[target].agg([count, sum])binned.columns [total, positive]binned[negative] binned[total] - binned[positive]# 计算每个箱或类别的正负样本比例binned[positive_ratio] (binned[positive] epsilon) / (binned[positive].sum() epsilon)binned[negative_ratio] (binned[negative] epsilon) / (binned[negative].sum() epsilon)# 计算 WoE 和 IVbinned[woe] np.log(binned[positive_ratio] / binned[negative_ratio])binned[iv] (binned[positive_ratio] - binned[negative_ratio]) * binned[woe]# 计算总 IViv binned[iv].sum()return iv# 对 DataFrame 中每个特征列进行分箱并选择最佳分箱数量 def binning_dataframe(df, target, max_bins10):binned_df df.copy()bin_info {}iv_info {}for feature in df.columns:if feature ! target:best_bins find_best_bins(df, feature, target, max_bins)bin_info[feature] best_binsbinned_df[feature] pd.cut(df[feature], binsbest_bins, labelsFalse)# 计算 IV 值iv calculate_woe_iv(df, feature, target, best_bins)iv_info[feature] ivreturn binned_df, bin_info, iv_info# 进行分箱并选择最佳分箱数量 binned_df, bin_info, iv_info binning_dataframe(df, target, max_bins10)print(分箱信息) print(bin_info) print(\nIV 信息) print(iv_info) print(\n分箱后的 DataFrame) print(binned_df.head())

查看全文

http://www.w-s-a.com/news/433764/