当前位置：首页 > news >正文

重点专业建设网站建设方案wordpress 建论坛

news 2026/4/9 5:43:47

重点专业建设网站建设方案,wordpress 建论坛,it学校培训学校哪个好,api接口开放平台文章目录一、说明二、协方差和相关性2.1 协方差的概念2.1 相关三、有关关联的高级主题 #xff08;有关详细信息#xff09;3.1 相关性和独立性3.2 零相关性和依赖性示例四、相关性和因果关系五、结论一、说明协方差量化了两个随机变量协同变化的程度。当一个变量的较高… 文章目录一、说明二、协方差和相关性2.1 协方差的概念2.1 相关三、有关关联的高级主题有关详细信息3.1 相关性和独立性3.2 零相关性和依赖性示例四、相关性和因果关系五、结论一、说明协方差量化了两个随机变量协同变化的程度。当一个变量的较高值与另一个变量的较高值对齐时同样对于较低的值协方差为正。相反如果一个变量的较高值与另一个变量的较低值一致则协方差为负。二、协方差和相关性 2.1 协方差的概念这是协方差的公式协方差提示协方差表示变量之间线性关系的方向。如果 X 和 Y 趋于一起增加则它们的协方差为正。如果 X 增加而 Y 减少则它们的协方差为负。如果 X 和 Y 是独立的则它们的协方差为零。 2.1 相关相关性量化了两个变量的相关程度。它是协方差的归一化形式其值范围为 -1 到 1。相关性 1 表示完全正关系-1 表示完全负关系0 表示无关系。公式相关性提示相关性不仅衡量两个变量之间线性关系的方向还衡量其强度。正值表示正关系。负值表示负关系。接近零的值表示没有线性关系。以下是一些用于更好地理解不同值相关性的图图 2.与不同值的相关性 [维基百科上的数据] 实例示例 1协方差计算让我们考虑两个变量 X 和 Y它们的值如下 X [2 4 6 8] Y [1 3 5 7] 协方差的 Python 代码 import numpy as np# Data X np.array([2, 4, 6, 8]) Y np.array([1, 3, 5, 7])# Mean of X and Y mean_X np.mean(X) mean_Y np.mean(Y)# Covariance Calculation covariance np.sum((X - mean_X) * (Y - mean_Y)) / (len(X) - 1)print(fCovariance: {covariance})协方差6.6666666666666667 示例 2相关性计算使用相同的变量 X 和 Y我们计算它们的相关性。用于关联的 Python 代码 # Data X np.array([2, 4, 6, 8]) Y np.array([1, 3, 5, 7])# Standard deviations of X and Y std_X np.std(X, ddof1) std_Y np.std(Y, ddof1)# Correlation Calculation correlation covariance / (std_X * std_Y)print(fCorrelation: {correlation})相关性1.00000000000000002 使用库进行协方差和相关性我们还可以使用该库直接计算协方差和相关性numpy # Covariance Matrix cov_matrix np.cov(X, Y) print(fCovariance Matrix:\n{cov_matrix}) print()# Correlation Matrix corr_matrix np.corrcoef(X, Y) print(fCorrelation Matrix:\n{corr_matrix})这是上述代码的输出图 1.协方差和相关性的输出可视化数据有助于了解变量之间的关系。 import matplotlib.pyplot as pltplt.scatter(X, Y) plt.title(Scatter Plot of X and Y) plt.xlabel(X) plt.ylabel(Y) plt.show()这是上述代码的输出图 3.X 和 Y 的散点图三、有关关联的高级主题有关详细信息 3.1 相关性和独立性独立性的定义如果一个变量的出现不会影响另一个变量的出现则两个变量 X 和 Y 是独立的。从数学上讲如果满足以下条件X 和 Y 是独立的相关性和独立性独立性意味着零相关性如果两个变量是独立的则它们的相关性为零。然而反之则不一定是正确的。零相关性并不意味着独立性两个变量的相关性可以为零但仍以非线性方式相关。 3.2 零相关性和依赖性示例将 X 视为 [−1 1] 上的均匀分布随机变量并设 YX²。在这里X 和 Y 不是线性相关的相关性为零但它们显然是相关的因为 Y 由 X 决定。 import numpy as np import matplotlib.pyplot as plt# Generating data X np.random.uniform(-1, 1, 1000) Y X ** 2# Calculating correlation correlation np.corrcoef(X, Y)[0, 1]plt.scatter(X, Y) plt.title(fCorrelation between X and Y is: {correlation:.4}) plt.xlabel(X) plt.ylabel(Y);输出图 4. 零相关性和依赖性四、相关性和因果关系因果关系的定义因果关系意味着一个变量的变化直接导致另一个变量的变化。建立因果关系需要的不仅仅是观察相关性;它需要对照实验或纵向研究。相关性并不意味着因果关系仅仅因为两个变量相关并不意味着一个变量导致另一个变量。相关性可能是由于巧合变量是偶然相关的。混杂变量另一个变量影响这两个变量。无因果关系的相关性示例有研究表明在某些地区鹳的数量与人类出生率呈正相关这种相关性可能会导致人们错误地得出鹳鸟接生婴儿的结论。然而这种相关性背后的实际原因在于较高的鹳数量和较高的出生率都与农村地区有关而不是鹳和婴儿之间的因果关系。图 5. 鹳和人类出生率详细说明鹳一个区域中的鹳数量。出生率一个地区的人类出生人数。农村混杂变量。与城市地区相比农村地区的鹳鸟数量和出生率往往更高。 Python 示例让我们模拟数据来说明这个例子。 import numpy as np import pandas as pd# Data generation np.random.seed(42) num_villages 100 villages np.arange(1, num_villages 1) stork_population np.random.poisson(lam30, sizenum_villages) # Simulating stork population birth_rate 0.5 * stork_population np.random.normal(scale5, sizenum_villages) # Birth rate influenced by stork population# Creating DataFrame data pd.DataFrame({Village: villages,Stork Population: stork_population,Birth Rate: birth_rate })# Correlation calculation correlation np.corrcoef(data[Stork Population], data[Birth Rate])[0, 1]print(fCorrelation between Stork Population and Birth Rate: {correlation:.2f})鹳鸟种群与出生率的相关性0.38 让我们可视化它以便更好地理解 import matplotlib.pyplot as pltplt.scatter(data[Stork Population], data[Birth Rate]) plt.title(Stork Population vs. Birth Rate) plt.xlabel(Stork Population) plt.ylabel(Birth Rate) plt.show()输出图 6. 鹳鸟种群与出生率结果说明正相关计算将显示鹳鸟种群与出生率之间的正相关关系。误解如果不了解上下文人们可能会错误地认为鹳是导致出生率增加的原因。混杂变量实际上较高的鹳鸟数量和出生率在农村地区都是典型的这是导致观察到的相关性的潜在因素。此示例强调两个变量之间的相关性并不意味着直接的因果关系。可能还有其他潜在因素混杂变量有助于观察到的相关性。因此在得出有关因果关系的结论之前仔细分析和考虑所有可能的因素是必不可少的。五、结论在机器学习系列的第 31 天我们深入研究了协方差和相关性的基本统计概念。通过实际的 Python 示例我们演示了如何计算和解释这些指标强调了区分相关性和因果关系的重要性并了解混杂变量的作用。保持好奇心继续探索您迈出的每一步都让您更接近掌握机器学习的艺术和科学。不要错过这个激动人心的旅程的下一章

查看全文

http://www.w-s-a.com/news/54703/