dataframe.corr()是Pandas库中的一个函数,用于计算DataFrame中各列之间的相关系数。相关系数衡量的是两个变量之间线性关系的强度和方向,结果在-1到1之间,分别表示完全负相关和完全正相关。
1 |
DataFrame.corr(method='pearson', min_periods=1) |
method: 可选。计算相关系数的方法,有’pearson’(默认)、‘kendall’、'spearman’三种可选。
min_periods: 可选。每对元素的最小数量,以便计算相关系数。
1 2 3 4 5 6 7 8 9 10 11 12 13 |
import pandas as pd
# 创建示例数据 data = { 'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1], 'C': [2, 2, 3, 4, 4] } df = pd.DataFrame(data)
# 计算相关系数 correlation_matrix = df.corr() print(correlation_matrix) |
输出:
A B C
A 1.000000 -1.000000 0.948683
B -1.000000 1.000000 -0.948683
C 0.948683 -0.948683 1.000000
1 2 3 4 5 6 7 8 9 10 11 12 13 |
import pandas as pd
# 创建示例数据 data = { 'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1], 'C': [2, 2, 3, 4, 4] } df = pd.DataFrame(data)
# 计算相关系数 correlation_matrix = df.corr(method='spearman') print(correlation_matrix) |
输出:
A B C
A 1.000000 -1.000000 0.948683
B -1.000000 1.000000 -0.948683
C 0.948683 -0.948683 1.000000
1 2 3 4 5 6 7 8 9 10 11 12 13 |
import pandas as pd
# 创建示例数据 data = { 'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1], 'C': [2, 2, 3, 4, 4] } df = pd.DataFrame(data)
# 计算相关系数 correlation_matrix = df.corr(method='kendall') print(correlation_matrix) |
输出
A B C
A 1.000000 -1.000000 0.894427
B -1.000000 1.000000 -0.894427
C 0.894427 -0.894427 1.000000