728x90
반응형

스피어만 상관계수(Spearman's Rank Correlation Coefficient)

스피어만 상관계수(Spearman's Rank Correlation Coefficient)는 주어진 데이터 쌍 equation 의 순위를 이용하여 상관관계를 계산합니다. 직접 순위를 정하고 차이를 구하여 계산하는 과정은 아래와 같습니다:


1. 데이터

예제 데이터는 다음과 같습니다:

  • equation
  • equation

2. 각 데이터의 순위(rank) 결정

각 데이터를 크기 순서대로 정렬하여 순위를 매깁니다.

데이터 (X) 순위 Rank(X) 데이터 (Y) 순위 Rank(Y)
10 1 5 1
20 2 15 2
30 3 25 3
40 4 35 4
50 5 45 5

3. 순위 차이 계산

각 데이터 쌍에 대해 순위 차이 equation 를 구합니다: [ equation ]

데이터 (X) 순위 Rank(X) 데이터 (Y) 순위 Rank(Y) 순위 차이 equation equation
10 1 5 1 0 0
20 2 15 2 0 0
30 3 25 3 0 0
40 4 35 4 0 0
50 5 45 5 0 0

4. 스피어만 상관계수 공식

[ equation ]

  • equation 는 각 데이터 쌍의 순위 차이
  • equation 은 데이터의 개수

5. 계산 과정

[ equation ]

[ equation ]

[ equation ]


6. 결과

스피어만 상관계수 equation 로 계산됩니다.

이 뜻은 (X)와 (Y)가 완벽한 양의 단조 관계(Monotonic Relationship) 를 가지며, (X)가 증가할 때 (Y)도 항상 일정하게 증가한다는 것을 의미합니다.

7. 파이썬 예제 코드

python

import numpy as np
from scipy.stats import spearmanr

# 데이터 예제
x = np.array([10, 20, 30, 40, 50])
y = np.array([5, 15, 25, 35, 45])

# 스피어만 상관계수 계산
correlation, p_value = spearmanr(x, y)

print("스피어만 상관계수:", correlation)
print("p-value:", p_value)

8. 코드 설명

  1. scipy.statsspearmanr 함수를 사용합니다.
  2. xy는 두 변수에 대한 데이터입니다.
  3. 결과로 스피어만 상관계수(correlation)와 p-value를 출력합니다.
728x90
반응형

+ Recent posts