Ruya Games

회귀분석과 상관분석 본문

카테고리 없음

회귀분석과 상관분석

SadEvil 2024. 7. 9. 19:17

회귀분석 (Regression Analysis)

회귀분석은 하나의 종속변수(결과 변수)와 하나 이상의 독립변수(설명 변수) 간의 관계를 모델링하는 방법입니다. 이 방법은 주로 변수 간의 인과 관계를 추정하고 예측하는 데 사용됩니다.

종류

  1. 단순 회귀분석 (Simple Regression Analysis): 하나의 독립변수와 하나의 종속변수 간의 관계를 분석합니다.
  2. 다중 회귀분석 (Multiple Regression Analysis): 여러 독립변수와 하나의 종속변수 간의 관계를 분석합니다.

목적

  • 변수 간의 관계 모델링
  • 미래 값을 예측
  • 독립변수가 종속변수에 미치는 영향을 평가

y=β0​+β1​x+ϵ
여기서 y는 종속변수, x는 독립변수, β0와 β1는 회귀 계수, ϵ은 오차입니다.

상관분석 (Correlation Analysis)

상관분석은 두 변수 간의 선형 관계의 정도를 측정하는 방법입니다. 상관분석의 결과는 -1에서 1 사이의 값을 가지며, 이를 상관계수라고 합니다.

상관계수 (Correlation Coefficient)

  • 1: 완전한 양의 상관관계 (한 변수가 증가할 때 다른 변수도 증가)
  • 0: 상관관계가 없음
  • -1: 완전한 음의 상관관계 (한 변수가 증가할 때 다른 변수는 감소)

종류

  1. 피어슨 상관계수 (Pearson Correlation Coefficient): 두 변수 간의 선형 관계를 측정합니다. 변수들이 연속형이고 정규분포를 따를 때 주로 사용됩니다.
  2. 스피어만 상관계수 (Spearman's Rank Correlation Coefficient): 변수들이 서열형이거나 비선형 관계를 가질 때 사용됩니다.

목적

  • 변수 간의 연관성 측정
  • 두 변수 간의 관계의 방향과 크기 이해

피어슨 상관계수 ( r )의 계산:


여기서 xi와 yi는 각각 두 변수의 관측값, x‾와 y‾는 각각 두 변수의 평균입니다.

요약

  • 회귀분석은 인과 관계와 예측에 중점을 둡니다.
  • 상관분석은 변수 간의 관계의 강도와 방향을 측정하는 데 중점을 둡니다.