상세 컨텐츠

본문 제목

회귀분석(Regresstion Analysis)

경제학이야기

by Cofbean 2020. 4. 1. 16:53

본문

반응형

회귀분석(Regresstion Analysis)

 

 

(보완 예정)

회귀분석은 누가 뭐라고 해도 가장 기본적이고 중요한 분석방법론이라 생각된다(특히 사회과학)

유전학자  골턴이 부모와 아이들의 키 사이의 연관 관계를 연구하한데서 시작한 연구방법론이다.

부모와 자녀의 키사이에는 선형적인 관계가 있고 키가 커지거나 작아지는 것보다는 전체 키 평균으로 돌아가려는 경향이 있다는 가설을 세웠으며 이를 분석하는 방법을 "회귀분석"이라고 하였다

이후 경험적 연구를 바탕으로 시행착오 끝에

칼은 아버지와 아들의 키를 조사한 결과를 바탕으로 함수 관계를 도출하여 회귀분석 이론을 수학적으로 정립하고 회귀분석이라는
정의가 된 것으로 볼 수 있을 것이다.

 

회귀 분석(regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한뒤 적합도를 측정해 내는 분석 방법이다.

회귀분석은 시간 변화따라 발생하는 데이터나 어떤 영향, 가설적 실험, 인과 관계의 모델링 등의 통계적 예측에 주로 이용되는 편이다.

그러나 많은 경우 가정이 맞는지 아닌지 적절하게 밝혀지지 않은 채로 이용되어 그 결과가 오용되는 경우도 있다. 특히 통계 프로그램(툴)의 발달로 분석이 용이해져서 결과를 쉽게 얻을 수 있지만 적절한 분석 방법의 선택이였는지 또한 정확한 정보 분석인지 판단하는 것은 연구자에 달려 있다

 

이러한 적절성을 판단하는데 문제가 많이 발생하는데
특히 사회과학 연구자들에 있어 그저 회귀분석이
만사형통과같이 활용되어 별 과학적 뒷받침이
될 여지가 없는 경우에도 오용되기도 하였다.

 

하나의 종속변수와 하나의 독립변수 사이의 관계를 분석할 경우를 단순회귀분석 simple regression analysis), 하나의 종속변수와 여러 독립변수 사이의 관계를 규명하고자 할 경우를 
다중회기 분석 multiple regression analysis)으로 나뉠 수 있다.

회귀 분석의 가정

회귀분석은 다음의 가정을 바탕으로 한다.

  • 오차항은 모든 독립변수 값에 대하여 동일한 분산을 갖는다. (선형성)
  • 오차항의 평균(기대값)은 0이다. (정규성)
  • 수집된 데이터의 확률 분포는 정규분포를 이루고 있다.
  • 독립변수 상호간에는 상관관계가 없어야 한다. (독립성)
  • 시간에 따라 수집한 데이터들은 잡음의 영향을 받지 않아야 한다.

독립변수들간에 상관관계가 나타나는 경우 다중공선성 문제라고 한다.

회귀분석을 통해 데이터를 분석하고 이해하기 위해서는 사전에 회귀분석이 적합한 분석 방법인지를 파악하여
적재적소에서 활용되어야한다.

반응형

관련글 더보기