본문 바로가기

개발/Basic Knowledge (Statics, LinearAlgebra)

통계학의 이해

요 카테고리에서는 통계학(Statics)에 대한 내용을 학습하고 정리해보도록 하겠습니다.
전체적인 내용은 다양한 구글링 검색결과 및 유튜브 강의를 참고하였습니다.

1. 통계의 이해

통계학은 관심 또는 연구의 대상이 되는 모집단(population)으로 부터 자료를 수집, 정리, 요약을 하고 표본(=sample) 정보로부터 자료를 뽑았던 대상 전체인 모집단에 대한 최적의 의사결정을 내릴 수 있도록 정확한 방법을 연구하는 학문이다.

2. 모집단과 표본

  • 모집단 : 관심대상 전체
  • 표본 : 관심대상중 자료수집을 진행한 일부분

예시를 들자면, 대학생의 한달용돈에 대한 통계를 내야한다고 가정해보자.
여기서의 모집단은 전국의 대학생이고 우리는 표본으로서 100명만을 대상으로 자료수집을 진행한다고 볼 수 있다.
(인원 수가 중요한게 아니고 전체 모집단의 일부만을 조사했다는것이 핵심이다!)

3. 통계학의 역할

그렇다면 이러한 통계학은 무엇을 위해 쓰일까? 용어그대로 보기엔 통계를 연구하는 학문이다. 풀어서 얘기해보자.
표본에서 얻은 정보를 모집단으로 변환하는 과정에서 오차를 줄이는 방법을 연구하고 필연적으로 수반되는 오차의 규모를 측정하여 용이하게 사용하기 위함이다! 어렵게 말했지만 결국 어떠한 주제를 가지고 통계학적으로 접근을 하던 전체 대상을 다 조사하는것은 현실적으로 불가능하다. 그렇기 때문에 표본조사를 해야하고 이를 하게되면 무조건 표본오차가 발생한다. 통계학은 이렇게 발생한 표본오차를 줄이기 위한 방법론을 연구하는 학문인것이다. (통계학에선 100%가 없기때문에 0.05%의 오차, 즉 95%를 최대로 여긴다.)

4. 통계란?

통계는 쉽게 3가지 단계로 구분할 수 있다.
관심대상에 대해 관련된 자료(data)를 수집하고(= 표본추출, sampling) 이를 요약하고 (= 기술통계학, description statistics) 불확실한 사실에 대한 결론이나 일반적인 규칙성을 추리한다.(= 추리통계학, inferential statics)

(1). 자료의 수집

통계조사나 실험을 통해 관심대상을 대표할 수 있는 양질의 자료를 수집한다. 통계학의 확률개념과 계획하에 자료를 수집하는 것이다.
ex) 새로운 AIDS 치료약의 효과를 분석하기 위해 실험쥐에게 기존의 약과 새로운 약을 투여하고자 함. 최소의 실험쥐를 대상으로 최대의 정보를 얻을 수 있는 방법을 파악

(2). 자료의 정리

조사 및 측정된 자료를 통해 그 자료가 가지고 있는 특징을 수치, 표, 그래프로 정리하는 과정을 말한다.
ex) K대학 경영학부의 남자와 여자의 성비를 조사하여 산점도 그래프(Scatter plot)으로 표현

요 부분에 해당하는 것이 기술통계학(descriptive statics)이다.
수집된 자료를 정리, 요약하여 수치, 표, 그래프로 표현함으로써 자료의 특징을 파악하고 자료가 가지는 원래의 특성만을 파악하게 된다.

(3). 결론을 추론

관심대상 전체로부터 일부의 샘플을 추출, 분석하여 그 결과로부터 전체 모집단에 대한 일반화된 규칙성을 예측하는 과정을 말한다.
일부 조사된 자료로부터 결론을 유도하고 의사결정의 근거로 활용한다.
ex) 20~30대 여성의 화장품 선호도는? 가격, 품질, 기능성?

요 부분에 해당하는 것이 추측통계학(inferential statics)이다.
모집단의 일부인 표본을 분석하여 모집단에 대해 추측하고 일반화 시키는 연구분야를 말한다. 새로운 가설이 맞는지 틀리는지를 검증하는 과정이다.