[1일 1통계] 기술 통계와 추론

* 1일 1 통계 시리즈는 Preelec Publishing에서 출간한 “Statistics 101x Data Analysis”를 참고하여 작성되었습니다.

마지막으로 통계를 배운 것은 “경영통계”라는 과목을 공부한 1학년 1학기였습니다.

수학을 좋아했던 나는 여전히 외면당했고(열심히 하지 않았을 텐데), 그 이후로 통계의 벽을 쌓고 있었다… 나는 데이터 분석가가 될 줄은 몰랐다.

그 중에서도 가장 기본적인 ‘기술통계’조차 생소한 개념이었다.

기술통계와 추론통계

기술 통계는 “수집된 데이터를 구성하고 요약하는 방법”으로 본문에 소개됩니다.

기술적인 기술이 아니라 기술적인 기술입니다.

얻은 데이터 설명평균, 분산 등의 계산을 포함하여 데이터 자체에서 파생된 통계 수행에 중점을 둡니다.

한편, “수집된 데이터로부터 데이터 소스를 추정하는 방법”으로 추론 통계가 도입된다.

목표를 이해하기 위해 대상이 어떻게 측정되었는지, 알고 싶은 대상에 대한 추론하는 것이다

이를 추정하기 위해 소위 “확률 모델”이 사용됩니다.

데이터는 관찰된 값이지만 관찰된 값만으로는 이 대상의 성질을 알기 어렵다.

정육면체의 6면이 동일하다고 가정하고 각 면이 1/6의 확률로 발생하는 확률 모델로 표현합니다.

통계적 추론 및 가설 테스트

– 통계적 추론: 데이터에서 가정된 확률 모델의 속성을 추정하는 방법

예를 들어 면의 크기가 다른 주사위의 경우 각 눈의 확률이 1/6이 아니어야 합니다.

이 경우 통계적 추론을 통해 얻은 데이터에서 각각의 눈이 정육면체일 확률을 추정할 수 있다.

– 가설 평가(Hypothesis evaluation): 만들어진 가설과 얻은 데이터가 얼마나 잘 맞는지를 평가하여 가설의 수용 여부를 평가하는 방법