세상에서 가장쉬운 통계학입문 요약(2)

jaeyoung kang
3 min readJul 24, 2018

--

2강 평균값의 역할과 평균값을 이해하는 방법

평균값은 지렛대가 균형을 이루는 지점

1. 통계량은 데이터를 요약한 수치

도수분포표와 히스토그램이 좋은 도구이긴하나 단점이 있다. 첫째, 그래프를 보고 데이터의 특징을 생각할때 사람에 따라서 받아들이는 인상이 제각각이라는 점이다. 이러면 의사사통이 잘 이루어지지 않는 경우가 생길수 있다. 둘째, 도수분포표로 나타내든지 히스토그램으로 나타내든지 상당히 많은 공간을 필요로한다. 이 두가지 단점을 극복하기 위해서 또하나의 ‘축약’방법이 발명되었다. 바로 ‘통계량’이다. 통계량은 ‘데이터의 특징을 하나의 숫자로 요약’한 것이다 . 그래서 ‘데이터의 어떤 비슷한 특징을 요약하고 싶은가’에 따라서 여러 가지 통계량이 개발디었다. 대표적으로 ‘평균값’, ‘분산’, ‘표준편차’가 있다.

2. 평균값이란?

데이터의 합계를 데이터 총 개수로 나누기해서 얻은값

3. 도수분포표에서의 평균값

(계급값×상대도수)를 계산해 합계를 구하면 평균값이 나온다. 도수분포표를 만드는것은 데이터 자체가 갖고 있는 정보의 일부를 버리는일이기 때문에 이 방법으로 계산한 평균겂은 데이터 자체의 평균값과는 조금 차이가 있다. 하지만 거의같다고 해도될정도의 차이이다. 이것은 도수 분포표를 만드는 것이 평균값이라는 통계량에는 별로 큰 영향을 주지 않는다. {(계급값×상대도수)의 합계}는 통계학 전반에 걸쳐서 사용한다.

예를 들어 앞장의 여대생 키 제2계급 146cm-150cm에는 6개의 데이터가 있지만 도수분포표에서 이 6개의 데이터가 구체적으로 어떤수치인지는 알 수 없다. ‘계급값 148이라는 데이터가 6개 나열돼 있다’라고 생각하라는 설명을 했다 . 제2계급의 합계는 148 * 6 이고 합계를 전체 데이터 갯수로 나누면 148 * 6 / 80 인데 6/80은 상대도수이다. 계급값 * 상대도수가 된다. 모든 계급을 이렇게 계산해서 더하면 (계급값 * 상대도수)의 총합이 된다. 실제 데이터의 합계를 (계급값*도수)로 계산해도 큰 차이가 나지 않는다.

4. 히스토그램에서 평균값의 역할

히스토그램을 지렛대라고 가정했을때 평균값은 지렛대가 일자로 균형을 이루는 지점이라고 할 수 있다.

5. 평균값을 어떻게 이해해야 하는가?

평균값은 데이터가 수치적으로 널리 퍼져있지만, 그 널리 퍼져있는 것 중에 하나의 수를 모든 데이터를 대표하는 수로 뽑은 것 이다. 여기서 한 발 더 나아가보면 ‘데이터들은 평균값 주변에 분포되어 있다.’는 말이 된다는 것을 알수 있다. 나비의 한종류의 몸길이 평균값이 5cm라고 가정할때 우리는 이 정보를 통해서 그 종류의 나비들은 몸길이가 정확히 5cm는 아니지만, 대략 5cm전후일 것이라고 생각할 것이다. 그다음으로 이해해야 할 것은 ‘많이 나타나는 데이터는 평균값에 주는 영향력이 크다’는 점이다. ‘히스토그램이 좌우대칭일 경우, 평균값은 대칭이 되는 축에 자리한다.’ 평균값은 합계의 의미로 봤을 때 원래의 데이터로 보기에도 손색이 없을 정도의 수라는 점. 평균값 + 평균값 + … + 평균값 =모든 데이터의 합. ‘모든 데이터를 같다고 가정해도 덧셈을 하면 본질을 잃어버리지 않는다’는 것을 의미한다.

3강 분산과 표준편차

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

No responses yet

Write a response