1. 통계의 이해
(1) 통계 개요
1) 신뢰수준 & 오차범위
성인남녀 1000명을 대상으로 한 여론조사에서 A후보 지지율 60%, B후보 지지율 30%, 신뢰수준 95%, 오차범위 3%p
■ 오차범위 3%p: A후보 지지율 60%에 대한 오차범위는 57~63%, B후보 지지율 30%에 대한 오차범위는 27~33%를 의미하는 것
■ 신뢰수준 95%: 만약 100번을 조사했을 때 A후보 지지율이 57~63%, B후보 지지율이 27~33%라는 결과가 95번 나온다는 뜻, 여론조사를 95% 믿을 수 있다는 뜻이 아니라…
■ 모집단 중 1000명을 뽑아 100번 조사를 실시했을 때, A 후보 지지율은 57~63%, B 후보 지지율은 27~33%가 나올 횟수가 95번이다.
※ %: 비율
※ %p: 퍼센트 간의 차이
2) 표본추출방법
① 단순 랜덤 추출법
i. 표본 추출 방법 중 가장 쉽고 단순한 방법
ii. N개의 모집단에서 n개의 데이터를 무작위로 추출하는 방법
ex) 사다리타기, 제비뽑기
② 계통추출법
i. 모집단의 원소에 차례로 번호를 부여한 뒤 일정한 간격을 두고 데이터를 추출하는 방법
ii. N개의 모집단에서 K개씩(K = N/n) n개의 구간으로 나눈다
iii. 첫 구간에서 하나를 임의로 선택하고 K개씩 띄어서 표본추출
③ 집락(군집: Custer)추출법
i. 데이터를 여러 집락으로 구분한 뒤, 단순 랜덤 추출법에 의하여 선택된 집락의 데이터를 표본으로 사용하는 방법
ii. 각 집락은 서로 동질적이고, 집락 내의 데이터는 서로 이질적이다
④ 층화 추출법
i. 집락 추출법과 유사하나 반대의 성격을 지닌 추출방법
ii. 데이터를 여러 집락으로 구분하지만 각 집락은 이질적이고, 집락 내의 데이터들은 동질적이다.
iii. 종류
a. 비례 층화 추출법: 전체 데이터의 분포를 반영하여 각 군집 별 데이터를 추출하는 방법
b. 불비례 층화 추출법: 전체 데이터의 분포를 반영하지 않고 각 군집에서 원하는 개수의 데이터를 추출하는 방법으로, 원하는 군집에서 원하는 표본의 개수를 추출한다.
3) 측정과 척도
① 측정: 표본조사를 실시하는 경우 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하게 관측해 자료를 얻는 것
② 척도: 관측 대상의 속성을 측정하여 그 값이 숫자로 나타나도록 일정한 규칙을 정하여 바꾸는 도구
③ 척도의 종류
i. 질적척도
c. 명목척도: 측정대상이 어느 집단에 속하는지 나타내는 자료
ex) 성별, 지역 등
d. 순서척도(서열척도): 측정대상이 명목척도이면서 서열관계를 갖는 자료
ex) 선호도, 신용도, 학년 등
ii. 양적척도
e. 구간척도(등간척도): 측정 대상이 가지고 있는 속성의 양을 측정할 수 있으며 두 구간 사이에 의미가 있는 자료
ex) 온도, 지수 등
f. 비율척도: 측정대상이 구간척도이면서 절대적 기준 0이 존재하여 사칙연산이 가능한 자료
ex) 신장, 무게, 점수, 가격 등
4) 기술통계와 추론통계
① 기술통계
i. 표본 자체의 속성이나 특징을 파악하는 데 중점을 두는 데이터 분석 통계
ii. 자료를 요약하고 조직화, 단순화하는 데 목적
② 추론통계(추리통계)
i. 수집한 데이터를 바탕으로 추론 및 예측하는 통계기법
ii. 표본에서 얻은 통계치를 바탕으로 오차를 고려하면서 모수를 확률적으로 추정하는 통계기법
iii. 표본에서 얻은 통계치를 가지고 모집단의 특성을 추정하는 데 초점을 두고 가설을 검증하거나 확률적인 가능성을 파악한다.
iv. 이를 통해 향후 발생할 수 있는 사건을 예측
t – test (0) | 2021.03.09 |
---|---|
교차분석(카이제곱분석) (0) | 2021.03.07 |
통계분석 - 추정과 가설검정 (0) | 2021.03.07 |
통계분석 - 통계 개념 (0) | 2021.03.07 |
통계분석 - 확률과 확률분포 (0) | 2021.03.07 |