상세 컨텐츠

본문 제목

통계분석

데이터분석 by파이썬

by evaseo 2021. 3. 6. 15:16

본문

 

1. 통계의 이해 

(1) 통계 개요 

1) 신뢰수준 & 오차범위 

성인남녀 1000명을 대상으로 한 여론조사에서 A후보 지지율 60%, B후보 지지율 30%, 신뢰수준 95%, 오차범위 3%p 

오차범위 3%p: A후보 지지율 60%에 대한 오차범위는 57~63%, B후보 지지율 30%에 대한 오차범위는 27~33%를 의미하는 것 

신뢰수준 95%: 만약 100번을 조사했을 때 A후보 지지율이 57~63%, B후보 지지율이 27~33%라는 결과가 95번 나온다는 뜻, 여론조사를 95% 믿을 수 있다는 뜻이 아니라… 

모집단 중 1000명을 뽑아 100번 조사를 실시했을 때, A 후보 지지율은 57~63%, B 후보 지지율은 27~33%가 나올 횟수가 95번이다. 

 

%: 비율 

%p: 퍼센트 간의 차이 

 

2) 표본추출방법 

단순 랜덤 추출법 

i. 표본 추출 방법 중 가장 쉽고 단순한 방법 

ii. N개의 모집단에서 n개의 데이터를 무작위로 추출하는 방법
ex) 사다리타기, 제비뽑기 

 

계통추출법 

i. 모집단의 원소에 차례로 번호를 부여한 뒤 일정한 간격을 두고 데이터를 추출하는 방법 

ii. N개의 모집단에서 K개씩(K = N/n) n개의 구간으로 나눈다 

iii. 첫 구간에서 하나를 임의로 선택하고 K개씩 띄어서 표본추출 

N = 12, K = 3, n = 4  

 

 

집락(군집: Custer)추출법 

i. 데이터를 여러 집락으로 구분한 뒤, 단순 랜덤 추출법에 의하여 선택된 집락의 데이터를 표본으로 사용하는 방법 

ii. 각 집락은 서로 동질적이고, 집락 내의 데이터는 서로 이질적이다 

각 집락들은 1학년, 2학년, 3학년을 고루가지고 있으므로 동질적, 집락 내에는 서로 다른 학년 데이터들이므로 데이터 간엔 이질적이다.  

 

층화 추출법 

i. 집락 추출법과 유사하나 반대의 성격을 지닌 추출방법 

ii. 데이터를 여러 집락으로 구분하지만 각 집락은 이질적이고, 집락 내의 데이터들은 동질적이다. 

iii. 종류 

a. 비례 층화 추출법: 전체 데이터의 분포를 반영하여 각 군집 별 데이터를 추출하는 방법 

b. 불비례 층화 추출법: 전체 데이터의 분포를 반영하지 않고 각 군집에서 원하는 개수의 데이터를 추출하는 방법으로, 원하는 군집에서 원하는 표본의 개수를 추출한다. 

 

3) 측정과 척도 

측정: 표본조사를 실시하는 경우 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하게 관측해 자료를 얻는 것 

척도: 관측 대상의 속성을 측정하여 그 값이 숫자로 나타나도록 일정한 규칙을 정하여 바꾸는 도구 

척도의 종류 

i. 질적척도 

c. 명목척도: 측정대상이 어느 집단에 속하는지 나타내는 자료
ex) 성별, 지역 등 

d. 순서척도(서열척도): 측정대상이 명목척도이면서 서열관계를 갖는 자료
ex) 선호도, 신용도, 학년 등 

 

ii. 양적척도 

e. 구간척도(등간척도): 측정 대상이 가지고 있는 속성의 양을 측정할 수 있으며 두 구간 사이에 의미가 있는 자료
ex) 온도, 지수 등 

f. 비율척도: 측정대상이 구간척도이면서 절대적 기준 0이 존재하여 사칙연산이 가능한 자료
ex) 신장, 무게, 점수, 가격 등 

 

4) 기술통계와 추론통계 

기술통계 

i. 표본 자체의 속성이나 특징을 파악하는 데 중점을 두는 데이터 분석 통계 

ii. 자료를 요약하고 조직화, 단순화하는 데 목적 

 

추론통계(추리통계) 

i. 수집한 데이터를 바탕으로 추론 및 예측하는 통계기법 

ii. 표본에서 얻은 통계치를 바탕으로 오차를 고려하면서 모수를 확률적으로 추정하는 통계기법 

iii. 표본에서 얻은 통계치를 가지고 모집단의 특성을 추정하는 데 초점을 두고 가설을 검증하거나 확률적인 가능성을 파악한다. 

iv. 이를 통해 향후 발생할 수 있는 사건을 예측 

'데이터분석 by파이썬' 카테고리의 다른 글

t – test  (0) 2021.03.09
교차분석(카이제곱분석)  (0) 2021.03.07
통계분석 - 추정과 가설검정  (0) 2021.03.07
통계분석 - 통계 개념  (0) 2021.03.07
통계분석 - 확률과 확률분포  (0) 2021.03.07

관련글 더보기