데이터공부기록

고정 헤더 영역

글 제목

메뉴 레이어

데이터공부기록

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기 (58)
    • Django (14)
    • Python (26)
    • 데이터분석 by파이썬 (16)
    • 머신러닝 정리 (2)

검색 레이어

데이터공부기록

검색 영역

컨텐츠 검색

분류 전체보기

  • t – test

    2021.03.09 by evaseo

  • 교차분석(카이제곱분석)

    2021.03.07 by evaseo

  • 통계분석 - 추정과 가설검정

    2021.03.07 by evaseo

  • 통계분석 - 통계 개념

    2021.03.07 by evaseo

  • 통계분석 - 확률과 확률분포

    2021.03.07 by evaseo

  • 통계분석

    2021.03.06 by evaseo

  • 3. 파이썬 자료형 - (2) 문자열

    2021.03.04 by evaseo

  • 3. 파이썬 자료형 - (1) 숫자형

    2021.03.04 by evaseo

t – test

I. t – test 1. 개요 (1) 두 집단간의 평균이 통계적으로 유의미한 차이를 보이고 있는지의 여부를 검증할 때 사용되는 분석방법 (2) 모집단의 분산이나 표준편차를 알지 못할 때 표본분산으로 검정 (3) 통상적으로 표본의 크기가 30이상이면 표준정규분포와 비슷하다고 본다 (4) 모 표준편차를 모르거나 표본의 크기가 30미만이면 주로 사용하지만 모집단이 정규분포를 따른다는 가정이 있다면 표본의 크기에 관계없이 t-분포 사용가능 (5) 표본의 크기가 커질수록 중심극한의 정리에 따라 평균이 0에 가까워진다. 2. 정규성 검정 (1) 데이터 분포가 정규분포를 따르는지 검정 (2) 중심극한 정리에 따라 표본의 크기가 30이 넘으면 정규분포를 따른다고 가정하기 때문에 30개 미만의 데이터에 검사적용 (3)..

데이터분석 by파이썬 2021. 3. 9. 22:05

교차분석(카이제곱분석)

I. 교차분석(카이제곱분석) 1. 데이터나 집단의 분산을 추정하고 검정할 때 사용 2. 검정통계량으로 카이제곱 통계량 사용 3. 독립변수, 종속변수: 범주형(건수, 개수) 4. 일원카이제곱: 변인 단수 => 적합성, 선호도 - 교차분할표 미사용 (1) 범주형 변수가 한 가지로, 관찰도수가 기대도수에 일치하는지 검정한다. (2) 함수: stats.chisquere(관찰빈도, [기대빈도]) 1) 변수가 한 개일 때 사용하는 함수(기대빈도와 관찰빈도의 차이) 2) 관찰빈도와 기대빈도의 전체 수가 같아야 함 import pandas as pd import scipy.stats as stats data = [4, 6, 17, 16, 8, 9] # 관찰빈도수 - 귀무가설 기..

데이터분석 by파이썬 2021. 3. 7. 19:46

통계분석 - 추정과 가설검정

(1) 추정과 가설검정 1) 추정 ① 모수의 추정 i. 모수: 모집단의 확률분포 및 특성을 알려주는 모평균과 모분산 같은 값들 ii. 모집단 전체를 대상으로 조사하는 것은 거의 불가능해서 대부분 표본조사를 실시하여 모수를 추정 ② 점추정 i. 모수, 특히 모평균을 추정할 때 모평균을 하나의 특정한 값이라고 예측 ii. 모평균을 추정하기 위한 불편추정량은 표본평균이 대표적 iii. 불편(unbiased)추정량 a. 모수를 추정할 때 추정하는 값과 실제 모수 값의 차이의 기댓값이 0으로 어느 한쪽으로 편향되지 않아 모수를 추정하기에 이상적인 값 b. 최소의 분산을 가진 추정량이 가장 좋은 추정량 ③ 구간추정 i. 모수가 특정한 구간 안에 존재할 것이라고 예상하는 것 ii. 모수가 특정 구간 안에 포함될 확률..

데이터분석 by파이썬 2021. 3. 7. 17:38

통계분석 - 통계 개념

(1) 기댓값, 분산, 표준편차 1) 기댓값 ① 특정 사건이 시행되었을 때 확률변수 X가 취할 수 있는 값의 평균 ② 확률변수 X의 값과 그 X가 발생할 확률의 곱들의 합 ③ 관측될 것이라고 기대되는 관측 값에 대한 평균이라서 기댓값이라고 한다. ④ 확률변수의 평균(모평균)은 통계분석의 중요한 추론의 대상 2) 분산(variance) ① 데이터들이 중심에서 얼마나 떨어져 있는지를 알아보기 위한 측도 ② 편차 제곱의 평균 ※ 편차(difference) = 변량 – 평균: 평균과의 차이, 모든 편차의 합은 0 ③ 분산 값이 클수록 데이터 값이 평균으로부터 떨어짐 정도(퍼짐의 정도)가 커진다. ④ 분산이 작을수록 분포가 고르다. ⑤ 사실 분산을 숫자로 표시하긴 하지만, 그 숫자를 보고 어느정도 퍼짐이 있는지 ..

데이터분석 by파이썬 2021. 3. 7. 14:20

통계분석 - 확률과 확률분포

[참고] 알기쉬운 통계학 (134) - t분포는 언제 .. : 네이버블로그 (naver.com)

데이터분석 by파이썬 2021. 3. 7. 01:48

통계분석

1. 통계의 이해 (1) 통계 개요 1) 신뢰수준 & 오차범위 성인남녀 1000명을 대상으로 한 여론조사에서 A후보 지지율 60%, B후보 지지율 30%, 신뢰수준 95%, 오차범위 3%p ■ 오차범위 3%p: A후보 지지율 60%에 대한 오차범위는 57~63%, B후보 지지율 30%에 대한 오차범위는 27~33%를 의미하는 것 ■ 신뢰수준 95%: 만약 100번을 조사했을 때 A후보 지지율이 57~63%, B후보 지지율이 27~33%라는 결과가 95번 나온다는 뜻, 여론조사를 95% 믿을 수 있다는 뜻이 아니라… ■ 모집단 중 1000명을 뽑아 100번 조사를 실시했을 때, A 후보 지지율은 57~63%, B 후보 지지율은 27~33%가 나올 횟수가 95번이다. ※ %: 비율 ※ %p: 퍼센트 간의 차..

데이터분석 by파이썬 2021. 3. 6. 15:16

3. 파이썬 자료형 - (2) 문자열

1. 문자열 자료형 (1) 문자열 만드는 방법 4가지 1) 큰따옴표 2) 작은 따옴표 3) 큰따옴표 3개를 연속 사용(주석 & 문자열) 4) 작은따옴표 3개를 연속 사용 (주석 & 문자열) 5) 문자열에 따옴표 포함방법 ① 문자열에 큰따옴표를 포함하려면 작은따옴표로 감싸고, 작은따옴표를 포함하려면 큰 따옴표로 감싸면 된다. ② 따옴표 앞에 백슬래시(\) 사용 ※ 이스케이프 코드: 프로그래밍 할 때 사용할 수 있도록 미리 정의해 둔 ‘문자조합’ ☞ \n: 줄 바꿈, \t: 문자열 간격, \\: \를 그대로 사용, \’: 작은따옴표 사용, \”: 큰따옴표 그대로 사용 ☞ 이스케이프 문자를 인식시키지 않을 때는 문자열 앞에 r을 써주면 된다. ex) r'c:\aa\nnc\kbs.txt' => c:\aa\nnc..

Python 2021. 3. 4. 17:56

3. 파이썬 자료형 - (1) 숫자형

1. 타입확인 함수 (1) type(확인대상) (2) instance(확인대상, 타입) => true/false로 반환 2. 숫자형 (1) 정수형(int) (2) 실수형(float) 1) 소수점 표현 방식 ex) 4.3 2) 컴퓨터식 지수 표현 방식 ex) 4.24e-10 = 4.24 (3) 복소수(complex) ex) 3+4j (4) 2진수(Binary): 0b로 시작 ex) bin(10) = 0b1010 (5) 8진수(Octal): 0o 또는 0O로 시작 ex) oct(10) = 0o12 (6) 16진수(Hexadecimal): 0x로 시작 ex) hex(10) = 0xa (7) 숫자형 연산 1) a = a+1 a += 1 2) a = a * q a *= q 3) x**y = 4) x/y = 실수형..

Python 2021. 3. 4. 17:42

추가 정보

인기글

최신글

페이징

이전
1 ··· 4 5 6 7 8
다음
TISTORY
데이터공부기록 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바