본문 바로가기

Foundation/수학

통계학 개념, 자료의 종류, 자료의 요약

728x90
반응형

□ 모집단 ( Population ) : 연구의 대상이 되는 모든 개체들을 모은 집합
 - 일반적으로 시각적, 공간적 제약으로 인해 모집단 전체를 대상으로한 분석은 불가능

표본 ( Sample ) : 모집단의 일부분의 관측값들

ex ) 전세계 인구 조사 ( population ) 이 불가능 함으로 각 나라의 일부 도시를 조사 ( sample ) 함으로서
전세계 인구 ( population ) 을 를 추정 및 추론 함

□ 모수 ( Parameter ) : 수치로 표현되는 모집단의 특성

□ 통계량 ( Statistic ) : 표본의 관측값들에 의해서 결정되는 양

자료의 종류

□ 수치형 ( 양적자료 )
※  연속형 ( ex : 몸무게, 키 - 55.8kg , 65,3kg / 177.4 cm , 183.7 cm ... 등 사잇값이 있는 연속된 자료 )
※  이산형 ( ex : 횟 수 - 1 , 2 , 3 , 4 ... 등 분절 될수 없는 숫자형 자료 )

□ 범주형 ( 질적자료 )
※ 순위형 ( ex : A+ , A , A0 , B+ , B , B0 ... 등 구분 된 객체에 순서가 추가 됨) 
※ 명목형 ( ex : 남/녀 , 흑/백 , 좌/우 ...등 구분 된 객체 )

카이스퀘어(Chi-square) 검정방법

자료가 달라지면 행하는 '분석' 이 달라집니다

□ 반응변수 ( y ) - 종속변수, 출력변수

□ 설명변수 ( x ) - 독립변수, 입력변수

 


자료의 요약 또는 기술통계

자료를 받게 되면 가장 먼저 하게 되는 과정 입니다.

자료가 수 벡만개일때 각 각 자료 전체를 들여다 보는건 불가능 합니다
자료 하나 하나 가 의미가 있다기 보다는 전반적으로 어떠한 값을 가지는가 
그 자료의 잡단의 형태와 값의 위치가 더 중요합니다

분석 할 떄
어떻게 잘 표현할 것인지가
그림을 그리고 분포와 결측치가 어떻게 되는가
이 변수들 간의 관계가 어떻게 되는가 를 중점으로 아래와 같이 시각화 합니다


□ 범주형 자료

도수 분포표는 각각의 범주가 카운트(도수) 가 몇개가 되는지 보기 쉽게 나열 합니다
막대 / 원형 그래프는 본질적으로는 도수에서 얻어내는 데이터를 막대랑 원형을 통해 시각화 합니다

 

□ 연속형 자료

대표 적으로 Box plot 이 있습니다 주식 캔들에서 흔히 볼수 있죠
실수형태를 가지고 있습니다 촘촘한 자료를 한데 묶어서 표현 할 수 있습니다
BOX 형태와 윗 꼬리, 아랫 꼬리 등에 모든 연속형 자료가 포함되어 있습니다

히스토그램
연속형 변수가 전반적으로 어디에 많이 출현하고 어디에 적게 출현하는
정규분포와 흡사한 종속변수를 그린 그림입니다.

 

728x90
반응형

'Foundation > 수학' 카테고리의 다른 글

정수 상수 변수 실수  (0) 2020.07.11
실수(real number)  (0) 2020.07.11
정수 integer  (0) 2020.07.11
확률 Probability  (0) 2020.06.01
변수  (0) 2019.07.18