□ 모집단 ( Population ) : 연구의 대상이 되는 모든 개체들을 모은 집합
- 일반적으로 시각적, 공간적 제약으로 인해 모집단 전체를 대상으로한 분석은 불가능
□ 표본 ( Sample ) : 모집단의 일부분의 관측값들
ex ) 전세계 인구 조사 ( population ) 이 불가능 함으로 각 나라의 일부 도시를 조사 ( sample ) 함으로서
전세계 인구 ( population ) 을 를 추정 및 추론 함
□ 모수 ( Parameter ) : 수치로 표현되는 모집단의 특성
□ 통계량 ( Statistic ) : 표본의 관측값들에 의해서 결정되는 양
자료의 종류
□ 수치형 ( 양적자료 )
※ 연속형 ( ex : 몸무게, 키 - 55.8kg , 65,3kg / 177.4 cm , 183.7 cm ... 등 사잇값이 있는 연속된 자료 )
※ 이산형 ( ex : 횟 수 - 1 , 2 , 3 , 4 ... 등 분절 될수 없는 숫자형 자료 )
□ 범주형 ( 질적자료 )
※ 순위형 ( ex : A+ , A , A0 , B+ , B , B0 ... 등 구분 된 객체에 순서가 추가 됨)
※ 명목형 ( ex : 남/녀 , 흑/백 , 좌/우 ...등 구분 된 객체 )
자료가 달라지면 행하는 '분석' 이 달라집니다
□ 반응변수 ( y ) - 종속변수, 출력변수
□ 설명변수 ( x ) - 독립변수, 입력변수
자료의 요약 또는 기술통계
자료를 받게 되면 가장 먼저 하게 되는 과정 입니다.
자료가 수 벡만개일때 각 각 자료 전체를 들여다 보는건 불가능 합니다
자료 하나 하나 가 의미가 있다기 보다는 전반적으로 어떠한 값을 가지는가
그 자료의 잡단의 형태와 값의 위치가 더 중요합니다
분석 할 떄
어떻게 잘 표현할 것인지가
그림을 그리고 분포와 결측치가 어떻게 되는가
이 변수들 간의 관계가 어떻게 되는가 를 중점으로 아래와 같이 시각화 합니다
□ 범주형 자료
도수 분포표는 각각의 범주가 카운트(도수) 가 몇개가 되는지 보기 쉽게 나열 합니다
막대 / 원형 그래프는 본질적으로는 도수에서 얻어내는 데이터를 막대랑 원형을 통해 시각화 합니다
□ 연속형 자료
대표 적으로 Box plot 이 있습니다 주식 캔들에서 흔히 볼수 있죠
실수형태를 가지고 있습니다 촘촘한 자료를 한데 묶어서 표현 할 수 있습니다
BOX 형태와 윗 꼬리, 아랫 꼬리 등에 모든 연속형 자료가 포함되어 있습니다
히스토그램
연속형 변수가 전반적으로 어디에 많이 출현하고 어디에 적게 출현하는
정규분포와 흡사한 종속변수를 그린 그림입니다.
'Foundation > 수학' 카테고리의 다른 글
정수 상수 변수 실수 (0) | 2020.07.11 |
---|---|
실수(real number) (0) | 2020.07.11 |
정수 integer (0) | 2020.07.11 |
확률 Probability (0) | 2020.06.01 |
변수 (0) | 2019.07.18 |