일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 대학원
- 머신러닝
- 파이썬
- 3d프린터
- 영어
- Vision
- 머신비전
- 석사
- machinevision
- GUI
- 프로그래밍
- ComputerVision
- 인공지능
- Python
- 파이썬gui
- 4차산업
- opencv
- coding
- 산업대학원
- 특수대학원
- 코딩
- 초보영어
- 동사
- C언어
- 영어공부
- 딥러닝
- 3dprinter
- 오픽
- 문자열
- 직장인
- Today
- Total
미래기술연구소
통계학 개념, 자료의 종류, 자료의 요약 본문
□ 모집단 ( Population ) : 연구의 대상이 되는 모든 개체들을 모은 집합
- 일반적으로 시각적, 공간적 제약으로 인해 모집단 전체를 대상으로한 분석은 불가능
□ 표본 ( Sample ) : 모집단의 일부분의 관측값들
ex ) 전세계 인구 조사 ( population ) 이 불가능 함으로 각 나라의 일부 도시를 조사 ( sample ) 함으로서
전세계 인구 ( population ) 을 를 추정 및 추론 함
□ 모수 ( Parameter ) : 수치로 표현되는 모집단의 특성
□ 통계량 ( Statistic ) : 표본의 관측값들에 의해서 결정되는 양
자료의 종류
□ 수치형 ( 양적자료 )
※ 연속형 ( ex : 몸무게, 키 - 55.8kg , 65,3kg / 177.4 cm , 183.7 cm ... 등 사잇값이 있는 연속된 자료 )
※ 이산형 ( ex : 횟 수 - 1 , 2 , 3 , 4 ... 등 분절 될수 없는 숫자형 자료 )
□ 범주형 ( 질적자료 )
※ 순위형 ( ex : A+ , A , A0 , B+ , B , B0 ... 등 구분 된 객체에 순서가 추가 됨)
※ 명목형 ( ex : 남/녀 , 흑/백 , 좌/우 ...등 구분 된 객체 )
자료가 달라지면 행하는 '분석' 이 달라집니다
□ 반응변수 ( y ) - 종속변수, 출력변수
□ 설명변수 ( x ) - 독립변수, 입력변수
자료의 요약 또는 기술통계
자료를 받게 되면 가장 먼저 하게 되는 과정 입니다.
자료가 수 벡만개일때 각 각 자료 전체를 들여다 보는건 불가능 합니다
자료 하나 하나 가 의미가 있다기 보다는 전반적으로 어떠한 값을 가지는가
그 자료의 잡단의 형태와 값의 위치가 더 중요합니다
분석 할 떄
어떻게 잘 표현할 것인지가
그림을 그리고 분포와 결측치가 어떻게 되는가
이 변수들 간의 관계가 어떻게 되는가 를 중점으로 아래와 같이 시각화 합니다
□ 범주형 자료
도수 분포표는 각각의 범주가 카운트(도수) 가 몇개가 되는지 보기 쉽게 나열 합니다
막대 / 원형 그래프는 본질적으로는 도수에서 얻어내는 데이터를 막대랑 원형을 통해 시각화 합니다
□ 연속형 자료
대표 적으로 Box plot 이 있습니다 주식 캔들에서 흔히 볼수 있죠
실수형태를 가지고 있습니다 촘촘한 자료를 한데 묶어서 표현 할 수 있습니다
BOX 형태와 윗 꼬리, 아랫 꼬리 등에 모든 연속형 자료가 포함되어 있습니다
히스토그램
연속형 변수가 전반적으로 어디에 많이 출현하고 어디에 적게 출현하는
정규분포와 흡사한 종속변수를 그린 그림입니다.
'Foundation > 수학' 카테고리의 다른 글
정수 상수 변수 실수 (0) | 2020.07.11 |
---|---|
실수(real number) (0) | 2020.07.11 |
정수 integer (0) | 2020.07.11 |
확률 Probability (0) | 2020.06.01 |
변수 (0) | 2019.07.18 |