관리 메뉴

미래기술연구소

Titanic Prediction_데이터 불러오기 본문

카테고리 없음

Titanic Prediction_데이터 불러오기

I s a a c 2020. 10. 14. 19:41
728x90
반응형

먼저 사용할 라이브러리들을 import 해준다

분석에 필요한 이미지를 불러오기 할 때
파일 주소를 그대로 붙이면 "\ (역슬래시)" 로 표기된다 
이 부분은 수작업으로 슬래시로 고쳐주어야 한다

( 사실 분석에 필요하다기 보다는
좀 있어보이게 하고 싶었다.. )

실행하고 나면 아래와 같은 이미지를 Load 할 수 있다

같은 directory 에 이미지파일이 있다면 위 코드와 같이 모든 위치 기입 필요없이
아래와 같이 파일명만 사용하여 불러올수 있다

 

이제 데이터를 Load 할 차례이다

데이터는 Train 과 Test 총 2가지가 있다

Train data 는 총 890 개의 Data 가 있으며,
Test data 는 총 418 개의 Data 가 있다

Train Data
Test Data

이제 이 csv 형태의 data 를 Jupyter 환경으로 불러오자

여기서는 pandas 를 사용한다

같은 폴더 안에 있다면 위의 그림 처럼 주소를 전부 다 쓸 필요없이
아래와 같이 csv 파일명 만 입력해도 불러올수 있다

제대로 불러왔는지 확인해보자

2가지의 방법이 있다
train 을 그대로 출력하는 것과
train.head( ) 를 통하여 dataframe 중 상단 5개의 rows 를 출력 할 수 있다

Train

Test

2번째 방법으로
굳이 이렇게 데이터를 다 불러올 필요 없이

깔끔하게 상단 5개만 불러오는 방법도 있다

Train.head( )

Test.head( )

rows x columns 형태 확인하는 방법

Train.shape

Test.shape

 

728x90
반응형