Fast Campus 강의 2강 수강후 1회 블로그 기록을
50일간 꾸준히 업로드 하는 100% 환급 챌린지 입니다
강의후기만으로 구성된 것이 아닌
강의 + 인터넷 추가자료를 기반으로 작성되었습니다
오해 없으시길 바람
그럼 이제 진짜 시작
학습에 필요한 역량!
Computer Vision
Python
Visual Studio Code
Algorithm
Machine Learning
OpenCV 4.x
Math
Numpy
Deep Learning
선행학습
• Python 기초 사용법
• NumPy 라이브러리 사용법
• 고등학교 수준의 수학 지식
▪ 참고 자료
• "OpenCV 4로 배우는 컴퓨터 비전과 머신 러닝" (길벗, 2019)
▪ Python 예제 코드: https://github.com/sunkyoo/opencv4cvml/tree/master/python
• OpenCV Tutorials ▪ https://docs.opencv.org/master/
▪ 컴퓨터 비전(Computer vision)
• 컴퓨터를 이용하여 정지 영상 또는 동영상으로부터 의미 있는 정보를 추출하는 방법을 연구하는 학문
• 즉, 사람이 눈으로 사물을 보고 인지하는 작업을 컴퓨터가 수행하게끔 만드는 학문
▪ 컴퓨터 비전과 영상 처리(image processing)
[컴퓨터 비전 (영상 처리)] vs. [(컴퓨터 비전) 영상 처리]
• 영상 처리는 영상을 입력으로 받아 화질을 개선하는 등의 처리를 하여 다시 영상을 출력으로 내보내는 작업
• 영상 처리는 컴퓨터 비전을 위한 전처리 작업
• 영상 처리는 영상을 다루는 모든 학문과 응용을 통틀어 지칭
• 컴퓨터 비전은 영상 인식과 같은 고수준의 영상 처리를 지칭
컴퓨터 비전 = 영상 처리
컴퓨터 비전 관련 분야
컴퓨터 비전 연구 분야
영상의 화질 개선
Filtering App
HDR ( High Dynamic Range Imaging )
Image Noise Reduction
Super Resolution
객체 검출(Object detection)과 영상 분할
인식(Recognition)
머신 비전(machine vision)
• 공장 자동화: 제품의 불량 검사, 위치 확인, 측정 등
• 높은 정확도와 빠른 처리 시간 요구
• 조명, 렌즈, 필터, 실시간 (Real-time) 처리
인공지능 서비스
• 입력 영상을 객체와 배경으로 분할 → 객체와 배경 인식 → 상황 인식 → 로봇과 자동차의 행동 지시
• Computer Vision + Sensor Fusion + Deep Learning
• 인공지능 로봇, Amazon Go, 구글/테슬라의 자율 주행 자동차
www.youtube.com/watch?v=NrmMk1Myrxc&feature=youtu.be&t=26
www.youtube.com/watch?v=wuhbqcMzOaw&feature=youtu.be&t=7
밥먹다가도 듣는중
영상의 표현 방법▪ 영상(image)이란?
• 픽셀(pixel)이 바둑판 모양의 격자에 나열되어 있는 형태 (2차원 행렬)
• 픽셀: 영상의 기본 단위, picture element, 화소(畵素)
Red , Green , Blue 등 RGB 로 표현한다
사진, 동영상, Display 등 영상의 모든게 RGB 로 표현 됨
▪ 그레이스케일(grayscale) 영상
• 흑백 사진처럼 색상 정보가 없이 오직 밝기 정보만으로 구성된 영상
• 밝기 정보를 256 단계로 표현
▪ 트루컬러(truecolor) 영상
• 컬러 사진처럼 색상 정보를 가지고 있어서 다양한 색상을 표현할 수 있는 영상
• Red, Green, Blue 색 성분을 256^3 단계로 표현
→ 256^3 ( 256 x 256 x 256 ) = 16,777,216 색상 표현 가능
▪ 그레이스케일 영상의 픽셀 값 표현
• 밝기 성분을 0 ~ 255 범위의 정수로 표현
• 프로그래밍 언어에서 표현 방법: 1Byte 사용
▪ C/C++ ➔ unsigned char
▪ Python ➔ numpy.uint8
▪ 컬러 영상의 픽셀 값 표현
• R, G, B 색 성분의 크기를 각각 0 ~ 255 범위의 정수로 표현
▪ 0 : 해당 색 성분이 전혀 없는 상태
▪ 255 : 해당 색 성분이 가득 있는 상태
• 프로그래밍 언어에서 표현 방법: 3Bytes 사용
▪ C/C++ ➔ 구조체, 클래스
▪ Python ➔ 튜플, numpy.ndarray
▪ 영상에서 주로 사용되는 좌표계
좌측 상단이 0,0 이 되며
x가 우측으로 갈수록 증가하고 w 라고 표현 ( width : 폭 )
t가 아래로 갈수록 증가한다 h 라고 표현 ( height : 높이 )w - by - h image
영상은 가로 x 세로 지만
행렬은 세로 x 가로 이다
▪ 그레이스케일 영상에서 픽셀 값 분포의 예
카메라맨의 일부 발췌
▪ 트루컬러 영상에서 픽셀 값 분포의 예
BGR 순서로 겹쳐져서 3차원 행렬로 색을 표현
▪ 영상 데이터 크기 분석
• 그레이스케일 영상: (가로 크기) x (세로 크기) Bytes
ㄴ 1 pixel 당 1 bytes 사용
• 트루컬러 영상: (가로 크기) x (세로 크기) 3 Bytes
BMP 는 용량이 매우 크다
JPG 는 압축을 통하여 용량이 크게 감소 하지만 손실 압축(픽셀의 값이 조금씩 바뀜)이 발생
ㄴ (영상처리에서는 JPG 사용 안함 )
GIF 는 움짤 영상으로만 사용 되고 영상처리에서는 사용 되지 않음
PNG 는 BMP 와 JPG 의 중간이라고 볼 수 있고, 투명도 지원
ㄴ ( 압축은 하되 픽셀이 바뀌지 않는 무손실 압축 지향 )
+ 추가적으로 TIF
강의 소개 자료
'etc > FastCampus 챌린지' 카테고리의 다른 글
[패스트캠퍼스 수강 후기] 컴퓨터비전인강 100% 환급 챌린지 6 회차 (0) | 2020.10.24 |
---|---|
[패스트캠퍼스 수강 후기] 컴퓨터비전인강 100% 환급 챌린지 5 회차 (0) | 2020.10.23 |
[패스트캠퍼스 수강 후기] 컴퓨터비전인강 100% 환급 챌린지 4 회차 (0) | 2020.10.22 |
[패스트캠퍼스 수강 후기] 컴퓨터비전인강 100% 환급 챌린지 3 회차 (0) | 2020.10.21 |
[패스트캠퍼스 수강 후기] 컴퓨터비전인강 100% 환급 챌린지 2 회차 (0) | 2020.10.20 |