- 오감 중에 시각은 가장 강력한 인지 기능
- 컴퓨터 비전은 컴퓨터를 이용하여 시각 기능을 갖는 기계 장치를 만드는 기술분야
카메라 : 시각을 과학이나 기술로 발전 시킨 결과물
생활 속의 응용
팽창하는 응용
- 오락, 교통, 보안, 산업, 계산 사진학, 의료, 과학, 농업, 군사, 모바일 등
사람의 시각은 빠르고 매우 강건
ㄴ 예 ) 직관적으로 강아지/고양이 구분
컴퓨터로 사람 수준을 당ㄹ성하는 목표는 현재 기술로 불가능
ㄴ 왜 어려운가?
ㄴ 실용적인 시스템은 어떻게 만드나?
과학적 접근과 공학적 접근
-
목표 1 : 사람의 시각에 맞먹는 인공 시각을 만든다.
-
목표 2 : 한정된 범위에서 특정한 임무를 달성하는 인공 시각을 만든다.
-
과학적 접근
-
목표 1을 달성하려는 노력
-
사람 시각의 원리를 밝혀낸 다음 컴퓨터로 모방
-
뇌 과학의 주요 관심사
-
지식 표현, 학습, 추론, 창작 같은 인공 지능이 필수
-
어려운 이유
-
역 문제(inverse problem), 3차원 영상 입력 -> 2차원 정보에서 3차원으로 추론 과정
-
불량 문제(ill-posed problem), 조명, 그림자, 잡음, 크기, 회전, 투영 등등
-
다양한 변형 발생 (기하학적 변환, 광도 변환)
-
공학적 접근
-
특정 상황에서 특정 임무를 수행하는 실용 시스템 구축
-
많은 응용 현장에서 쓰고 있음
-
컴퓨터 비전이 사람보다 뛰어난 경우 (예, 엔진 실린더 정밀 측정, 칩 검사 등)
-
-
목표 2를 달성하려는 노력
-
성공적인 시스템
-
실용적인 성능 달성의 어려움
-
여전히 역 문제, 불량 문제, 다양한 변환 발생
-
영상은 숫자 배열 형태
-
계층적 처리
-
전처리
-
주로 영상 처리
-
특징 추출
-
에지, 선분, 영역(area), 텍스처, 지역 특징 등을 검출하고 특징 벡터 추출
-
해석
-
응용에 따라 다양한 형태
문제 해결 도구
-
자료 구조와 알고리즘
-
배열, 트리, 그래프, 힙, 해싱, 탐색 트리 등
-
탐욕 방법, 동적 프로그래밍, 한정 분기 등
-
고속 처리가 주된 관심
-
수학
-
선형 대수, 미적분학, 확률과 통계 등
-
최적화 문제 풀이
-
기계 학습
-
기계 학습을 활용하는 사례 급증
-
신경망, SVM, 에이더부스트, 임의 숲 등
카메라를 통한 문제를 해결하는 현업에 연계하여 프로젝트
데이터 수집 -> 알고리즘 설계 -> 성능평가
순차 처리와 피드백
-
주어진 문제에 대한 직관적이고 철저한 이해 중요
-
전자는 제작 쉽지만 응용 분야 한정. 보안 장치에 활용 가능하지만
사진 분류 응용에 적용 불가능
-
-
합리적 제약 조건 수립 필요
-
예) 얼굴 인식기 ( 미간간의 거리, 인중의 형태와 길이 를 특징으로... )
크기의 일정한 정면 얼굴 vs. 자연 영상 속의 얼굴
데이터베이스
-
질적으로 양적으로 우수해야 고성능 시스템 제작 가능
-
데이터베이스=학습 집합+테스트 집합
-
수집 방법
-
직접 수집 (많은 비용 부담해야 하지만 개발자에게 자산)
-
인터넷에서 다운로드 (고품질의 데이터베이스 풍부함. 부록 B 참조)
알고리즘 설계와 구현
-
알고리즘 선택의 중요성과 어려움
문자나, 숫자를 인식할때는 뉴럴네트워크가 성능이 상당히 좋음-
에지, 영역, 지역 특징 중에 어떤 것을 사용할까?
영역을 사용한다면, 어떤 영상 분할 알고리즘을 사용할까? 어떤 추적 알고리즘을 사용할까?
-
-
새로운 알고리즘 개발 또는 기존 알고리즘 중에서 주어진 문제에 적합한 것 선택
-
예) 손 동작 인식기 제작
-
선택 방법
-
데이터베이스를 이용하여 성능 실험을 해 봄 (설계자의 경험과 직관이 중요)
-
성능 비교 분석 논문을 참조
인식 성능 측정
리젝트 ( 기각 ) 이라 표현
콜렉트 : c
리젝트 기각 : r
오류 에러 : e
-
부류가 심한 불균형일 때 부적절
(예, 칩 검사에서 불량률이 0.1%라면, 임의 짐작 분류기의 정인식률은 99.9%)
혼동 행렬
-
오류 경향을 세밀하게 분석하는데 사용
n11 : 참일 확률
n12 : 거짓일 확률
참/거짓 긍정률, 참/거짓 부정률, 재현률과 정확률, F 측정
인접 학문
-
상호 협력이 강해지는 추세
-
예) 영화 제작, 계산 사진학 등
'Industry 4.0 > Computer Vision' 카테고리의 다른 글
Computer vision _학습을 위한 자원 (0) | 2020.09.08 |
---|