본문 바로가기

Industry 4.0/Computer Vision

Computer vision _ 1강

728x90
반응형

- 오감 중에 시각은 가장 강력한 인지 기능
- 컴퓨터 비전은 컴퓨터를 이용하여 시각 기능을 갖는 기계 장치를 만드는 기술분야

 

카메라 : 시각을 과학이나 기술로 발전 시킨 결과물

 

생활 속의 응용 

팽창하는 응용

- 오락, 교통, 보안, 산업, 계산 사진학, 의료, 과학, 농업, 군사, 모바일 등

사람의 시각은 빠르고 매우 강건
ㄴ 예 ) 직관적으로 강아지/고양이 구분

컴퓨터로 사람 수준을 당ㄹ성하는 목표는 현재 기술로 불가능
ㄴ 왜 어려운가?
ㄴ 실용적인 시스템은 어떻게 만드나?

 

과학적 접근과 공학적 접근

  • 목표 1 : 사람의 시각에 맞먹는 인공 시각을 만든다. 

  • 목표 2 : 한정된 범위에서 특정한 임무를 달성하는 인공 시각을 만든다. 

  • 과학적 접근

    • 목표 1을 달성하려는 노력

    • 사람 시각의 원리를 밝혀낸 다음 컴퓨터로 모방

    • 뇌 과학의 주요 관심사

    • 지식 표현, 학습, 추론, 창작 같은 인공 지능이 필수

  • 어려운 이유

    • 역 문제(inverse problem), 3차원 영상 입력 -> 2차원 정보에서 3차원으로 추론 과정

    • 불량 문제(ill-posed problem), 조명, 그림자, 잡음, 크기, 회전, 투영 등등

    • 다양한 변형 발생 (기하학적 변환, 광도 변환)

  • 공학적 접근

    • 특정 상황에서 특정 임무를 수행하는 실용 시스템 구축

    • 많은 응용 현장에서 쓰고 있음

    • 컴퓨터 비전이 사람보다 뛰어난 경우 (예, 엔진 실린더 정밀 측정, 칩 검사 등)

    • 목표 2를 달성하려는 노력

    • 성공적인 시스템

 

  • 실용적인 성능 달성의 어려움

    • 여전히 역 문제, 불량 문제, 다양한 변환 발생

    • 영상은 숫자 배열 형태

계층적 처리

  • 전처리

    • 주로 영상 처리

  • 특징 추출

    • 에지, 선분, 영역(area), 텍스처, 지역 특징 등을 검출하고 특징 벡터 추출

  • 해석

    • 응용에 따라 다양한 형태

 

문제 해결 도구

  • 자료 구조와 알고리즘

    • 배열, 트리, 그래프, 힙, 해싱, 탐색 트리 등

    • 탐욕 방법, 동적 프로그래밍, 한정 분기 등

    • 고속 처리가 주된 관심

  • 수학

    • 선형 대수, 미적분학, 확률과 통계 등

    • 최적화 문제 풀이

  • 기계 학습

    • 기계 학습을 활용하는 사례 급증

    • 신경망, SVM, 에이더부스트, 임의 숲 등

카메라를 통한 문제를 해결하는 현업에 연계하여 프로젝트
데이터 수집 -> 알고리즘 설계 -> 성능평가

순차 처리와 피드백


  • 주어진 문제에 대한 직관적이고 철저한 이해 중요

    • 전자는 제작 쉽지만 응용 분야 한정. 보안 장치에 활용 가능하지만
      사진 분류 응용에 적용 불가능

    • 합리적 제약 조건 수립 필요

    • 예) 얼굴 인식기 ( 미간간의 거리, 인중의 형태와 길이 를 특징으로... )

크기의 일정한 정면 얼굴 vs. 자연 영상 속의 얼굴

 

데이터베이스

    • 질적으로 양적으로 우수해야 고성능 시스템 제작 가능

    • 데이터베이스=학습 집합+테스트 집합

    • 수집 방법

      • 직접 수집 (많은 비용 부담해야 하지만 개발자에게 자산)

      • 인터넷에서 다운로드 (고품질의 데이터베이스 풍부함. 부록 B 참조)

 

 

알고리즘 설계와 구현

  • 알고리즘 선택의 중요성과 어려움
    문자나, 숫자를 인식할때는 뉴럴네트워크가 성능이 상당히 좋음

    • 에지, 영역, 지역 특징 중에 어떤 것을 사용할까?
      영역을 사용한다면, 어떤 영상 분할 알고리즘을 사용할까? 어떤 추적 알고리즘을 사용할까?

    • 새로운 알고리즘 개발 또는 기존 알고리즘 중에서 주어진 문제에 적합한 것 선택

    • 예) 손 동작 인식기 제작

 

  • 선택 방법

    • 데이터베이스를 이용하여 성능 실험을 해 봄 (설계자의 경험과 직관이 중요)

    • 성능 비교 분석 논문을 참조

 

인식 성능 측정

 

리젝트 ( 기각 ) 이라 표현

콜렉트 : c
리젝트 기각 : r
오류 에러 : e

    • 부류가 심한 불균형일 때 부적절
      (예, 칩 검사에서 불량률이 0.1%라면, 임의 짐작 분류기의 정인식률은 99.9%)

혼동 행렬

    • 오류 경향을 세밀하게 분석하는데 사용



 

n11 : 참일 확률
n12 : 거짓일 확률

참/거짓 긍정률, 참/거짓 부정률, 재현률과 정확률, F 측정

 

 

인접 학문

  • 상호 협력이 강해지는 추세

    • 예) 영화 제작, 계산 사진학 등 






 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

728x90
반응형

'Industry 4.0 > Computer Vision' 카테고리의 다른 글

Computer vision _학습을 위한 자원  (0) 2020.09.08