일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- ComputerVision
- 대학원
- 초보영어
- 코딩
- coding
- 영어회화
- opencv
- 인공지능
- 파이썬
- Vision
- Python
- 오픽
- 머신러닝
- 영어
- 딥러닝
- 머신비전
- 영어기초
- 특수대학원
- 프로그래밍
- 영어공부
- 동사
- 3dprinter
- 4차산업
- Ai
- 직장인
- 산업대학원
- 석사
- machinevision
- 파이썬gui
- C언어
- Today
- Total
미래기술연구소
광산 환경에서의 YOLO-V3 탐지 기술 개선 착용 안전모 연구 본문
1. 클러스터링 알고리즘을 통해 안전모의 선험적 상자를 예측 및 획득하고 스케일 특징을 분류합니다.
지도 학습의 반복 훈련 과정에서 반복 횟수를 늘림으로써 후보 상자를 조정하여 실제 상자에 점차적으로 접근 할 수 있습니다. 본 논문에서는 통계적 특성을 군집화하여 분포 규칙을 찾기 위해 K- 평균 군집화 알고리즘을 사용한다 [7]. 후보 상자의 크기에 대한 클러스터링 분석을 통해 실제 후보 상자는 그림 1과 같이 세 가지 크기의 피쳐 맵에 균등하게 분포됩니다
일반적으로 유클리드 거리는 클러스터링에서 큰 상자 오류를 발생시키기 쉽습니다. 이 논문에서는 중복 IOU를 사용하여 후보 상자의 크기로 인한 오류를 제거합니다 [8]. 중첩 정도 알고리즘은 후보 상자와 실제 상자의 교차를 합집합으로 나눕니다. 거리 공식은 d (상자, 중심) = 1 − IOU (상자, 중심) (1) 여기서 centroid는 클러스터의 중심을 나타냅니다. 상자는 샘플을 나타냅니다. IOU (box, centroid)는 클러스터의 중앙 프레임과 클러스터 프레임의 교차 및 병렬성을 나타냅니다. 교차 및 병합 비율 IOU는 감지 상자의 정확도를 측정하는 데 사용됩니다.
어디 비 •• 실제 상자를 나타내고 비 •• 예측 상자를 나타냅니다.
2. 딥 레지 듀얼 네트워크와 다중 규모 탐지 훈련을 결합하여 정확도 최적화 광산 안전 헬멧 인식의 어려움은 조명이 부족한 상태에서 안전 헬멧과 배경 가장자리를 구분하는 데 있습니다.
이 논문에서는 다중 스케일 탐지 훈련과 결합 된 DF-YOLOv3 깊이 잔류 네트워크를 사용하여 정확도를 최적화합니다. DF-YOLOv3는 잔차 네트워크의 크기에 따라 여러 회선 계층을 추가합니다. 의미 론적 관련성을 고려하여 DF-YOLOv3는 두 가지 기능 맵 (예측 네트워크 및 깊이 잔차 네트워크)을 중첩합니다. 마지막으로 최대 방법을 사용하여 반복되는 대상 선택 상자를 제거하고 최적의 탐지 결과를 계산합니다. 멀티 스케일 감지 방식이 고해상도 이미지에 대한 감지 효과가 더 우수하다는 점을 고려하여 본 논문에서는 감지 속도와 정확도의 균형을 맞추고 비교를 위해 서로 다른 해상도의 비디오 사진을 선택합니다.
3. 손실 무게 기능을 조정하여 대상 상자 선택 최적화 위의 복소수 기준 선택 상자에서 대상을 선별하고 예측하는 과정에서 반복적 인 경계의 선택은 주로 비 최대치에 의해 억제됩니다.
특정 시나리오에서 원래 손실 함수는 그다지 효과적이지 않습니다. 이 논문에서는 손실 함수 양자화 방법을 개선하기 위해 차원 벡터와 이미지 진실 값의 평균 제곱과 오차 값을 사용합니다 [9]. 대상 경계가있는 손실 함수 계수와없는 손실 함수 계수는 예측 프레임의 손실 계수와 판단 범주의 손실 계수를 별도로 설정할 수 있습니다. 이러한 최적화 조정을 통해 감지 대상을 포함하는 예측 프레임의 손실 계수에 더 높은 가중치를 부여하여 서로 다른 예측 시나리오의 균형을 맞출 수 있습니다. 특정 손실 함수의 공식이 제공됩니다.
매개 변수의 기능 λ𝑐𝑜𝑜𝑟𝑑 손실 함수에서 목표를 포함하는 예측 상자의 가중치를 강화하는 것입니다. 매개 변수의 기능 λ𝑛𝑜𝑜𝑏𝑗 예측의 무게를 줄이는 것입니다. 손실 함수에서 대상이없는 상자; 𝑝𝑖 (𝑐) 예측 상자의 신뢰도 점수입니다. • • ( •) 이다 목표 조건의 클래스 확률. 1𝑖𝑗 는 감지 된 물체가 No.j 상자에 나타남을 나타냅니다. 값이 1 인 No.i 그리드, 그렇지 않으면 0. 예측 손실 값을 제어하여 컨볼 루션 레이어 가중치를 향상시킵니다. 즉, tan 손실을 사용하여 손실 가중치를보다 효과적으로 제어하기 위해 기울기 변화를 제어합니다. 파생 형식은 다음과 같습니다.
is LossGrad = (𝑠𝑒𝑐2(𝑥) ∗ 𝑡𝑎𝑛(𝑥))/(𝑠𝑒𝑐2(1) ∗ 𝑡𝑎𝑛(1))
실험 결과 및 비교 분석
3.1. 실험 결과 비교 (1) 다양한 규모에서 감지 첫째, 안전모 착용 감지 요구 사항에 따라 탄광 지하 채굴 공정과 다른 규모의 네트워크 모델을 사용한 테스트의 5 가지 일반적인 작업 장면 이미지를 선택합니다. YOLO-V3-416의 테스트 정확도 및 감지 결과는 그림 3과 그림 4에 나와 있습니다.
그림 3. 다양한 척도의 결과 분석
그림 4. YOLO-V3-416 스케일에서 이미지 감지 결과 이상의 결과로부터 검출 영상 1의 인식 정확도가 크게 변함을 알 수있다. 입력 이미지 스케일은 320 * 320에서 가장 높고 608 * 608에서 가장 낮습니다. 검출 이미지 2와 4의 인식 정확도는 416 * 416에서 가장 높습니다. 감지 이미지 3과 5의 전체 인식 정확도는 크게 변하지 않는 반면, 감지 이미지 5는 320 * 320에서 더 낮습니다. (2) 다양한 시나리오에서 알고리즘의 정확도 비교 위의 다양한 스케일과 해상도에 대한 검증 분석을 기반으로 광산 환경에서 다양한 시나리오의 감지 요구 사항을 목표로,이 논문은 결론을 기반으로 단일 객체 감지, 다중 객체 감지 및 복잡한 시나리오 감지를위한 개선 된 알고리즘의 효과를 비교합니다. YOLOV3-416의 전반적인 정확도가 가장 좋습니다
그림 5. 다양한 시나리오에서 알고리즘의 정확도 비교 그림 6-8은 개선 전후 동일한 장면의 감지 결과를 보여줍니다. 단일 물체 감지의 경우 감지 정확도가 0.58에서 0.73으로 향상되어 원하는 결과를 얻습니다. 다중 감지의 경우 이미지에있는 세 가지 주요 물체의 감지 정확도가 각각 0.77, 0.88, 0.87에서 0.92, 0.86 및 0.73으로 변경되었습니다. 전체 평균 정확도는 여전히 0.84이지만 개선을 통해 근거리 인식률이 크게 향상되었으며 정확도가 원거리에서 상승 추세로 변경되었습니다. 복잡한 장면에서 물체 감지의 경우 동일하거나 유사한 색상 물체의 간섭이 있거나 문자가 부분적으로 겹치면 인식 정확도가 각각 0.62, 0.85에서 0.91 및 0.87로 증가하는 것을 확인할 수 있습니다.
3.2. 결과 분석
(1) 다른 척도의 결과 분석 피처 레이어의 수와 탐지 결과에 따라 피처 레이어가 클 때 큰 물체 나 물체를 탐지하는 데 적합하고 피처 레이어가 작을 때
작은 물체 나 물체를 감지하는 데 적합합니다. 이 탐지의 안전모는 중소형 물체의 표적에 속하는 감시 영상의 중장 거리 파노라마 촬영이다. 따라서 416 * 416은 이미지 입력 스케일의 전체 검출 결과에서 가장 높은 인식 정확도를 가지고 있습니다. 이 검증 결과를 바탕으로 감시 영상에서 감지 된 물체와 카메라 사이의 거리에 따라 입력 스케일을 선택할 수 있습니다.
그림 7. 개선 전후의 다중 물체 감지 결과 비교
그림 8. 복잡한 장면에서 개선 전후의 물체 감지 결과 비교
(2) 다양한 시나리오에서 알고리즘의 정확성 비교 및 분석 단일 물체 감지 결과는 YOLO-V3의 최적화 효과를 검증합니다. 안전 헬멧의 식별 정확도는 감지 프레임에 표적이 있거나없는 손실 기능의 중량 매개 변수를 향상 및 감소시키는 방법을 통해 분명히 향상됩니다. 감지 정확도가 0.58에서 0.73 및 15 %로 증가했습니다. 다중 물체 감지 시나리오는 채널 입구를 선택하고 거리 감지에 중점을 두어 카메라에 가까운 가까운 지점을 감지합니다. 통계적 대상 분포 및 크기를 클러스터링하여 클러스터링 분석에 중복 IOU를 사용하여 후보 상자 크기로 인한 오류를 제거합니다. 가까운 지점의 인식률은 분명히 향상 되나 장거리 지점의 인식 효과는 희생되고 다음 장거리 지점 인식 프레임의 표적이 될 때 인식 능력이 향상 될 것입니다. 들어간다. 에이 테스트에서는 근거리 감지의 정밀도가 0.77에서 0.92로 향상되어 19.5 %로 개선 효과가 분명합니다. 복잡한 장면 감지 시나리오에서 동일하거나 유사한 색상 또는 부분적으로 겹치는 문자를 가진 물체를 인식하기가 어렵습니다. 우선 색상, 노출 및 회전과 같은 다차원 모델의 학습을 강화해야하며, 다른 하나는 작업면에있는 작은 물체 나 최소한의 물체에 대한 인식 정확도를 높여야합니다. 테스트 결과를 통해 근거리 인식 정확도는 0.85에서 0.87로 향상되었지만 2 %에 불과하지만 장거리 지점의 인식 정확도는 0.62에서 0.91로 개선되었으며 개선 효과가 분명함을 확인할 수 있습니다. .
4. 결론
이 논문은 광산 환경에서 안전모 착용의 실시간 탐지 방법을 개선하고 검증한다. YOLO-V3 감지 모델을 기반으로 딥 레지 듀얼 네트워크 기술과 멀티 스케일 컨볼 루션 기능을 결합하고, 트레이닝 과정에서 멀티 스케일 감지 훈련을 결합하고, 손실 무게 함수를 조정하여 안전모 착용 감지 정확도를 높였습니다. 특히 복잡한 지하 환경에서 탐지율을 만족시키는 전제입니다. 탐지 회수율이 크게 향상되었으며 광산 환경에서 단일 물체의 탐지 정확도가 0.58에서 0.73으로 15 % 증가했습니다. 복잡한 장면에서 장거리 지점의 인식 정확도가 0.62에서 0.91 (29 %)로 향상되었습니다