논문리뷰

[진행 중]PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices

TheSole 2022. 6. 21. 17:27

논문

Abstract

더 깊은 레이어와 수백만 개의 매개 변수를 늘려 놀라운 성능을 달성함 하지만 제한된 리소스 플랫폼에서는 사용하기 어려움 그래서 성능을 크게 저하시키지 않으려면 1. 가속화되고 2. 메모리 효율성이 높아야한다. 이 논문은 특히 자원이 제한된 스마트 카메라에 심층 신경망을 이식하느데 적합한 방법에 대한 조사를 제시.

  • 첫 번째는 지식 증류, 가지치기, 양자화, 해싱, 수치 정밀도 감소, 이진화
  • 두 번째는 아키텍처 최적화에 중점을 둔다. 네트워크 구조 향상방법.

Compression techniques

기술 방법 장점 단점
지식증류 CNN을 사용하여 더 작은 CNN을 훈련함 성능이 비슷한 소형 모델. 모델은 처음부터 훈련할 수 있다. 하지만 분류 이외의 업무는 어렵다.
해싱 뉴런을 해시 테이블에 인덱싱함 더 나은 병렬화; 더 나은 데이터 분사니 계산 시간이 적다. 모델이 너무 희소하면 상당히 느리다.
가지치기  성능에 미미한 영향을 미치는 유런을 삭제함 상당한 속도 향상 및 크기 감소; 압축률은 10배 ~ 15배(최대 30배)이다. 가지 치기 과정은 시간이 많이 걸린다 너무 희소한 모델의 경우 덜 흥미롭다.
양자화 클러스터로 수집하여 개별 뉴런의 수를 줄인다. 높은 압축률: 10x ~ 15x; 가지치기 와 결합 될 수 있다. 모델이 너무 희소하면 상당히 느리다.
수치 정밀도 뉴런의 수치적 정밀도 감소. 압축률이 높고 속도가 빨라진다. 매개변수 업테이트 중에는 더 높은 정밀도가 필요하다. 특정 하드웨어가 필요할 수 있다.
이진화 데이터의 수치 정밀도를 2비트로 줄인다. 매우 높은 압축률(30x) 및 속도 향상(50x ~ 60x). 매개변수 업데이트 중에는 더 높은 정밀도가 필요하다.