[진행 중]PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices

논문리뷰

[진행 중]PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices

TheSole 2022. 6. 21. 17:27

논문

Abstract

더 깊은 레이어와 수백만 개의 매개 변수를 늘려 놀라운 성능을 달성함 하지만 제한된 리소스 플랫폼에서는 사용하기 어려움 그래서 성능을 크게 저하시키지 않으려면 1. 가속화되고 2. 메모리 효율성이 높아야한다. 이 논문은 특히 자원이 제한된 스마트 카메라에 심층 신경망을 이식하느데 적합한 방법에 대한 조사를 제시.

첫 번째는 지식 증류, 가지치기, 양자화, 해싱, 수치 정밀도 감소, 이진화
두 번째는 아키텍처 최적화에 중점을 둔다. 네트워크 구조 향상방법.

Compression techniques

기술	방법	장점	단점
지식증류	CNN을 사용하여 더 작은 CNN을 훈련함	성능이 비슷한 소형 모델.	모델은 처음부터 훈련할 수 있다. 하지만 분류 이외의 업무는 어렵다.
해싱	뉴런을 해시 테이블에 인덱싱함	더 나은 병렬화; 더 나은 데이터 분사니 계산 시간이 적다.	모델이 너무 희소하면 상당히 느리다.
가지치기	성능에 미미한 영향을 미치는 유런을 삭제함	상당한 속도 향상 및 크기 감소; 압축률은 10배 ~ 15배(최대 30배)이다.	가지 치기 과정은 시간이 많이 걸린다 너무 희소한 모델의 경우 덜 흥미롭다.
양자화	클러스터로 수집하여 개별 뉴런의 수를 줄인다.	높은 압축률: 10x ~ 15x; 가지치기 와 결합 될 수 있다.	모델이 너무 희소하면 상당히 느리다.
수치 정밀도	뉴런의 수치적 정밀도 감소.	압축률이 높고 속도가 빨라진다.	매개변수 업테이트 중에는 더 높은 정밀도가 필요하다. 특정 하드웨어가 필요할 수 있다.
이진화	데이터의 수치 정밀도를 2비트로 줄인다.	매우 높은 압축률(30x) 및 속도 향상(50x ~ 60x).	매개변수 업데이트 중에는 더 높은 정밀도가 필요하다.