🔥

OGQ GYN Developers Day #6 : Knowledge Distillation

게시일

2022/10/15

세미나 개요

•

일시 : 2022년 9월 28일 13:00 ~ 14:00

•

장소 : Zoom 미팅

•

참여기업 (가나다순)

◦

베스트디지탈 BEST DIGITAL

◦

아이닉스 Eyenix

◦

에스카 ESCA

◦

웹게이트 WEBGATE

◦

케이티 KT

◦

트루엔 TRUEN

•

순서

참여 업체 소개

OGQ GYN 발표

•

사회자: OGQ GYN 우재현 연구원

•

발표자: OGQ GYN 정재희 연구원

Q&A

1. Previous Presentation Summary

지난 컨퍼런스에서는 Fire Classification 모델의 성능과 수자원공사 현장 적용 사례를 소개하고, 개선 방향에 대하여 공유해드렸습니다.

#Multi-class classification(불꽃, 연기 예측), binary-class classification(불꽃, 연기 구분 없이 예측

#K-water 화재 sever 적용, 99.65% 오검출 개선

1-1. 수자원공사 현장 적용

수자원공사에 화재 Server 타입을 적용한 결과

•

적용 초기에 야간 순찰, 불빛, 빛번짐 등으로 인해 오검출이 발생하였습니다.

1-2. 개선 방향

point annotation example

Label noise 문제를 해결 가능하다면 Detection 모델로 다시 개발을 하는 것이 좋을 수 있다고 판단하였고, inductive bias 문제를 higher annotation 및 point annotation을 기반으로 해결하려 하고 있습니다.

Classification model 기반으로 확보된 weight는 Self-attention 구조 추가 및 Semi-supervised learning 기법으로 개선 예정입니다.

추가 데이터셋 또는 Server, EN675 모델 간의 성능 차이를 줄일 수 있는 기법을 적용하여 다음 버전 배포 예정입니다.

2. Knowledge Distillation

2-1. 기존 모델

•

기존 딥러닝 모델을 학습시킬 때에는 입력에 대하여 모델이 예측 결과를 만들고, 이 예측 결과와 label을 대조하여 학습시키는 방법을 사용했습니다.

•

하지만 이렇게 학습 시킨 모델은 모델의 크기에 따라서 장단점이 있습니다.

•

작은 모델의 경우 빠른 추론 속도를 가지고 있어 배포 환경에 적합하지만 낮은 정확도를 가지고 있습니다.

•

큰 모델의 경우 추론 속도가 느려 배포 환경에 부적합하지만 높은 정확도를 가지고 있습니다.

이러한 문제를 해결하기 위해 큰 모델의 정확도를 유지하면서 빠른 추론 속도를 가진 모델을 만드는 Model compression 기법들이 제안되었습니다.

모델의 각 weight의 용량을 줄이는 Quantization

모델에서 중요하지 않은 weight를 삭제하는 Pruning

큰 모델의 지식을 작은 모델로 옮기는 Knowledge distillation

2-2. Knowledge Distillation

•

Knowledge Distillation은 NIPS 2014에 제출된 Distilling the Knowledge in a Neural Network라는 논문에서 제시된 개념입니다.

•

기존의 모델을 학습할 때와는 달리, 다른 학습이 된 큰 네트워크의 출력 결과를 추가로 label로 사용하여 작은 모델을 학습시키는 것입니다.

•

이때 큰 네트워크를 teacher, 작은 네트워크를 student라고 부릅니다.

•

큰 모델의 지식을 작은 모델으로 전달(증류)하는 것과 같아 Knowledge distillation이라는 이름이 붙었습니다.

3. CWD

•

CWD(Channel-wise Knowledge Distillation)은 ICCV 2021에 제출되어 2021년 SOTA를 달성한 Semantic segmentation을 위한 Knowledge distillation 기법입니다.

•

기존의 Semantic segmentation knowledge distillation 기법은 모델이 생성하는 이미지와 객체의 특징이 담긴 feature map에 대하여 각 픽셀 별로(W * H) teacher의 결과를 따라할 수 있도록 만들었습니다.

•

CWD는 feature map의 각 채널(C)이 이미지에 포함되는 객체 영역을 나타낸다는 것을 발견하고, 이를 기준으로 결과를 따라하도록 만들었습니다.

•

CWD는 다른 knowledge distillation method들보다 학습 속도도 빠르면서, 이전 SOTA method들의 성능을 뛰어넘었습니다.

•

Semantic segmentation 뿐만 아니라 Object detection에 적용했을 때에도 가장 높은 성능을 달성한 것을 확인할 수 있습니다.

4. Development Status

4-1. Current Status

WSSS를 이용한 bounding box 생성

•

이전에 배포했던 Fire classification 모델을 기반으로 Segmentation 및 detection 모델을 개발 중에 있습니다.

•

자체 WSSS(Weakly Supervised Semantic Segementation) 기술을 이용하여 tag 정보가 있는 이미지에 대해서 mask를 생성한 뒤, mask 기반 bounding box 생성하여 학습하게 됩니다.

•

이를 통해 label 생성이 힘든 segmentation mask를 tag label로 생성 가능하기 때문에 학습에 더 많은 데이터를 이용할 수 있고, 효율적인 학습이 가능해집니다.

4-1-1. RS+EPM

RS+EPM Framework

데이터셋 별 최고성능 모델

PASCAL VOC 2012 val 순위

PASCAL VOC 2012 test 순위

COCO 2014 val 순위

•

RS+EPM은 OGQ GYN의 자체 WSSS 기술으로, 현재 모든 데이터셋 기준 가장 높은 성능을 달성하고 있는 프레임워크입니다.

4-2. Future Development

•

학습시키는 detector의 성능을 더욱 끌어올리기 위하여 데이터를 더욱 많이 사용할 필요가 있습니다.

•

현재 bounding box가 있는 데이터의 수는 36K, bounding box와 tag가 있는 데이터가 110K, label이 없는 데이터가 4M개 있습니다.

•

이 데이터들을 모두 활용하여 detector를 학습시키기 위하여 classifier가 화재가 있다고 감지했을 때, RS+EPM을 활용하여 pseudo box label을 만들어 학습을 진행중입니다.

•

또한 앞서 설명드린 knowledge distillation을 적용하여 Server타입과 EN675타입의 성능 격차를 줄이려 하고 있습니다.

•

실제 이미지가 아는 Image Generation AI를 이용하여 생성한 이미지를 학습 데이터에 포함시켜 학습했을 때 효과가 있는 지 내부적으로 검토 중에 있습니다.

List

제2회 네이버 오지큐마켓 인공지능 경진대회

OGQ GYN Developers Day #23 : Super Resolution

OGQ GYN Developers Day #22 : ViT-CoMer

OGQ GYN Developers Day #21 : MobileNet

OGQ GYN Developers Day #20 : DHR 기반 EN675 화재 고도화

OGQ GYN Developers Day #19 : 하루 5억 건 대규모 트래픽을 고려한 Tag API 구축 방법 - 고려할 점 3가지

OGQ GYN Developers Day #18 : OGQ GPT / EN675 고도화

OGQ GYN Developers Day #17 : OGQ GYN Aloha

제1회 네이버 오지큐마켓 인공지능 경진대회

OGQ GYN Developers Day #16 : MARS

OGQ GYN Developers Day #15 : NPU+GPU Combination

OGQ GYN Developers Day #14 : PointWSSIS

OGQ GYN Developers Day #13 : Inpainting Sample

OGQ GYN Developers Day #12 : Blended Diffusion

OGQ GYN Developers Day #11 : AuxAdapt

OGQ GYN Developers Day #10 : EN675+Server

OGQ GYN Developers Day #9 : StreamYOLO

OGQ GYN Developers Day #8 : MCUNet

OGQ GYN Developers Day #7 : TinyViT

OGQ GYN Developers Day #6 : Knowledge Distillation

OGQ GYN Developers Day #5 : Fire Classification with EN675

OGQ GYN Developers Day #4 : Fire Detection with EN675

OGQ GYN Developers Day #3 : Character Recognition(OCR) / Person Detection / Fire Detection with EN675

OGQ GYN Developers Day #2 : LP Detection & OCR

OGQ GYN Developers Day #1-2 : OCR

OGQ GYN의 기술블로그를 비상업적으로 사용 시 출처를 남겨주세요. 상업적 용도를 원하실 경우 문의 부탁드립니다. E-mail. tech@gynetworks.com

OGQ GYN Developers Day #6 : Knowledge Distillation

Contents

세미나 개요

1. Previous Presentation Summary

1-1. 수자원공사 현장 적용

1-2. 개선 방향

2. Knowledge Distillation

2-1. 기존 모델

2-2. Knowledge Distillation

3. CWD

4. Development Status

4-1. Current Status

4-1-1. RS+EPM

4-2. Future Development