OGQ GYN Developers Day #18 : OGQ GPT / EN675 고도화

게시일

2024/02/15

세미나 개요

•

일시 : 2023년 01월 25일 13:00 ~ 14:00

•

장소 : Zoom 미팅

•

참여기업 (가나다순)

◦

베스트디지탈 BEST DIGITAL

◦

아이닉스 EYENIX

•

순서

참여 업체 소개

OGQ GYN 발표

•

사회자: OGQ GYN 우재현 연구원

•

발표자: OGQ GYN 정재희 연구원

Q&A

1. Previous Presentation Summary

•

저번 시간에는 기본 GPT 모델의 보안 취약점 및 가짜 정보 생성 문제에 대해서 소개드렸고, 이를 해결할 수 있는 OGQ의 폐쇄형 공공 안전 GPT 서비스인 Aloha에 대해서 소개드렸습니다.

2. OGQ GPT

LVM (Language-Vision Model)

•

OGQ GPT는 이미지와 사용자의 문장 입력을 동시에 받을 수 있는 LVM (Language-VIsion-Model)입니다.

•

LVM은 이미지를 인코딩하여 이전 대화 기록, 유저의 입력 문장을 동시에 입력으로 받아 출력을 연산합니다.

LVM Inference Speed

•

LLM의 생성 속도는 모델이 출력 결과를 만드는 데에 걸린 시간과 출력 결과의 총 길이를 기반으로 계산합니다.

•

모델이 NNN개의 토큰을 생성하는 데에 TTT의 시간이 걸렸다면 LLM의 속도인 token/s 는 다음과 같이 계산합니다.

S = {N \over T}

•

기존의 LVM은 문장 입력 뿐만 아니라 비교적 매우 큰 데이터를 담고 있는 이미지 인코딩 정보를 담고 있기 때문에 추론에 매우 많은 시간이 걸렸습니다.

OGQ GPT

•

개선된 OGQ GPT는 데이터의 양이 많은 이미지 인코딩 정보를 LLM에 넣는 대신에, 이미지를 대표할 수 있는 태그 정보를 문장과 함께 LLM에 넣는 방법을 제안합니다.

•

이미지 입력이 주어졌을 때, 인코딩 정보를 얻기 위한 이미지 인코더에 넣는 것이 아니라 OGQ의 자체 이미지 태깅 모델을 활용하여 이미지를 설명할 수 있는 태그 정보를 획득합니다.

•

얻어진 태그 정보를 입력 문장에 포함시킴으로써 언어 모델이 마치 이미지를 보고 추론하는 것과 같은 효과를 얻을 수 있습니다.

•

이와 같은 파이프라인을 통해서 개선된 OGQ GPT는 기존 모델 대비 6배 빠른 속도를 갖고 있습니다.

이미지 대표 태그 예시

3. EN675

•

EN675에 탑재되는 모델은 YOLOv7 nano로, 해당 모델을 OGQ GPT에 사용된 태깅 모델을 학습시킬 때에 사용했던 7310만 장의 데이터를 기반으로 pretraining을 진행하였습니다.

•

현재 pretraining이 진행된 모델을 기반으로 person detection, fire detection과 같은 특정 task를 수행하는 데에 특화된 모델을 fine-tuning 기법을 통해서 학습을 진행할 예정입니다.

List

NIA 초거대AI 확산 생태계 조성 사업 선정/미디어·콘텐츠 비식별화 및 클린본 데이터

IITP 정보통신·방송 기술개발사업 및 표준개발지원사업 선정/VLM 지능형 영상 보안 관제 기술 개발

NIPA AI 미디어·문화 향유 확산 사업 선정/생성형AI 기반 미디어 창작지원 서비스 개발

제2회 네이버 오지큐마켓 인공지능 경진대회

OGQ GYN Developers Day #23 : Super Resolution

OGQ GYN Developers Day #22 : ViT-CoMer

OGQ GYN Developers Day #21 : MobileNet

OGQ GYN Developers Day #20 : DHR 기반 EN675 화재 고도화

OGQ GYN Developers Day #19 : 하루 5억 건 대규모 트래픽을 고려한 Tag API 구축 방법 - 고려할 점 3가지

OGQ GYN Developers Day #18 : OGQ GPT / EN675 고도화

OGQ GYN Developers Day #17 : OGQ GYN Aloha

제1회 네이버 오지큐마켓 인공지능 경진대회

OGQ GYN Developers Day #16 : MARS

OGQ GYN Developers Day #15 : NPU+GPU Combination

OGQ GYN Developers Day #14 : PointWSSIS

OGQ GYN Developers Day #13 : Inpainting Sample

OGQ GYN Developers Day #12 : Blended Diffusion

OGQ GYN Developers Day #11 : AuxAdapt

OGQ GYN Developers Day #10 : EN675+Server

OGQ GYN Developers Day #9 : StreamYOLO

OGQ GYN Developers Day #8 : MCUNet

OGQ GYN Developers Day #7 : TinyViT

OGQ GYN Developers Day #6 : Knowledge Distillation

OGQ GYN Developers Day #5 : Fire Classification with EN675

OGQ GYN Developers Day #4 : Fire Detection with EN675

OGQ GYN의 기술블로그를 비상업적으로 사용 시 출처를 남겨주세요. 상업적 용도를 원하실 경우 문의 부탁드립니다. E-mail. tech@gynetworks.com

OGQ GYN Developers Day #18 : OGQ GPT / EN675 고도화

Contents

세미나 개요

1. Previous Presentation Summary

2. OGQ GPT

LVM (Language-Vision Model)

LVM Inference Speed

OGQ GPT

3. EN675