Skip to content

[부스트캠프 AI Tech 3기 / CV-10] 글자 검출 대회 (22.04.11 - 22.04.22)

Notifications You must be signed in to change notification settings

boostcampaitech3/level2-data-annotation_cv-level2-cv-10

Repository files navigation

[Lv2 P-Stage] Data Annotation / #눈#사람

📑 Wrapup Report ▶︎ PDF

Members

김하준 송민수 심준교 유승리 이창진 전영우
눈사람_김하준 눈사람_송민수 눈사람_심준교 눈사람_유승리 눈사람_이창진 눈사람_전영우
GitHub GitHub GitHub GitHub GitHub GitHub

Competition : 글자 검출 대회

스크린샷 2022-04-22 오후 3 06 23

Introduction

스마트폰으로 카드를 결제하거나, 카메라로 카드를 인식할 경우 자동으로 카드 번호가 입력되는 경우가 있습니다. 또 주차장에 들어가면 차량 번호가 자동으로 인식되는 경우도 흔히 있습니다. 이처럼 OCR (Optimal Character Recognition) 기술은 사람이 직접 쓰거나 이미지 속에 있는 문자를 얻은 다음 이를 컴퓨터가 인식할 수 있도록 하는 기술로, 컴퓨터 비전 분야에서 현재 널리 쓰이는 대표적인 기술 중 하나입니다.

OCR task는 글자 검출 (text detection), 글자 인식 (text recognition), 정렬기 (Serializer) 등의 모듈로 이루어져 있습니다. 본 대회는 아래와 같은 특징과 제약 사항이 있습니다.

  • 본 대회에서는 '글자 검출' task 만을 해결하게 됩니다.
  • Input : 글자가 포함된 전체 이미지
  • Output : bbox 좌표가 포함된 UFO Format
  • Model : EAST (An Efficient and Accurate Scene Text Detector)

Metric

DetEval 방식

  1. 모든 정답/예측박스들에 대해서 Area Recall, Area Precision을 미리 계산
  2. 모든 정답 박스와 예측 박스를 순회하면서, 매칭이 되었는지 판단하여 박스 레벨로 정답 여부를 측정
  3. 모든 이미지에 대하여 Recall, Precision을 구한 이후, 최종 F1-Score은 모든 이미지 레벨에서 측정 값의 평균으로 측정

Dataset

  • ICDAR17_Korean
  • ICDAR17_MLT
  • ICDAR19_MLT
  • AIStages

Project Structure

본 repository의 ./data 디렉토리를 제외한 파일은 아래 프로젝트 구조 중 code 디렉토리 내에 위치하는 파일입니다.

.
|-- code
|   |-- OCR_EDA.ipynb
|   |-- convert_mlt.py
|   |-- custom_aug.py
|   |-- dataset.py
|   |-- detect.py
|   |-- deteval.py
|   |-- download_ICDAR.sh
|   |-- east_dataset.py
|   |-- inference.py
|   |-- loss.py
|   |-- model.py
|   |-- pths/
|   |-- requirements.txt
|   |-- seed.py
|   |-- train.py
|   |-- trained_models/
|   |-- urls.txt
|   `-- utils
|       |-- 01-aistages-ann-download.ipynb
|       |-- 02-cross-validation.ipynb
|       |-- 03-new-data.ipynb
|       |-- 04-combine-json.ipynb
|       `-- 05-cross-validation-full.ipynb
`-- input
    `-- data
        |-- AIStages_ANN
        |   |-- dataset
        |   `-- ufo
        |-- ICDAR17_Korean
        |   |-- images
        |   `-- ufo
        |-- ICDAR17_MLT
        |   |-- images
        |   |-- raw
        |   `-- ufo
        |-- ICDAR19_MLT
        |   |-- images
        |   |-- raw
        |   `-- ufo
        `-- Modified
            |-- images
            `-- ufo

How to Run

Installation

pip install -r requirements.txt

apt-get update
apt-get install ffmpeg libsm6 libxext6  -y

pip install mlflow

Train

python train.py --experiment_name --validation 1
  • --experiment_name [실험이름] : mlflow experiment를 생성합니다.
  • --validation 1 : validation을 수행합니다.

LB Score Chart

변동추이

Final LB Score

  • [Public] F1-Score : 0.6583, Recall : 0.5724, Precision : 0.7745
  • [Private] F1-Score : 0.6377, Recall : 0.5630, Precision : 0.7352

About

[부스트캠프 AI Tech 3기 / CV-10] 글자 검출 대회 (22.04.11 - 22.04.22)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •