-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathocr_runner.yaml
103 lines (99 loc) · 2.91 KB
/
ocr_runner.yaml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
DETECTION_PREDICTION:
CKPT: !!str '/home/guest/ocr_exp_v2/text_detection/demo/weight/CTPN_FINAL_CHECKPOINT.pth'
MIN_V_OVERLAP: 0.7
MIN_SIZE_SIM: 0.7
MAX_HORI_GAP: 20 ## Max Horizontal Gap을 작게 두어야 최대한 단가 / 수량과 같은 정보가 따로 detect된다.
CONF_SCORE: 0.9 ## Confidence score 예측하는 부분에서 -> PV-RCNN에서 사용한 gt와의 IoU를 기반으로 학습하는 방법을 사용하면 어떨까? (performance based training)
IOU_THRESH: 0.2 ## NMS를 계산할때 다른, 기준 CONF_SCORE을 넘은 RoI에 대해서 계산을 하게 된다.
# 겹치는IOU score이 0.2이하인 경우에만 선택하도록 한다. (그래야 중첩이 아니라고 생각함)
ANCHOR_SHIFT: 16
FEATURE_STRIDE: 16
ANCHOR_HEIGHTS: ## anchor height는 고정시켜서 학습을 하였기 때문에
# 결국 regression loss를 학습 시킬 때에도 target값을 고정된 anchor의 크기를 사용해서 encoding을 했을 것이다.
#- 7
- 11
- 15
- 22
- 32
- 45
- 65
- 93
- 133
- 190
- 273
MIN_SCORE: 0.9
NMS_THRESH: 0.3 ## 이걸 키우게 되면
REFINEMENT: False
DETECTION_TRAINING:
LOSS_LAMDA_REG: 2.0
LOSS_LAMDA_CLS: 1.0
LOSS_LAMBDA_REFINE: 2.0
ANCHOR_IGNORE_LABEL: -1
ANCHOR_POSITIVE_LABEL: 1
ANCHOR_NEGATIVE_LABEL: 0 ## Classification layer의 학습 target label
IOU_OVERLAP_THRESH_POS: 0.5 ## 해당 anchor을 ground truth와 비교할때 pos로 설정하는 최소 IOU값
IOU_OVERLAP_THRESH_NEG: 0.3 ## 해당 anchor을 ground truth와 비교할때 neg으로 설정하는 최대 IOU값
RECOGNITION_PREDICTION:
NAME: !!str "CLOVA" # "HENNET"
CKPT: !!str '/home/guest/ocr_exp_v2/text_recognition_multi/ckpt/TEXT_RECOG_MULTI_BEST.pth'
IMG_H: 64 # 32
IMG_W: 200 # 128
MEAN: !!float 0.0
STD: !!float 1.0
USE_NUM: !!bool true
USE_ENG: !!bool true
MAX_LENGTH: !!int 25 # 45
BASE_CHARACTERS:
- ' ' ## 공백은 종성에 무조건 있기 때문에 꼭 포함을 시켜야 한다.
- 'ㄱ'
- 'ㄲ'
- 'ㄳ'
- 'ㄴ'
- 'ㄵ'
- 'ㄶ'
- 'ㄷ'
- 'ㄸ'
- 'ㄹ'
- 'ㄺ'
- 'ㄻ'
- 'ㄼ'
- 'ㄽ'
- 'ㄾ'
- 'ㄿ'
- 'ㅀ'
- 'ㅁ'
- 'ㅂ'
- 'ㅃ'
- 'ㅄ'
- 'ㅅ'
- 'ㅆ'
- 'ㅇ'
- 'ㅈ'
- 'ㅉ'
- 'ㅊ'
- 'ㅋ'
- 'ㅌ'
- 'ㅍ'
- 'ㅎ'
- 'ㅏ'
- 'ㅐ'
- 'ㅑ'
- 'ㅒ'
- 'ㅓ'
- 'ㅔ'
- 'ㅕ'
- 'ㅖ'
- 'ㅗ'
- 'ㅘ'
- 'ㅙ'
- 'ㅚ'
- 'ㅛ'
- 'ㅜ'
- 'ㅝ'
- 'ㅞ'
- 'ㅟ'
- 'ㅠ'
- 'ㅡ'
- 'ㅢ'
- 'ㅣ'
RGB: !!bool false