add .gitignore in the alldata directory

2025-07-21 18:37:41 +08:00
parent c10b0719c7
commit 5343c29e1b
16 changed files with 9860 additions and 4 deletions
--- a/.gitignore
+++ b/.gitignore
@@ -107,4 +107,4 @@ ENV/
 .vscode/
 .vs/
 .idea/
-trainer/all_data/**
+
--- a/trainer/all_data/.gitignore
+++ b/trainer/all_data/.gitignore
@@ -0,0 +1 @@
+4digit*/**
--- a/trainer/all_data/arial.ttf
+++ b/trainer/all_data/arial.ttf
--- a/trainer/all_data/folder.txt
+++ b/trainer/all_data/folder.txt
@@ -0,0 +1 @@
+place dataset folder here
--- a/trainer/all_data/generate_digits_random_fs_bg_fg.py
+++ b/trainer/all_data/generate_digits_random_fs_bg_fg.py
@@ -0,0 +1,86 @@
+
+import cv2
+import numpy as np
+import os
+import random
+from PIL import Image, ImageDraw, ImageFont
+
+X_RAND_VALUE = 2
+Y_RAND_VALUE = 1
+ROTATE_ANGLE = 3
+
+
+BG_COLORS = [
+    (33, 40, 45), (36, 51, 62), (35, 37, 154),
+    (0, 38, 202), (239, 255, 255), (241, 255, 255)
+]
+
+DIGIT_COLORS = [(34, 199, 253), (25, 214, 253)]
+
+def generate_4digit_image():
+    bg_color = random.choice(BG_COLORS)
+    font_size = random.randint(24, 30)
+    font = ImageFont.truetype("arial.ttf", font_size)
+    
+    # 扩大画布尺寸(50x160)提供足够缓冲空间
+    canvas = np.zeros((50, 160, 3), dtype=np.uint8)
+    canvas[:,:] = bg_color
+    pil_img = Image.fromarray(canvas)
+    draw = ImageDraw.Draw(pil_img)
+    
+    digits = []
+    for i in range(4):
+        digit = str(random.randint(0, 9))
+        digits.append(digit)
+        x_offset = random.randint(-X_RAND_VALUE, X_RAND_VALUE)
+        y_offset = random.randint(-Y_RAND_VALUE, Y_RAND_VALUE)
+        digit_color = random.choice(DIGIT_COLORS)
+        # 调整数字绘制位置到画布中心区域
+        draw.text((20+i*32+x_offset, 12+y_offset), digit,
+                 font=font, fill=digit_color)
+    
+    angle = random.uniform(-ROTATE_ANGLE, ROTATE_ANGLE)
+    rotated = pil_img.rotate(angle, expand=True, fillcolor=bg_color)
+    # 安全裁剪区域(从扩大后的画布中心裁剪)
+    rotated = rotated.crop((20, 10, 148, 42))
+    
+    return np.array(rotated), ''.join(digits)
+
+def generate_train_dataset(num_samples=1000):
+    os.makedirs('4digit_train', exist_ok=True)
+    with open('4digit_train/labels.csv', 'w') as f:
+        f.write(f"filename,words\n")
+        for i in range(num_samples):
+            img, label = generate_4digit_image()
+            # print(f"type of label : {type(label)}")
+            label = str(label).zfill(4)
+            img_path = f'4digit_train/{i:04d}.jpg'
+            cv2.imwrite(img_path, img)
+            f.write(f"{i:04d}.jpg,{label}\n")
+
+def generate_valid_dataset(num_samples=200):
+    os.makedirs('4digit_valid', exist_ok=True)
+    with open('4digit_valid/labels.csv', 'w') as f:
+        f.write(f"filename,words\n")
+        for i in range(num_samples):
+            img, label = generate_4digit_image()
+            label = str(label).zfill(4)
+
+            img_path = f'4digit_valid/{i:04d}.jpg'
+            cv2.imwrite(img_path, img)
+            f.write(f"{i:04d}.jpg,{label}\n")            
+
+def generate_eval_dataset(num_samples=200):
+    os.makedirs('4digit_eval', exist_ok=True)
+    with open('4digit_eval/labels.csv', 'w') as f:
+        f.write(f"filename,words\n")
+        for i in range(num_samples):
+            img, label = generate_4digit_image()
+            label = str(label).zfill(4)
+            img_path = f'4digit_eval/{i:04d}.jpg'
+            cv2.imwrite(img_path, img)
+            f.write(f"{i:04d}.jpg,{label}\n")  
+if __name__ == "__main__":
+    generate_train_dataset()
+    generate_eval_dataset()
+    generate_valid_dataset()
--- a/trainer/all_data/split_dataset.py
+++ b/trainer/all_data/split_dataset.py
@@ -0,0 +1,47 @@
+
+import os
+import shutil
+import csv
+
+def split_dataset(labels_path, img_source_dir, train_dir='train', valid_dir='valid'):
+    # 创建目标文件夹
+    os.makedirs(train_dir, exist_ok=True)
+    os.makedirs(valid_dir, exist_ok=True)
+    
+    # 初始化CSV写入器
+    train_csv = open(os.path.join(train_dir, 'labels.csv'), 'w', newline='')
+    valid_csv = open(os.path.join(valid_dir, 'labels.csv'), 'w', newline='')
+    train_writer = csv.writer(train_csv)
+    valid_writer = csv.writer(valid_csv)
+    
+    with open(labels_path, 'r') as f:
+        lines = f.readlines()
+    
+    for i, line in enumerate(lines):
+        parts = line.strip().split(',')
+        img_name = parts[0].strip()
+
+
+        label = parts[1] if len(parts) > 1 else ''
+        src_path = os.path.join(img_source_dir, img_name)
+        print(f"处理图片: {img_name}, 标签: {label}")
+        if i < 700:  # 训练集
+            dst_path = os.path.join(train_dir, img_name)
+            train_writer.writerow([img_name, label])
+        else:        # 验证集
+            dst_path = os.path.join(valid_dir, img_name)
+            valid_writer.writerow([img_name, label])
+        
+        if os.path.exists(src_path):
+            shutil.copy2(src_path, dst_path)
+        else:
+            print(f"警告：源图片不存在 {src_path}")
+    
+    train_csv.close()
+    valid_csv.close()
+
+# 使用示例
+split_dataset(
+    labels_path='en_sample/labels.csv',
+    img_source_dir='en_sample'
+)
--- a/trainer/config_files/4digit_config.yaml
+++ b/trainer/config_files/4digit_config.yaml
@@ -8,8 +8,8 @@ manualSeed: 1111
 workers: 6
 batch_size: 32 #32
 num_iter: 3000
-valInterval: 5
-saved_model: '' #'saved_models/en_filtered/iter_300000.pth'
+valInterval: 10
+saved_model: 'saved_models/4digit/best_accuracy.pth'
 FT: False
 optim: False # default is Adadelta
 lr: 1.
--- a/trainer/export_onnx.py
+++ b/trainer/export_onnx.py
@@ -0,0 +1,87 @@
+
+import torch
+import argparse
+from model import Model
+import os
+import torch.backends.cudnn as cudnn
+import yaml
+from utils import AttrDict
+import pandas as pd
+from utils import CTCLabelConverter, AttnLabelConverter, Averager
+
+
+cudnn.benchmark = True
+cudnn.deterministic = False
+
+def get_config(file_path):
+    with open(file_path, 'r', encoding="utf8") as stream:
+        opt = yaml.safe_load(stream)
+    opt = AttrDict(opt)
+
+    if opt.lang_char == 'None' and opt.symbol=='None':
+        opt.character = opt.number
+    elif opt.lang_char == 'None':
+        characters = ''
+        for data in opt['select_data'].split('-'):
+            csv_path = os.path.join(opt['train_data'], data, 'labels.csv')
+            df = pd.read_csv(csv_path, sep='^([^,]+),', engine='python',dtype={'words': str}, usecols=['filename', 'words'], keep_default_na=False)
+            all_char = ''.join(df['words'])
+            characters += ''.join(set(all_char))
+        characters = sorted(set(characters))
+        opt.character= ''.join(characters)
+    else:
+        opt.character = opt.number + opt.symbol + opt.lang_char
+    os.makedirs(f'./saved_models/{opt.experiment_name}', exist_ok=True)
+    if 'CTC' in opt.Prediction:
+        converter = CTCLabelConverter(opt.character)
+    else:
+        converter = AttnLabelConverter(opt.character)
+    opt.num_class = len(converter.character)
+    print(f"converter.character : {converter.character}")
+    print(f"字符集: {opt.character}")
+    print(f"字符集长度: {opt.num_class}")
+    os.makedirs(f'./saved_models/{opt.experiment_name}', exist_ok=True)
+    return opt
+
+def parse_args():
+    parser = argparse.ArgumentParser(description='PyTorch模型转ONNX格式工具')
+    parser.add_argument('--input', type=str, default='digit_cnn.pth',
+                      help='输入PyTorch模型路径 (默认: digit_cnn.pth)')
+    parser.add_argument('--output', type=str, default='digit_cnn.onnx',
+                      help='输出ONNX模型路径 (默认: digit_cnn.onnx)')
+    parser.add_argument('--opset', type=int, default=11,
+                      help='ONNX算子集版本 (默认: 11)')
+    return parser.parse_args()
+
+def convert_to_onnx(input_path, output_path, opset_version,opt):
+    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+
+    if opt.rgb:
+        opt.input_channel = 3
+    model = Model(opt).to(device)
+    torch.load(input_path)
+    model.eval()
+
+    dummy_input = torch.randn(1, 3, 32, 128).to(device)
+    
+    torch.onnx.export(
+        model,
+        dummy_input,
+        output_path,
+        export_params=True,
+        opset_version=opset_version,
+        do_constant_folding=True,
+        input_names=['input'],
+        output_names=['output'],
+        dynamic_axes={
+            'input': {0: 'batch_size'},
+            'output': {0: 'batch_size'}
+        }
+    )
+    print(f"模型已成功转换为 {output_path} (opset {opset_version})")
+
+if __name__ == '__main__':
+    args = parse_args()
+    opt = get_config("config_files/4digit_config.yaml")
+
+    convert_to_onnx(args.input, args.output, args.opset,opt)
--- a/trainer/saved_models/4digit/best_accuracy.pth
+++ b/trainer/saved_models/4digit/best_accuracy.pth
--- a/trainer/saved_models/4digit/best_accuracy_2507111731.pth
+++ b/trainer/saved_models/4digit/best_accuracy_2507111731.pth
--- a/trainer/saved_models/4digit/best_norm_ED.pth
+++ b/trainer/saved_models/4digit/best_norm_ED.pth
--- a/trainer/saved_models/4digit/log_dataset.txt
+++ b/trainer/saved_models/4digit/log_dataset.txt
@@ -128,3 +128,138 @@ Total_batch_size: 32 = 32
 dataset_root:    all_data/4digit_valid	 dataset: /
 sub-directory:	/.	 num samples: 200
 --------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
+--------------------------------------------------------------------------------
+dataset_root: all_data
+opt.select_data: ['4digit_train']
+opt.batch_ratio: ['1']
+--------------------------------------------------------------------------------
+dataset_root:    all_data	 dataset: 4digit_train
+sub-directory:	/4digit_train	 num samples: 1000
+num total samples of 4digit_train: 1000 x 1.0 (total_data_usage_ratio) = 1000
+num samples of 4digit_train per batch: 32 x 1.0 (batch_ratio) = 32
+--------------------------------------------------------------------------------
+Total_batch_size: 32 = 32
+--------------------------------------------------------------------------------
+dataset_root:    all_data/4digit_valid	 dataset: /
+sub-directory:	/.	 num samples: 200
+--------------------------------------------------------------------------------
--- a/trainer/saved_models/4digit/log_train.txt
+++ b/trainer/saved_models/4digit/log_train.txt
--- a/trainer/saved_models/4digit/opt.txt
+++ b/trainer/saved_models/4digit/opt.txt
@@ -90,3 +90,417 @@ freeze_SequenceModeling: False
 character: 0123456789
 num_class: 11
 ---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: 
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: 
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: 
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: 
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: 
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: saved_models/4digit/best_accuracy.pth
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: saved_models/4digit/best_accuracy.pth
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 5
+saved_model: saved_models/4digit/best_accuracy.pth
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
+------------ Options -------------
+number: 0123456789
+experiment_name: 4digit
+symbol: None
+lang_char: None
+train_data: all_data
+valid_data: all_data/4digit_valid
+manualSeed: 1111
+workers: 6
+batch_size: 32
+num_iter: 3000
+valInterval: 10
+saved_model: saved_models/4digit/best_accuracy.pth
+FT: False
+optim: False
+lr: 1.0
+beta1: 0.9
+rho: 0.95
+eps: 1e-08
+grad_clip: 5
+select_data: ['4digit_train']
+batch_ratio: ['1']
+total_data_usage_ratio: 1.0
+batch_max_length: 34
+imgH: 32
+imgW: 128
+rgb: True
+contrast_adjust: 0.0
+sensitive: True
+PAD: True
+data_filtering_off: False
+Transformation: TPS
+FeatureExtraction: ResNet
+SequenceModeling: BiLSTM
+Prediction: CTC
+num_fiducial: 20
+input_channel: 3
+output_channel: 256
+hidden_size: 256
+decode: greedy
+new_prediction: False
+freeze_FeatureFxtraction: False
+freeze_SequenceModeling: False
+character: 0123456789
+num_class: 11
+---------------------------------------
--- a/trainer/test.py
+++ b/trainer/test.py
@@ -29,12 +29,12 @@ def validation(model, criterion, evaluation_loader, converter, opt, device):
        # For max length prediction
        length_for_pred = torch.IntTensor([opt.batch_max_length] * batch_size).to(device)
        text_for_pred = torch.LongTensor(batch_size, opt.batch_max_length + 1).fill_(0).to(device)
-
        text_for_loss, length_for_loss = converter.encode(labels, batch_max_length=opt.batch_max_length)
        
        start_time = time.time()
        if 'CTC' in opt.Prediction:
            preds = model(image, text_for_pred)
+            # print(f"preds shape : {preds.shape}")
            forward_time = time.time() - start_time

            # Calculate evaluation loss for CTC decoder.
--- a/trainer/train.py
+++ b/trainer/train.py
@@ -213,6 +213,7 @@ def train(opt, show_number = 2, amp=False):
                preds = model(image, text).log_softmax(2)
                preds_size = torch.IntTensor([preds.size(1)] * batch_size)
                preds = preds.permute(1, 0, 2)
+                print(f"preds shape : {preds.shape}")
                torch.backends.cudnn.enabled = False
                cost = criterion(preds, text.to(device), preds_size.to(device), length.to(device))
                torch.backends.cudnn.enabled = True
@@ -265,6 +266,9 @@ def train(opt, show_number = 2, amp=False):
                #show_number = min(show_number, len(labels))
                
                start = random.randint(0,len(labels) - show_number )    
+                print(f"start index for showing results: {start}")
+                print(f"labels length: {len(labels)}")
+                print(f"labels : {labels}")
                for gt, pred, confidence in zip(labels[start:start+show_number], preds[start:start+show_number], confidence_score[start:start+show_number]):
                    if 'Attn' in opt.Prediction:
                        gt = gt[:gt.find('[s]')]