poetry run python3 -m asdc.convert.main_scud_example -i data/main/scud --ref data/main/dialog/json -o data/main/scud_example/main.Example.jsonl
all.jsonl
: SCUDをまとめたファイルtrain.tsv
dev.tsv
,test.tsv
: Text2Textの学習・開発・訓練のためのデータID 入力 出力
の書式
SCUDと入力とのアライメントは以下のコマンドで生成できる.
poetry run python3 -m asdc.convert.scud_alignment -i ./generated_examples_dir/main/all.jsonl -o ./generated_examples_dir/main/alignment.jsonl