Closed10

csvからsquad 2.0形式への変換プログラムの逆変換の実装について考えてみる

nabeyangnabeyang

本家のほうはis_impossibleがtrueの場合、answersが空配列で、plausible_answersがそのときのみ出てくる。今回はこれも考慮して、逆変換まで作る。

nabeyangnabeyang

Dev Setの中を見るとところどころ35\\u00b0 48\\u2032 27\\u2033みたいになってる。Pythonでは、どちらでも良さそうだけれども、これも再現させる。面倒なのはWhat lies at 37\\u00b0 8' 59.23みたいな、中途半端なのが混ざってる。

nabeyangnabeyang

JSONの比較はjqコマンドを使う

brew install jq

比較方法

diff -u <(jq -S . a.json) <(jq -S . b.json)
nabeyangnabeyang

動作確認。これで差分がでなければOKということで。

$ curl -OL https://rajpurkar.github.io/SQuAD-explorer/dataset/dev-v2.0.json
$ csv2squad2 -r -i dev-v2.0.json
$ csv2squad2 -i out.csv
$ diff -u <(jq -S . dev-v2.0.json) <(jq -S . out.json)
このスクラップは2021/09/26にクローズされました