We investigate the task of distractor generation
Long distractor generation
Automatic evaluation
Similarity of generated distractors
BLEUやROUGEなどのスコアを用いる(そもそもこれらは正当性を図るためによく使われる評価指標なのだが,類似していることがdistractorとしては良いことだと思われている研究)
Hierarchical structure is useful
Top comments (0)