MSMARCO-Question-Answering/Leaderboard Results/Multi-LMQnA12052019.txt

23 строки
748 B
Plaintext

QnA Metrics
{'testlen': 721456, 'reflen': 965482, 'guess': [721456, 665867, 614097, 567114], 'correct': [434981, 296616, 242834, 208192]}
ratio: 0.7472495603232368
############################
F1: 0.7095818893165093
bleu_1: 0.42989682461133627
bleu_2: 0.36951966824455595
bleu_3: 0.3376632622786298
bleu_4: 0.3168379729035984
rouge_l: 0.49908407420805945
############################
NLGEN Metrics
{'testlen': 191730, 'reflen': 188063, 'guess': [191730, 175253, 160114, 147350], 'correct': [68986, 44464, 35192, 29734]}
ratio: 1.019498784981623
############################
F1: 1.0
bleu_1: 0.3598080634225194
bleu_2: 0.3021391340215211
bleu_3: 0.2717333026912908
bleu_4: 0.25225103085203554
rouge_l: 0.2568086849820437
############################