Which metric is best suited for evaluating the quality of a summary generated by a model?

easy📝 Conceptual Q2 of 15

NLP - Text Generation

ABLEU

BAccuracy

CROUGE

DPrecision

Step-by-Step Solution

Solution:

Step 1: Identify metric purpose
ROUGE is designed to evaluate summaries by measuring overlap of sequences like longest common subsequence.
Step 2: Compare with other metrics
BLEU is better for translation; accuracy and precision are classification metrics, not for summaries.
Final Answer:
ROUGE -> Option C
Quick Check:
Summary evaluation uses ROUGE = C [OK]

Quick Trick: Use ROUGE for summaries, BLEU for translations [OK]

Common Mistakes:

MISTAKES

Master "Text Generation" in NLP

9 interactive learning modes - each teaches the same concept differently

Want More Practice?

15+ quiz questions · All difficulty levels · Free

More NLP Quizzes