CEFR
[Paper Note] UniversalCEFR: Enabling Open Multilingual Research on Language Proficiency Assessment, Joseph Marvin Imperial+, EMNLP'25, 2025.06
Paper/Blog Link My Issue
#Pocket #NLP #Dataset #EMNLP Issue Date: 2026-01-22 GPT Summary- 13の言語でCEFRレベルが注釈付けされた「UniversalCEFR」データセットを紹介。505,807のテキストを含み、標準化されたフォーマットで教育研究を支援。言語的特徴に基づく分類、ファインチューニング、プロンプティングを用いたベンチマーク実験により、CEFR評価の改善を実証。UniversalCEFRはデータ配布のベストプラクティスを確立し、研究コミュニティへのアクセスを促進することを目指す。