資料圖 北晚新視覺供圖
中文分級閱讀有了科學評定的依據——由人民教育出版社和北京大學合作開發的“兒童分級閱讀文字難度測評系統”日前正式亮相,該系統可廣泛運用於考試閱讀試題文字難度、少兒閱讀童書難度的自動測評。
北京大學計算機學院副教授、專案課題組組長吳雲芳介紹,兒童在不同的成長時期,閱讀性質和閱讀能力是完全不同的,分級閱讀的研究目標就是讓每個人都讀到適合自己的書。為此,專案組吸收了網頁、童書、教材三類語料,關注不同閱讀物件、不同內容主題在語言使用、詞彙運用上的差異,構建出目前國內最大的漢語分級閱讀語料庫。專案組還基於深度神經網路模型對漢語文字閱讀難度進行了探索。
基於大規模、多來源的語料,專案組對詞語使用狀況進行了詳細的統計分析,確定了義務教育階段分級詞表,共收錄了14459個詞語,並將其分為7級;其中,1至6級對應小學1至6個年級,7級對應初中階段。在義務教育階段分級詞表研製基礎上,人教社還啟動了兒童分級閱讀書系的編寫,目前已完成了前3級圖書的編寫。