资料图 北晚新视觉供图
中文分级阅读有了科学评定的依据——由人民教育出版社和北京大学合作开发的“儿童分级阅读文本难度测评系统”日前正式亮相,该系统可广泛运用于考试阅读试题文本难度、少儿阅读童书难度的自动测评。
北京大学计算机学院副教授、项目课题组组长吴云芳介绍,儿童在不同的成长时期,阅读性质和阅读能力是完全不同的,分级阅读的研究目标就是让每个人都读到适合自己的书。为此,项目组吸收了网页、童书、教材三类语料,关注不同阅读对象、不同内容主题在语言使用、词汇运用上的差异,构建出目前国内最大的汉语分级阅读语料库。项目组还基于深度神经网络模型对汉语文本阅读难度进行了探索。
基于大规模、多来源的语料,项目组对词语使用状况进行了详细的统计分析,确定了义务教育阶段分级词表,共收录了14459个词语,并将其分为7级;其中,1至6级对应小学1至6个年级,7级对应初中阶段。在义务教育阶段分级词表研制基础上,人教社还启动了儿童分级阅读书系的编写,目前已完成了前3级图书的编写。