推动科技创新 发展语言智能
作者:周建设(中国语言智能研究中心主任)
发展语言智能是推动语言文字信息技术创新,扶持语言产业发展的重要任务,也是语言科技工作者的神圣使命。
增强创新意识
语言智能是语言文字信息技术创新发展的时代产物。发展语言智能必须增强科学意识,深刻认识语言智能的科学原理,深入研究语言智能。语言智能基于人脑生理属性、言语认知路径、语义生成规律,利用大数据与人工智能技术,对语言信息进行标注、抽取、加工、存储和特征分析,构拟人机语义同构关系,让机器实施类人言语行为,即让机器说话、写作、翻译、评测,实现人机语言交互。
语言智能研究应当类脑智能和计算智能二者兼顾。从语言智能角度研究类脑智能,应研究言语神经元特性、神经回路与大脑功能、神经元运作生理属性;探索人脑对语言符号的加工、记忆、联结、言语情感激发和言语输出规律;研究言语活动的问题与言语障碍治理。从人脑角度研究语言智能,难度很大,需要生命科学、脑科学、认知科学、心理学、医学、语言学等多学科交叉协同攻关。
从计算角度研究语言智能,应研究语言的符号标注、语音处理、文字识别、语块叠加、句子生成、篇章生成、语义分析、情感计算、语言理解、机器翻译、语言测评等。研究难点在于语义计算和情感计算。语义计算需要突破静态语义多义素选择与动态语义的不确定性计算难题,情感计算需要对多样态语音、个性化文字、面部表情表征颗粒以及脑电心电反应特征等进行结构化处理与精准计算。
资源库建设是语言智能研究的基础。需要依据国家语言文字发展战略,围绕语言智能发展目标,确定资源建设任务,做好顶层设计,评估建设难度,协同多方力量,分步组织实施。只有经过科学加工的语言数据才能有效助力语言智能研究,提升语言智能研究品质。
注重成果转化
资源建设、理论研究和技术研发成果,最终要转化成语言智能产品,为社会提供语言智能服务。
我国通用语言文字推广普及工作取得了巨大成效,但一些偏远贫困地区的普通话水平仍不理想,与外部地区仍存在交流困难,影响先进信息的接受,妨碍地区经济发展。这就需要语言智能,尤其是智能语音技术,辅助提升普通话推广的精度、速度和效率。
语言能力是人的认知力、思维力、逻辑力、创造力和表达力的综合体现。如何提高语言能力,是对语言智能提出的挑战性问题。这需要采集相应数据,科学分析个人的知识基础、学科倾向、思维类型、能力潜质,分析经验积累和知识摄取状况,通过智能技术手段,测评实际水准,推荐个性化知识学习内容,并辅助个性化语言能力训练。
语言智能具有文化传承的服务优势。语言是文化载体,语言精神反映民族精神。从浩瀚的古典文献中精选优秀传统文化素材,从当下日新月异的语言信息洪流中洗练文化精华,传递给当代国人,需要语言智能独特的算力。从既有的语言文字数据中分析发现文化素养和家国情怀,精准实施优秀文化教育,可以成为语言智能的常态服务。
目前,语言智能服务仍处于细分领域的单点突破阶段。发展语言智能,不但要贡献当下,更要关注未来。应当在基础理论、关键技术、产品研发及场景应用上持续发力,不断开发用户体验良好、优质高效的语言智能产品,广泛服务社会,服务全人类。
《光明日报》( 2020年10月17日 12版)
来源:光明网-《光明日报》