557個高頻漢字覆蓋整個語料80%的用字量
【557個高頻漢字覆蓋整個語料80%的用字量】今天教育部召開新聞發佈會 ,介紹2020年中國語言文字事業發展狀況和中國語言生活狀況。記者從發佈會上了解到,基於對國家語言資源監測語料庫2020年近9億字
【557個高頻漢字覆蓋整個語料80%的用字量】今天教育部召開新聞發佈會 ,介紹2020年中國語言文字事業發展狀況和中國語言生活狀況。記者從發佈會上了解到,基於對國家語言資源監測語料庫2020年近9億字
編輯導讀:網上衝浪,我們時常會看見一些低俗色情的不良內容,這時候就需要平台介入清除。本文作者以微信的搜一搜和看一看為例,介紹低俗色情識別任務在從看一看業務遷移到搜一搜業務中遇到的一些問題、思考以及所做
中國社會科學報國家社科基金專刊作者系國家社科基金重大項目“漢語方言自然口語有聲基礎語料庫建設”首席專家、南京師範大學文學院教授方言保護與學科發展21世紀始,人類社會發展進入數字化的信息時代、人工智能時