近年來,人工智能寫詩、創作散文、撰寫新聞稿的報道屢見不鮮,AI甚至已經進軍文學和電影領域創作小説、劇本。而文本生成技術就是實現這些成就的關鍵。文本生成,按照不同的輸入劃分,可以分為文本到文本的生成、意義到文本的生成、數據到文本的生成以及圖像到文本的生成等;具體任務形式也十分多樣,包括自動文摘、對話生成、風格遷移、結構化數據描述生成等。這些任務之間既存在一些任務驅動的特殊表示和規則,也包含相對通用的技術路線和方法。在本次「NLP前沿講座」第3講的講座中,智東西公開課邀請到哈爾濱工業大學計算機學院社會計算與信息檢索研究中心的助理研究員馮驍騁,為大家帶來主題為《面向結構化數據的文本生成技術研究》的講座。
基於結構化數據的文本生成,即機器依據用户輸入的結構化數據來輸出能描述和解釋數據的文本。例如基於數值與非數值數據生成財經報道、醫療報告、天氣預報文本和體育新聞等。從數據到文本生成主要可分為三個步驟:1)通過數據分析方法檢測數據的基本模式,針對不同應用領域輸出合適的數據模式;2)通過對輸入數據模式、事件等的分析,推斷出更復雜抽象的消息,如事件之間的因果關係等;3)從大量的信息中選擇需要被放進文本的部分並確定文本結構,最後輸出自然語言文本。而在這個過程中,所要面臨的挑戰也很多,如難以實現文本和結構化數據的對齊、數據的稀疏化導致模型的學習變得困難、由於缺乏常識和推理的引入導致結果不符合邏輯等。
8月5日晚8點,智東西公開課「NLP前沿講座」第3講將直播開講,哈工大SCIR助理研究員馮驍騁將從文本生成技術的研究進展與挑戰出發,重點圍繞基於結構化數據的文本生成技術進行深度解析,包括結構化數據的建模、背景知識的引入和麪向表格數據文本風格遷移任務的探討。對文本生成技術感興趣的朋友千萬不要錯過!
馮驍騁是哈爾濱工業大學計算機學院社會計算與信息檢索研究中心的助理研究員,於2018年1月獲得哈爾濱工業大學計算機博士學位。他的研究興趣包括文本生成、機器翻譯、機器學習和知識圖譜等,曾在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B類國際會議及期刊發表論文近20篇,論文引用數超過700次。馮驍騁老師擔任ACL,AAAI、EMNLP、IJCAI、TIST、Chinese Science等國際會議和期刊審稿人,並曾獲黑龍江省科技進步二等獎、中國中文信息學會優秀博士論文獎、中國人工智能學會全國青年創新創業大賽特等獎、全國信息檢索學術會議優秀學生論文獎。他負責主持國家青年基金一項,黑龍江省優秀青年基金一項,並作為骨幹成員參與國家重點研發課題一項、國家自然科學重點基金一項,同時擔任中國中文信息學會青年工作委員會委員。
課程內容
主題:
面向結構化數據的文本生成技術研究
提綱:
1、文本生成技術的研究與挑戰
2、基於結構化數據的文本生成技術解析與建模
3、面向表格數據的文本風格遷移任務
講師介紹
馮驍騁,哈爾濱工業大學計算機學院社會計算與信息檢索研究中心助理研究員,2018年1月獲得哈爾濱工業大學計算機博士學位;研究興趣包括文本生成、機器翻譯、機器學習、知識圖譜等;在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B類國際會議及期刊發表論文近20篇,論文引用數超過700次;擔任ACL,AAAI、EMNLP、IJCAI、TIST、Chinese Science等國際會議和期刊審稿人;曾獲黑龍江省科技進步二等獎、中國中文信息學會優秀博士論文獎、中國人工智能學會全國青年創新創業大賽特等獎、全國信息檢索學術會議優秀學生論文獎;主持國家青年基金一項,黑龍江省優秀青年基金一項,並作為骨幹成員參與國家重點研發課題一項、國家自然科學重點基金一項;擔任中國中文信息學會青年工作委員會委員。
直播信息
直播時間:8月5日20:00
直播地點:智東西公開課小程序
答疑地址:智東西公開課討論羣
加入主講羣
本次課程的講解分為主講和答疑兩部分,主講以視頻直播形式,答疑將在「智東西公開課討論羣」進行。
加入討論羣,除了可以免費收看直播之外,還能認識講師,與更多同行和同學一起學習,並進行深度討論。
添加小助手小語(ID:hilele20)即可申請,備註“姓名-公司/學校/單位-職位/專業”的朋友將會優先審核通過哦~