品玩3月2日訊,阿里巴巴今天與清華大學聯合發佈業界最大的中文多模態預訓練AI模型M6。該模型參數規模超千億,同時具備文本、圖像的理解和生成能力,可應用於產品設計、信息檢索、機器人對話、文學創作等領域。
以圖像生成為例,模型可設計包括服飾、鞋類、傢俱、首飾、書籍等在內的30多個物品類別的圖像,最短一分鐘即可完成作品的創作,效率超越普通設計師。M6的突破源自多項底層技術創新。阿里巴巴研究團隊基於自研Whale分佈式框架,將參數規模擴展到千億的同時,利用大規模數據並行和模型並行,訓練速度提升10倍以上,僅需1-2天即可完成上億數據的預訓練。此外,M6模型首次將多模態預訓練模型應用到基於文本的圖像生成任務,結合向量量化生成對抗網絡學習文本與圖像編碼共同建模的任務,能夠生成清晰度高且細節豐富的圖像。