阿里釋出千億引數規模AI模型,可設計30多種物品高畫質影象

品玩3月2日訊,阿里巴巴今天與清華大學聯合釋出業界最大的中文多模態預訓練AI模型M6。該模型引數規模超千億,同時具備文字、影象的理解和生成能力,可應用於產品設計、資訊檢索、機器人對話、文學創作等領域。

阿里釋出千億引數規模AI模型,可設計30多種物品高畫質影象

以影象生成為例,模型可設計包括服飾、鞋類、傢俱、首飾、書籍等在內的30多個物品類別的影象,最短一分鐘即可完成作品的創作,效率超越普通設計師。M6的突破源自多項底層技術創新。阿里巴巴研究團隊基於自研Whale分散式框架,將引數規模擴充套件到千億的同時,利用大規模資料並行和模型並行,訓練速度提升10倍以上,僅需1-2天即可完成上億資料的預訓練。此外,M6模型首次將多模態預訓練模型應用到基於文字的影象生成任務,結合向量量化生成對抗網路學習文字與影象編碼共同建模的任務,能夠生成清晰度高且細節豐富的影象。

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 348 字。

轉載請註明: 阿里釋出千億引數規模AI模型,可設計30多種物品高畫質影象 - 楠木軒