相关赛道:

阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl

智东西 2023-05-17 19:52:29 来源: 智东西


去年12月,智东西公开课联合达摩院自然语言智能实验室全新策划推出了「阿里达摩院大模型公开课」,并邀请到了阿里巴巴达摩院高级算法工程师李晨亮和NLP 高级算法专家严明,分别就主题《达摩院通义 AliceMind 预训练大模型在 AIGC 文本创作的探索》、《达摩院通义 mPLUG 多模态预训练技术演进及应用实践》进行了深度讲解。想要回看的朋友可以点击文章底部“阅读原文”进行回看!


5月18日,「阿里达摩院大模型公开课」第3讲上线开讲。阿里巴巴达摩院算法专家、ChatPLUG 核心贡献者田俊峰和阿里巴巴达摩院算法工程师、mPLUG 核心贡献者叶晴昊将参与主讲。两位主讲人将对 ChatPLUG 和 mPLUG-Owl 背后的技术细节进行深入剖析。


ChatPLUG 是基于 PLUG 的一个中文对话大模型,使用亿级互联网社交数据、百科数据预训练和百万级高质量对话数据,并采用 FID(Fuse-in-Decoder)架构进行 instruction 微调得到。该模型支持高效的输入多段外部知识、人设信息等文本进行知识增强。


在与最新的开源中文对话大模型 BELLE-7M-2B 和 ChatGLM-6B 进行了多任务泛化性的人工对比评测后发现:


1)ChatPLUG-3.7B 取得了比 BELLE-7B-2M 更好的效果( Rating-A 更多,Rating-C 更少),同时对比 ChatGLM-6B 也取得了 comparable 的效果,表明了 ChatPLUG 具备良好的多任务泛化能力;


2)当将模型的 size 扩大到 13B,ChatPLUG-13B 在所有模型中取得了最优效果。


mPLUG-Owl 是一款类似于 miniGPT-4 和 LLaVA 的多模态对话生成模型,由视觉基础模型 、视觉抽象模块以及预训练语言模型组成,并且具备单模态和多模态多轮对话能力。