[db:作者] 发表于 2023-5-29 01:26:56

复旦MOSS今日开源,超过100万条对话训练

近年来,人工智能技术的飞速发展推动了自然语言处理领域的快速进步。2022年4月21日,复旦大学自然语言处理实验室新版MOSS模型正式上线,成为国内首个插件增强的开源对话语言模型。

https://1rscc.1rsc.com/kaibai02/2023/04/1682080041309.png

MOSS模型是基于公开的中英文数据训练而成,并已经拥有200亿参数。该模型不仅具备和人类对话的能力,还可以通过与人类交互实现迭代优化,是一种能够自我提升的语言模型。
此次更新的新版MOSS采用了插件增强的方式,可以扩展其应用场景和功能,并提供更加多样化的交互体验。相关代码、数据和模型参数已在Github和Hugging Face等平台开放,供科研人员下载使用。其中,涵盖的数据包括超过100万条对话训练数据,这些数据将为人工智能和自然语言处理的研究和应用提供重要支持。
尽管MOSS模型在技术层面已经取得了一定的成就,但复旦大学自然语言处理实验室表示,MOSS模型距离ChatGPT等目前领先的语言模型还存在较大差距。由于缺乏多语言语料库的支持,MOSS在理解和生成非英语文本方面表现不佳。目前,该实验室正在开发改进版本,以提高其中文语言能力。
MOSS模型的发布标志着中国自然语言处理领域取得了新的突破,将为人工智能和自然语言处理技术的创新提供有力支持。随着更多的科学家加入到这一领域,在未来将会推动其实践应用的更深入和广泛发展。
页: [1]
查看完整版本: 复旦MOSS今日开源,超过100万条对话训练