首部国产对话大模型ChatYuan：功能型开源中文对话系统，现已开放下载

发布时间：2024-10-16浏览：44

大家好，今天来为大家解答首部国产对话大模型ChatYuan：功能型开源中文对话系统，现已开放下载这个问题的一些问题点，包括也一样很多人还不知道，因此呢，今天就来为大家分析分析，现在让我们一起来看看吧！如果解决了您的问题，还望您关注下本站哦，谢谢~

现在，你也可以在自己的机器上部署一个ChatYuan了！这个模型非常灵活，可以用于各种问答场景，它可以结合上下文进行对话，并执行各种生成任务，包括创意性写作。此外，它还可以回答法律和新冠等不同领域的问题。

最令人兴奋的是，它支持零样本学习，用户只需提供提示信息，就可以使用它进行文本生成、信息抽取，以及理解近30多种不同的中文任务。

ChatYuan是基于PromptCLUE-large模型训练的，使用了数亿条功能性问题和多轮对话数据进行进一步训练，模型参数达到了77亿，而显存要求只有6G左右，这意味着一张普通的民用显卡就可以加载并使用。目前，该模型已经可以下载使用。

PromptCLUE模型在1000亿token的中文语料上进行了预训练，总共学习了15万亿中文token，并通过数百种任务进行了Prompt任务式训练。

怎么使用呢？

GitHub

Huggingface

ModelScope

要加载模型，你可以使用以下预测推理方法。

PaddlePaddle

如果你想使用自己的数据来训练模型，下面是一些步骤：

组织数据

将数据按照统一的格式组织，通常包括输入和输出两部分。对于单轮问答或生成任务，输入包含任务描述和输入文本，输出则是模型需要预测的文本，就像下图中的 "小元" 后的内容一样。

对于多轮对话任务，输入会更复杂，包括任务描述、上文和输入文本，而输出仍然是系统需要预测的文本。

训练模型

你可以参考训练代码来进行训练、预测和效果验证。举个例子：

用户：你能干什么？

小元：您好！我是元语AI。我可以回答您的问题、写文章、写作业、翻译，对于一些法律等领域的问题我也可以给你提供信息。

用户：写一个诗歌，关于冬天。

小元：冬夜寂静冷，云在天边飘，冰封白雪上，寒冷像一场雪。雪花融化成冰，像那雪花飘洒，在寒冷的冬天，感受春天的喜悦。冬日里，风雪渐消，一片寂静，把快乐和温暖带回家。

用户：学前教育专业岗位实习中，在学生方面会存在问题，请提出改进措施。800字。

小元：在学前教育专业岗位实习中，在学生方面会存在一些问题，如学生缺少专业知识、缺乏合作意识、缺乏基本的责任心等等，需要我们采取措施，来解决这些问题。

首先，在实习过程中，我们需要培养学生的团队意识，加强学生与老师之间的合作，加强与家长之间的沟通，提高他们的沟通能力。另外，我们也需要加强学生的独立性，让学生学会独立思考，学会和老师、家长进行沟通，培养其独立性。

此外，在日常的工作中，我们也要为学生提供适当的机会和机会，让学生多接触社会、多参加社会活动，加深他们对社会、学校的认识，培养他们主动、积极和创新的精神。

ChatYuan的技术和训练过程

ChatYuan是基于PromptCLUE模型的进一步训练。它专注于问答、对话和生成任务，去掉了文本理解和信息抽取任务。同时，它增加了抗干扰数据，使得模型可以在需要时忽略无关的上下文，还引入了用户反馈数据，提高了模

型的通用语言理解能力和特定任务生成能力。

PromptCLUE模型的学习过程经历了三大统一：模型框架、任务形式以及应用方式的统一。这意味着它更加通用、灵活。它还进行了大规模预训练，使用了数百GB的中文语料，进行了100万步的训练，总共训练了15万亿个中文字词级别的token。这使得模型具备了强大的语言理解能力。

PromptCLUE还使用了多种任务数据，包括16种任务类型和数百种具体任务，积累了亿级别的任务数据。这使得模型在执行各种任务时表现出色。

混合预训练是模型学习的关键，一方面将下游任务数据用于预训练，另一方面将下游任务和预训练语料一起训练，减少了任务灾难遗忘，缩短了预训练和下游任务之间的距离，从而更好地适应不同的任务。

为了解决不同任务数据量差异大的问题，采用了混合采样，每个训练批次内按比例采样不同任务，同时限制任务数据量的采样上限，以减少数据偏差和训练负迁移。

分阶段训练是另一个关键步骤，预训练时采用了分阶段训练，包括训练序列长度的分阶段，以提高训练速度。下游训练也采用了分阶段训练，包括学习率和序列长度的变化，以及对下游任务的数据量限制，以更好地适应不同的任务需求。

还有增加语言模型的训练，采用了无监督训练方式，同时也使用了prefix LM方式来增强生成任务的能力。此外，模型的encoder和decoder也得到了更多的训练，以提高模型的理解和生成能力。

最后，重新构建了模型的中文字典，使用sentencepiece学习并构建了模型字典，使其更符合中文语言的习惯。

未来的工作将继续改进ChatYuan，特别是在意图理解和复杂任务方面。开发团队将根据用户的反馈不断完善和优化模型，以确保它在各种应用场景中表现出色。ChatYuan的发布为自然语言处理领域带来了新的机会和可能性，它可以成为各种任务的有力工具，帮助人们更高效地处理文本相关的工作。

用户评论

怅惘

哇，终于轮到我们中国了！一个能完全用中文交流的聊天机器人？想想以前只能用英文的 Chatgpt 就有点遗憾现在终于不用受限于语言了，期待体验一下！

有12位网友表示赞同！

执念，爱

这可是重大进步啊！国产模型ChatYuan能够开源，这意味着更多开发者可以参与进来，一起推进AI的发展。希望这款模型能做得越来越好，为我们带来更多惊喜。

有19位网友表示赞同！

◆乱世梦红颜

一直以来就觉得ChatGPT太西方化了，希望能有像咱们自己人的模型。这个ChatYuan看起来很有潜力啊，尤其是那个功能型对话特点，是不是就更方便咱平常使用呢？

有12位网友表示赞同！

别留遗憾

别高兴得太早，国产模型有很多地方可能不如外国的成熟。比如准确度、流畅度等等，都需要打磨和完善。希望这次ChatYuan能真正突破瓶颈，而不是只是个噱头。

有17位网友表示赞同！

情如薄纱

这个消息终于发布了！之前网上好多传言说要出来啦，我可是等老久！不知道这个模型能不能取代ChatGPT？

有13位网友表示赞同！

心亡则人忘

开放源代码太好了，这样大家可以共同改进。不过我还想问问，这个模型训练的数据来自什么地方？有没有考虑到数据偏差问题？

有13位网友表示赞同！

遗憾最汹涌

我比较好奇ChatYuan的功能型对话具体指的是什么？能不能给我一些具体的例子？比如在日常生活中的应用场景？

有15位网友表示赞同！

莫飞霜

作为开发者，我真的希望能多一些像ChatYuan这样优秀的开源模型。这样我们就可以更自由的进行二次开发，创造更多有趣的应用程序。

有19位网友表示赞同！

陌颜

我已经迫不及待想下载下来试试了！希望这个模型能给我带来一些灵感和乐趣。

有9位网友表示赞同！

红尘滚滚

终于有国产的ChatGPT了吗？以前用英文版总觉得不舒服。期待国内AI发展能够跟上世界潮流，创造更多突破性技术。

有8位网友表示赞同！

有些人,只适合好奇~

看到这个新闻我很难过，因为我之前一直都在使用其他海外开源模型，现在这个ChatYuan出来不知道能不能替代我的老朋友了...

有11位网友表示赞同！

冷月花魂

对于没有了解过 Chat Yuan 和 ChatGPT 的人来说，可以简单解释一下它们各自的优缺点吗？

有18位网友表示赞同！

Hello爱情风

国产ChatGPT, 这可真是一个让人振奋的消息！不过我还是比较担心数据安全和隐私保护问题。希望ChatYuan在发展过程中能够注重这些方面，给用户带来更加安心优质的服务。

有7位网友表示赞同！

陌上花

能不能再解释一下开源这个概念呢？我不太懂什么意思...

有15位网友表示赞同！

万象皆为过客

终于有能进行中文对话的聊天机器人了！真是太棒了！以后可以用它来学习语言、翻译文件、甚至写小说！

有10位网友表示赞同！

矜暮

不过，我对这款模型的功能型特性不是很满意。我希望它能够更智能化，比如可以参与到更复杂的讨论中，甚至能够像人类那样思考和解决问题。

有11位网友表示赞同！

素颜倾城

这个ChatYuan会不会成为未来人工智能的标杆？值得期待!

有18位网友表示赞同！

热点资讯