OpenAssistant,一个开源的人工智能机器人

打开助手

Open Assistant 是一个旨在让每个人都能访问基于聊天的大型语言模型的项目。

最近 莱昂社区 (大规模人工智能开放网络)通过公告揭晓 «OpenAssistant» 项目的第一个版本, 它开发了一种人工智能聊天机器人,能够以自然语言理解和回答问题,与第三方系统交互并动态提取必要的信息。

对于那些不熟悉 LAION 的人,您应该知道它开发工具、模型和数据集合来创建免费的机器学习系统(例如,LAION 集合用于训练稳定扩散图像合成系统的模型)。

除了 训练和组织工作的代码 您计算机上的机器人, 建议使用现成模型的集合 使用已经训练过的语言模型,在 600 万个请求-响应(指令-执行)形式的对话示例的基础上进行训练,在爱好者社区的参与下准备和修订。

还推出了一项评估聊天机器人质量的在线服务,使用涵盖 30 亿个参数的 OA_SFT_Llama_6B_30 知识模型。

在过去的几个月里,我们的团队不知疲倦地工作,收集了大量信息和基于文本的反馈,以创建一个极其多样化和独特的数据集,专为训练语言模型或其他 AI 应用程序而设计。

我们的数据集拥有超过 600 个人工生成的数据点,涵盖广泛的主题和写作风格,对于任何希望创建下一代教学模型的开发人员来说,这将被证明是一个非常宝贵的工具。

提高效率 系统和避免需要 存储大量预设参数,该项目预见到使用动态更新的知识库的可能性,该知识库可以通过搜索引擎或外部服务检索所需的信息。

例如,在生成响应时,机器人可以访问外部 API 以获取额外数据。 在高级功能中,个性化支持也很突出,即能够根据用户以前的短语适应特定用户。

对于那些对安装 OpenAssistant 感兴趣的人,您应该知道您可以在本地安装它,候选 Pythia SFT 模型可从 HuggingFace 获得,并且可以通过 HuggingFace Transformers 库加载。 因此,它们可以与足够的硬件一起使用。 HF 上也有空间,可以在没有自己硬件的情况下与 OA 候选人聊天。 但是,这些模型不是确定的,可能会产生不良或不需要的结果。

LLaMa SFT 模型由于 Meta 许可证不能直接发布,但 XOR 权重将很快发布。

值得一提的是,目前最小的模型(Pythia)有 12B 参数,很难在消费类硬件上运行,但可以在单个专业 GPU 上运行。 未来可能会有更小的模型,我们希望推进整数量化等方法,以帮助在更小的硬件上运行模型。

该项目不打算停止重复 ChatGPT 的功能。 Open-Assistant 有望刺激自然语言内容生成和查询处理领域的开放开发,正如开源项目 Stable Diffusion 刺激图像生成工具的发展一样。

项目代码是用 Python 编写的,并在 Apache 2.0 许可下分发。 OpenAssistant 开发可用于创建您自己的智能助手和对话系统,这些系统不依赖于外部 API 和服务。 传统的消费硬件足以工作,例如,可以在智能手机上工作。 Open Assistant 数据是根据 Creative Commons 许可发布的,该许可允许广泛的用途,包括商业用途。

最后,如果大家有兴趣既能深入了解又能查阅源码,可以查阅详情 在下面的链接中。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。