更多
选择
关于 CausalLM

一个致力于推动人工智能前沿发展的非营利研究组织。我们专注于全模态AI系统、高效架构和大规模合成数据。

Guanaco:一个开源、多语言、多模态大语言模型
分类:  Models
日期:  
作者:  CausalLM
本文由机器翻译。查看原文 (English)

Guanaco 是一个基于 Meta 的 LLaMA 7B 模型构建的先进指令遵循语言模型。在 Alpaca 模型最初 52K 数据集的基础上,我们额外整合了 534,530 条数据,涵盖英语、简体中文、繁体中文(台湾)、繁体中文(香港)、日语、德语以及各种语言学和语法任务。这丰富的数据使 Guanaco 能够在多语言环境中表现出色。

为了促进研究的开放性和可复现性,我们公开了 Guanaco 数据集 并发布了 模型权重。通过提供这些资源,我们希望激励更多研究人员从事相关研究,共同推动指令遵循语言模型的发展。

1. 改进的上下文和提示角色支持:

新格式设计成与 ChatGPT 类似,可以更好地与 Alpaca 格式集成,并增强整体用户体验。

指令被用作少样本上下文以支持多样化的输入和响应,使模型更容易理解用户查询并提供准确的回答。

格式如下:

### Instruction:
User: 历史用户输入
Assistant: 历史助手回答
### Input:
System: 知识
User: 新用户输入
### Response:
新助手回答

这种结构化格式可以更轻松地跟踪对话历史,并在多轮对话中保持上下文。

2. 角色扮演支持:

Guanaco 现在提供类似于 Character.AI 的高级角色扮演支持,支持英语、简体中文、繁体中文、日语和德语,使其更适合不同语言背景的用户。

用户可以指示模型扮演特定角色、历史人物或虚构角色,以及基于其输入的个性。这允许进行更引人入胜和沉浸式的对话。

模型可以使用各种信息来源为角色的背景和行为提供知识和上下文,例如百科全书条目、第一人称叙述或个性特征列表。

模型将始终以"角色名:回复"的格式输出响应,以在整个对话过程中保持所选角色,增强用户体验。

3. 拒绝回答和避免错误响应:

模型已更新,可以更有效地处理知识不足或无法提供有效响应的情况。

引入了保留关键词来指示不同场景,并与用户进行更清晰的沟通:

  • NO IDEA: 表示模型缺乏提供准确答案所需的知识,并会向用户解释这一点,鼓励他们寻找替代来源。
  • FORBIDDEN: 表示模型因特定原因(例如法律、道德或安全问题)拒绝回答,这将根据查询的上下文推断。
  • SFW: 表示模型拒绝回答问题,因为它已被过滤以排除 NSFW 内容,确保更安全、更合适的用户体验。

4. 持续话题的响应延续:

Guanaco 模型现在可以根据用户的请求继续回答问题或讨论话题,使其更具适应性,更适合扩展对话。

由系统、助手和用户角色组成的上下文结构允许模型进行多轮对话,保持上下文感知的对话,并提供更连贯的响应。

模型现在可以适应角色规范和角色设置,根据用户的偏好提供更沉浸式和定制化的对话体验。

5. 多模态视觉问答(VQA)支持:

Guanaco 将其能力扩展到多模态交互领域,现在提供视觉问答(VQA)支持。该模型通过整合 blip2-flan-t5-xxl 的多语言 VQA 任务数据来实现这一点,标志着多模态聊天机器人发展的重要里程碑。

这一新功能使模型能够解释和响应涉及文本和视觉输入的查询,提供更丰富、更互动和更全面的用户体验。用户现在可以询问有关图像的问题,模型将结合文本查询分析视觉内容以提供响应。

值得注意的新增内容是 Guanaco VQA 数据集,现已公开访问。

作为多模态聊天机器人,Guanaco 现在可以弥合视觉和语言理解之间的差距,使其成为各种应用的极其多功能的工具。

使用须知

Guanaco 模型未经过有害、偏见或露骨内容过滤。因此,可能会生成不符合道德规范的输出。请在研究或实际应用中谨慎使用该模型。

模型局限性

Guanaco 是一个 70 亿参数的模型,任何基于知识的内容都应被视为可能不准确。我们强烈建议为基于知识的回答提供可验证的来源,并告知用户此局限性,以防止虚假信息传播并保持透明度。