详细介绍

StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习（RLHF）训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本，它是一个指令微调的 LLaMA 130亿模型。

StableVicuna

第一个通过RLHF训练的大规模开源聊天机器人

访问官网

作者信息

AI工具集合社区创作者

1.9k浏览

0收藏

AI训练模型

用户评分

0.0

0 人评分

5星

4星

3星

2星

1星

点击星星评分

用户评论

登录后参与评论

支持文明交流，禁止发布违规内容

登录后可查看评论

类似工具推荐

OpenBMB

清华团队支持发起的大规模预训练语言模型库与相关工具

4924

Gemma

谷歌推出的新一代轻量级开放模型

4874

BLOOM

HuggingFace推出的大型语言模型（LLM）

4809

PaLM 2

Google的下一代大语言模型，超过3400亿参数

4734

Cohere

构建AI产品的大语言模型平台

4674

HuggingFace

AI模型开发社区

4311

Replicate

在线运行开源机器学习模型

4301

DeepFloyd IF

StabilityAI旗下的DeepFloyd团队推出的图片生成模型

4214