详细介绍

StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习(RLHF)训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的 LLaMA 130亿模型。

StableVicuna

第一个通过RLHF训练的大规模开源聊天机器人

访问官网

作者信息

AI工具集合社区创作者
1.9k浏览
0收藏
AI训练模型

用户评分

0.0
0 人评分
5星
0
4星
0
3星
0
2星
0
1星
0

点击星星评分

用户评论

登录后参与评论
支持文明交流,禁止发布违规内容

登录后可查看评论

类似工具推荐

OpenBMB

OpenBMB

清华团队支持发起的大规模预训练语言模型库与相关工具

4924
Gemma

Gemma

谷歌推出的新一代轻量级开放模型

4874
BLOOM

BLOOM

HuggingFace推出的大型语言模型(LLM)

4809
PaLM 2

PaLM 2

Google的下一代大语言模型,超过3400亿参数

4734
Cohere

Cohere

构建AI产品的大语言模型平台

4674
HuggingFace

HuggingFace

AI模型开发社区

4311
Replicate

Replicate

在线运行开源机器学习模型

4301
DeepFloyd IF

DeepFloyd IF

StabilityAI旗下的DeepFloyd团队推出的图片生成模型

4214