StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习(RLHF)训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本,它是一个指令微调的 LLaMA 130亿模型。

©️ 版权声明:本站所有AI工具索引及介绍内容版权归AInav所有。未经许可,任何个人或组织不得转载、采集或建立镜像。本站部分工具介绍来源于官方公开资料,旨在促进人工智能技术的普及与应用,如有侵权请联系删除。

类似网站