发帖
手机端
扫码访问
查看: 2162|回复: 0

General Language Model (GLM) 架构

[复制链接]

80

主题

352

回帖

5211

积分

管理员

积分
5211
发表于 2023-7-14 23:19:34 | 显示全部楼层 |阅读模式
本地部署

由清华大学开发的中英双语对话模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答 缺点就是有时候中英文掺杂


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表