admin 发表于 2023-7-14 23:19:34

General Language Model (GLM) 架构

本地部署

由清华大学开发的中英双语对话模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答 缺点就是有时候中英文掺杂


页: [1]
查看完整版本: General Language Model (GLM) 架构