General Language Model (GLM) 架构-CHATGPT - Metacosmic AI-元宇宙资源

admin 发表于 2023-7-14 23:19:34

General Language Model (GLM) 架构

本地部署

由清华大学开发的中英双语对话模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B 使用了和 ChatGLM 相同的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答缺点就是有时候中英文掺杂

页: [1]

元宇宙资源's Archiver

General Language Model (GLM) 架构