你好,我是清风徐来
这是系列第 114 篇原创文章。
国庆刚过几天,OpenAI 公司就悄悄升级了 ChatGPT3.5 微调功能,
这项功能于 8 月 22 日上线,本公众号曾撰文,介绍了 ChatGPT3.5 微调,对行业的影响,相关理论,如何构建训练数据集,微调步骤和详细案例。
用户需要编写 python 文件,用于获取微调 ID、上传训练数据、创建微调任务。
用户不需要任何编程,官方网站上传文件,即可在 OpenAI 官方网站完成微调。
下面为您详细介绍:
一、ChatGPT 微调
微调,就是利用数据,对通用的 AI 大模型进行某方面的专业训练!
(一)AI 大模型的三个层级
「1. 通用大模型」
从零到 1,训练成本最高!耗费很高的成本,使用海量的数据训练而成,叫做 AI 通用大模型,比如闭源的 GPT,开源的 LLAMMA
俗称 AI 的“底座”,成本极高
「2. 微调专家大模型」
从 1 到 10,在大模型基础上,使用某个细分领域的数据再次进行训练、实践,成为某个领域的细分领域专家大模型。
成本几千/B~几万刀/B 不等。
技术难度很高,工程、算法、数据集,缺一不可,考手艺。
「3. 知识库」
从 10-100。在 1 或 2 的基础上,再外挂一个知识库。
结合应用,产生无穷的变化场景
如上周撰文介绍的 ,就是一个典型的“通用大模型”+“外挂知识库”+“即时通讯软件”的综合应用
(二)ChatGPT 微调
ChatGPT 是一个闭源大模型,官方开放了接口和界面,允许个人用户、企业使用自有业务数据,对通用的 GPT 模型进行微调,形成微调专家大模型。
AI 大模型微调行业的开放带来了巨大变革,企业可以基于 GPT 进行个性化微调训练,降低微调成本,提升知识库和智能体的质量。
目前,OpenAI 开通了 GPT3.5 的微调功能,GPT4.0 微调也将于近日开放。
二、ChatGPT 微调功能升级说明
最近,OpenAI 已经更新了他们的微调功能,提供了一个直观的用户界面,使用户能够在不编写任何代码的情况下进行模型的微调。
上述网址已经收录到 AI 工具网站 中