原文链接:#/12/10196
随着生成式人工智能(AIGC)在 2022 年底席卷全球,让我们来看看这项爆炸性技术如何在中国掀起波澜。
MaaS Model as a Service 模型即服务的产业结构
47页深度研报:揭秘ChatGPT身后的AIGC技术和它的中国同行们.pdf[1]
国产AIGC大模型
企业家、研究人员和投资者正在寻找在生成人工智能领域取得进展的方法。科技公司正在设计基于开源模型的工具,以吸引消费者和企业客户。个人正在从 AI 生成的内容中获利。监管机构迅速做出反应,定义了文本、图像和视频合成的使用规则。
得益于像 Stable Diffusion 和 DALL-E 2 这样的病毒式艺术创作平台,生成式 AI 突然出现在每个人的嘴边。在地球的另一端,中国科技巨头也以其同类产品吸引了公众,为迎合中国的品味和政治气候增添了新意。
国内LLM模型:
PLUG书生(INTERN)大模型
2021 年,商汤发布了书生(INTERN)大模型,拥有 100 亿的参数量,这是一个相当庞大 的训练工作。在训练过程中,大概有 10 个以上的监督信号帮助模型,适配各种不同 的视觉或者 NLP 任务,截至 2021 年中,商汤已建成世界上最大的计算器视觉模型, 该模型拥有超过 300 亿个参数;
盘古
2021年 4 月,华为云联合循环智能发布盘古 NLP 超大 规模预训练语言模型,参数规模达 1000 亿;联合北京大学发布盘古 α 超大规模预训 练模型,参数规模达 2000 亿。
ERNIE
2021年7 月,百度推出 ERNIE 3.0 知识增强大模型,参数规模达到百亿;2022年12 月,百度推出 ERNIE 3.0 Titan 模型, 参数规模达 2600 亿。
源
2021年10 月,浪潮信息发布 约 2500 亿的超大规模预训练模型“源 1.0”;
BAGUALU开源 GLM-130B
GLM-130B:一个开放的双语预训练模型,清华大学开发
介绍如何评价清华大学发布的GLM-130B?
demo:
在线部署版:大模型130B:天启大模型的开放平台: 从这里进行注册,就可以调用我们一系列的模型了
这个是我们基于模型,加了一些策略,做出来的能对话的小呆对话:悟道(基于百亿做的):天启(基于千亿走的):
MOSS
复旦大学自然语言处理实验室国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(),邀公众参与内测。
百度 ERNIE-ViLG
这是一个在 1.45 亿个中文图像文本对的数据集上训练的100 亿参数模型。
腾讯 异次元我
另一个引起轰动的中国工具是腾讯的异次元我,它可以将人物照片变成动漫人物。它面向中国用户,在南美等其他喜欢动漫的地区出人意料地走红。
IDEA Taiyi
除了 ERNIE-ViLG,另一个大型中文文本到图像模型是 Taiyi,它是 IDEA 的心血结晶,开源 AI 模型在 2000 万个经过过滤的中文图像文本对上进行训练,具有 10 亿个参数。
与百度和其他以利润为导向的科技公司不同,IDEA 是近年来由地方政府支持的少数几个从事尖端技术研究的机构之一。IDEA 是一个由著名计算机科学家 Harry Shum 领导的研究实验室,他与他人共同创立了微软在美国以外最大的研究分支 Microsoft Research亚洲。
人工智能货币化
随着艺术家们担心被强大的人工智能所取代,中国的许多人都在利用机器学习算法以多种方式赚钱。他们不是来自最精通技术的人群。相反,她们是机会主义者或寻找额外收入来源的全职妈妈。他们意识到,通过改进提示,他们可以诱骗 AI 制作富有创意的表情符号或令人惊叹的壁纸,他们可以将其发布在社交媒体上以增加广告收入或直接收取下载费用。真正熟练的人也会向其他想加入赚钱游戏的人出售他们的提示——甚至收费培训他们。
像世界其他地方一样,中国的其他人正在他们的正式工作中使用人工智能。例如,轻小说作家可以廉价地为他们的作品制作插图,这是一种比小说更短且通常以插图为特色的类型。一个可能会颠覆制造业领域的有趣用例是使用 AI 设计 T 恤、美甲和其他消费品的印花。通过快速生成大批量原型,制造商可以节省设计成本并缩短生产周期。
一些创始人表示,企业和专业人士普遍乐于为 AI 付费,因为他们看到了直接的投资回报,因此初创公司急于开拓行业用例。一个聪明的应用来自红杉中国支持的 Surreal(后来更名为 Movio)和高瓴资本支持的 ZMO.ai,它们在大流行期间发现,由于中国关闭边境,电子商务卖家正在努力寻找外国模式。解决方案?这两家公司致力于开发生成各种形状、颜色和种族的时装模特的算法。
AI出海
但一些企业家不相信他们的人工智能 SaaS 会看到他们的西方同行(如Jasper和Stability AI)正在享受的估值飞涨和飞速增长。
多年来,无数中国创业公司告诉我他们有同样的担忧:中国的企业客户普遍不如发达经济体的企业客户愿意为SaaS付费,这就是为什么他们中的许多人开始向海外扩张的原因。
中国 SaaS 领域的竞争也是激烈的。“在美国,你可以通过构建以产品为主导的软件来做得很好,这种软件不依赖人工服务来获取或留住用户。但在中国,即使你有一个伟大的产品,你的竞争对手也可能在一夜之间窃取你的源代码并雇佣数十名客户支持人员来超越你,这些员工的成本并不高,”中国一家生成人工智能初创公司的创始人说。
销售智能初创公司 FlashCloud的创始人兼首席执行官施毅同意中国公司通常将短期回报置于长期创新之上。
“在人才培养方面,中国科技公司往往更注重应用技能和快速赚钱,”
人工智能监管
百度的文本转图像模型过滤掉了政治敏感关键词。这是预料之中的,因为审查一直是中国互联网的普遍做法。
对这个新兴领域的未来更重要的是针对政府所称的“深度合成技术”的一套新监管措施,它指的是“使用深度学习、虚拟现实和其他合成算法生成文本、图像、音频、视频和虚拟场景。”与中国其他类型的互联网服务一样,从游戏到社交媒体,用户在使用生成的 AI 应用程序之前被要求验证他们的名字。提示可以追溯到一个人的真实身份这一事实不可避免地对用户行为产生限制性影响。
但从好的方面来看,这些规则可能会导致更负责任地使用生成式人工智能,它已经在其他地方被滥用,以制造 NSFW 和性别歧视的内容。例如,中国的法规明确禁止人们生成和传播人工智能制造的假新闻。但是,如何实施取决于服务提供商。
参考资料
[1]
[47页深度研报:揭秘ChatGPT身后的AIGC技术和它的中国同行们.pdf: