“通义千问”来了,阿里将为白热化的AI大模型赛道带来什么?

去年11月底ChatGPT一鸣惊人,掀起了一股“AI技术革命”的新浪潮。围绕人工智能改变世界、改变人类未来的讨论疯狂刷屏,而在热闹喧嚣的舆论场外,国内各家大厂也在这场新一轮加速的AI竞赛中加足马力、全力跟进。

3月16日,百度推出“文心一言”,标志着中国企业正式踏入这一AI新赛道,而这无疑只是一个开始。中国在这个全新的AI时代能做什么?还有多少潜力可以挖掘?我们能否赶上OpenAI并创造新的可能?AI新时代震撼冲击下所有人心中的疑问,也是中国企业们亟需完成的答卷。

4月7日,阿里巴巴旗下的大语言模型——“通义千问”开启企业邀测。用其负责人、阿里云智能CTO周靖人的话说,它不是起点、也不是终点,而是阿里自主探索道路上的“节点”。然而,“通义千问”的体验仍足够令人眼前一亮。而它所依托的阿里,则要凭借自己的独特优势在这条日趋拥挤的AI赛道上,回答外界的疑问、创造新的可能。

1、“通义千问”企业邀测开启:超出预期的体验

“AI时代开始了。”

这是比尔·盖茨去年9月体验过ChatGPT的惊人表现后得出的结论。2月10日,盖茨在接受德国《商报》播客采访时,将当前的AI发展称为“最重要的创新”,而ChatGPT的应用“将改变我们的世界”。随后他在3月21日发表博客文章,进一步阐释了ChatGPT为何是继图形用户界面后最重要的技术革命。

虽然未必严谨,但ChatGPT正在引爆新的技术革命,已经成为业内和公众某种程度上的共识,至少引发了类似的思考。从表面上看,作为聊天机器人,它互动、回答、创作的准确度在不少情况下可以媲美甚至超过人类。

而透过花样繁多的现象案例,在超强算力的给力支持下,经过充分的训练和深度的学习,ChatGPT不仅强于历史上所有的AI,更大的悬念在于,如果它以强于普通人的学习能力持续成长,“AI巨兽”未来可能实现的潜能边界在哪里?

正是这样的特质、能力与潜力,GPT无疑正在改变人类社会生活的方方面面:小到一个个可能被取代的人类岗位,中到未来的商业模式与投融资方向,大到可能被冲击、重塑的经济产业结构,甚至国与国之间的竞争,人类社会如何自处、如何与AI共处……变革正在发生,GPT所牵出的不确定性,恐怕要甚于它自带的能力。

变革与不确定性笼罩下,两种截然相反的动向竟然在同时同步地进行:一方面,马斯克与上千名业内人士发出联名信,呼吁暂停训练比GPT-4更强大的AI系统,意大利政府甚至禁止使用ChatGPT;另一方面,中国企业不敢懈怠,正在加速研发类似的AI大模型,争取进入领先赛道、参与头部竞争。

百度用“文心一言”打响了第一枪,华为“盘古”大模型何时上线也牵动外界注意力。但大家的期待显然不止于此。作为互联网行业领先的巨头,早已开始默默准备的阿里何时做出反应?4月7日开启企业邀测的“通义千问”,可能是阿里答卷的开篇。

“千问,千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的,也一定是真有学问,以及,AI和我们一样,都有千万次交互的热情。”作为大模型研发者,阿里巴巴达摩院如此解释它的命名。是否经得起“千万次的问”,是所有邀测人士的共同关切。

相比于几天前的天猫精灵大模型版的演示版本,据说这次邀测的才是“完整版”阿里GPT。通义千问亮相之前,达摩院曾研发世界首个突破10万亿参数的AI大模型,还联手中国计算机学会(CCF)开源发展委员会,搭建了国内规模最大的 AI 模型服务社区 “魔搭”。通义千问的出现,早有伏笔。

在测试实践体验中,用知名互联网消费互动媒体TechWeb的话说,“有惊喜也有惊讶”。

图片[1]-“通义千问”来了,阿里将为白热化的AI大模型赛道带来什么?-JieYingAI捷鹰AI

它的主界面简洁明了,明确介绍自己是“专门响应人类指令的大模型”,给出了电影脚本、写封邮件、职场助理、撰写短文等示例。值得注意的是,通义千问还有单独的“百宝袋”板块,演示并提供了九种特定话题场景、文本体裁的内容输出。

作为中国创造,中文无疑是通义千问明显的“母语优势”。在各种对话实例中,它对中文语义的理解能力(包括诸如“李四壮差点上上上上海的车”这类拗口语句)、逻辑推断能力、科技与知识理解分享、文学理解与创作、应用写作等方面,均表现出不逊于GPT3.5、与文心一言各有所长的特点。

当然,它在其它语言中的表现也并不差。

通义千问目前尚不能直接生成图片,专注于生成文本、编写代码等内容输出领域。它生成的答案看起来比ChatGPT和文心一言更偏向于理性、注重逻辑、严谨,似乎更擅长于科学类知识(或许是此前阿里基于业务需要的训练倾向所致)。

它不会混淆“苹果电脑”和“自产苹果”,写出的小学生作文被在读学生认定为“小学三年级水平”,SWOT(强弱危机)分析颇具工作实用性,甚至敢写多场景切换的《流浪地球3》剧本……

常规问答逻辑正常,专门领域输出质量在线,功能宝库齐全,通义千问或许暂时不能比肩OpenAI的GPT4技术,但它的“即战力”足以证明自己是AI赛道上的新晋实力派玩家,潜力和前景更值得期待。

至少在被ChatGPT搅动心绪、又担心亚洲账号封禁的当下,我们将拥有一个可以畅通无阻的自家代表。

2、久久为功、厚积薄发:AI赛道日益拥挤,阿里何以创造新的可能性?

大家都在抢做聊天机器人,OpenAI、百度与阿里的大模型类型相似、性能对比有来有回,那么阿里加入竞赛的意义仅限于“不能落后”吗?随着AI新赛道日益拥挤,阿里有何独特优势,从而跳出“内卷”窠臼、创造新的可能?

这便要理解阿里对“通义千问”的定位:它不只是个聊天界面,而是大语言模型。打造AI大模型门槛极高,但大模型的基础设施与开放平台能开拓无尽的前沿边界,实现前所未有的潜能。这便是“通义千问”这个“中间节点”所折射出的阿里AI战略之路。

之所以说是“中间节点”,是因为阿里的大模型探索之路从2019年便已经开始,经过近几年的技术迭代,用周靖人的话说,大语言模型已开始能根据自然语言理解有效地提取人类大量的知识体系。

为了做到这一点,大模型的研发动辄要超千亿参数,其难度远远超出了单一的算法或GPU芯片的简单堆砌。这是一个囊括底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要的是AI云计算的全栈技术能力。更简单地说,当下的AI大模型竞争,本质上就是算力竞争。

阿里的提前准备,为自己建构了实力引领的先发优势。阿里达摩院在国内率先布局AI技术与大模型研发,2021年先后发布了国内首个超百亿参数的多模态大模型M6与及被称为“中文版GPT-3”的语言大模型PLUG,此后还训练实现了全球首个10万亿参数AI模型。2022年达摩院推出的通义大模型系列,更是在语言及多模态能力、超大模型、通用统一模型等多个技术维度上处于国内第一梯队。

在核心竞争力——算力层面,阿里云是国际权威机构Gartner榜单中亚洲第一、全球第三的云计算服务商。尤其在2021年底Gartner对云厂商整体能力评估中,阿里云IaaS基础设施能力拿下全球第一,在计算、存储、网络、安全四项核心评比中均斩获最高分。

此外,阿里在去年8月底推出的“飞天智算平台”是国内最大规模的智能算力中心,阿里云机器学习平台PAI更是以数倍的量级提升了AI训练和推理效率。多年的耐心准备与坚持探索,令阿里具备了强大的云计算基础设施能力、深厚的大模型技术积淀,这正是其加入本轮AI技术竞赛、持续竞逐“兵家必争之地”的核心优势。

透过阿里的优势与“先发制人”的势头,外界似乎窥见了这家头部大厂更宏大的战略布局:阿里要做的,并不只是可以媲美GPT的同质模型。

围绕多模态大模型的早早布局,表明阿里早已注意到AI发展的最新动向,把握住不同的路线选择、提早在业内竞争中站住身位。而魔搭社区的成立,凸显出阿里还有超乎企业自身的更大愿景。

秉承“模型即服务”的理念,魔搭社区把AI模型变为直接可用的服务,用极低的门槛便可体验模型效果,实现模型推理、调优、定制。达摩院率先贡献家底,全面开源开放300多个经过检验的优质AI模型,并吸引了澜舟科技、深势科技、智谱AI、启智社区、哔哩哔哩、IDEA研究院、WeNet等十多家知名机构贡献模型。

目前魔搭社区已上线十亿参数以上的大模型超过30个,百亿参数大模型超过10个,包括自然语言理解和生成、对话、文本生成图片、文本生成视频、多模态表征等多个重要方向。这是对传统认知的颠覆:大模型研发不应以训练难度和成本的高门槛排斥多数机构,而要开放生态、降低门槛,方可凝聚力量,促成所有AI从业者积极探索、自由使用、研究突破、应用推广。

唯有如此,大模型成为AI时代的基础设施,中国本土才会有源源不断的创新土壤,通义千问所预示的潜能与前景方可充分实现。

周靖人曾经卖关子:通义千问只是阿里通义模型的一个成员,下一个已经在路上。4月11日召开的2023阿里云峰会,或许将见证更多来自中国本土的可能性。在日趋激烈的AI赛道上,以阿里为代表的中国力量也将注入新鲜活力。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
来说点什么吧!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容