当下互联网什么概念最火?莫过于AI人工智能!自从ChatGPT在AI圈火了一阵子后,迅速席卷了大众的注意力,这种生成式AI的出现让无数人感到震撼,也引发了各种热议。
ChatGPT还没玩明白,GPT-5就爆出要在今年的第三、四季度上线,与此同时,各路互联网巨头也纷纷开启了“秀肌肉”模式,继百度的文心一言之后,阿里也宣布加入这场AI竞赛。
4月7日,阿里上线邀测了自己旗下的大模型——通义千问。通义千问据称是世界首个突破 10万亿参数的 AI 大模型,PConline也在第一时间拿到的“通义千问”的内测,接下来就让我们一起测试一下阿里的AI功力如何。
1、通义千问用起来如何?
此前我们有测试过百度文心一言(),而通义千问与百度文心一言最大的区别是,通义千问目前并不支持直接生成图像,比如让它画一张小白兔的图,得到的回答是无法进行绘画,但通义千问的优点在于即便无法绘画,也能通过文字描述场景,给提问者带来画面感。
不过在逻辑分析上,通义千问还是挺能打的,比如让它给苹果公司做SWOT分析,基本都说得挺对。
让它写一则介绍自己的文章大纲,也非常详细,老行业编辑都不一定能想得这么全。
但在涉及到文学问题上表现略为逊色,写出的诗或文案,还是有硬套模版的感觉,比较生硬,整体上中规中矩。比如让它模仿方文山写一首中国风的歌词,最后甚至还出现了国泰民安,繁荣富强,五星红旗,永远飘扬,这显然已经不算歌词了。
从回答来看,通义千问在涉及到商业、科技等理性问题上,分析还算比较有逻辑,但文学方面还有待加强。
不过,从阿里对通义千问的描述来看,通义千问更偏向于B端,而不是针对个人用户的大模型,阿里云智能CTO周靖人表示目前已经与首批企业进行合作共创,企业可以在阿里云上调用通义千问的能力,也可以结合企业自身的行业知识和应用场景,训练自己的企业大模型。
目前在阿里旗下的产品中,钉钉和天猫精灵已经在测试接入大模型,阿里未来所有产品将接入通义千问大模型。
2、国产AI大模型竞相绽放
最近,很多公司在大模型领域已经杀疯了,短短10天,就有5场大模型发布会已经或将要与众人见面。这里也顺便跟大家说说目前国内科技企业的大模型进度。
腾讯将机器学习平台命名为“太极”,基于此平台研发的AI大模型命名为“混元”;网易也给自家大模型取了个极文雅的名字——“玉言”,网易有道还将于近期推出教育场景下类ChatGPT模型——“子曰”;字节则是从旗下办公软件飞书低调切入,最近飞书表示每位飞书用户都会拥有专属的智能助手——“My AI”。
除此之外,4月10日,搜狗公司前CEO王小川发布公开信,正式宣布创建中国版OpenAI公司“百川智能”;AI公司商汤科技公布“日日新SenseNova”大模型体系;以游戏起家的昆仑万维宣布,也宣布其大模型“天工”3.5发布在即。
甚至连汽车相关的公司都要来做大模型,毫末智行发布自动驾驶大模型—-DriveGPT雪湖·海若。整体来看,大模型已经渗透到各个领域,只要跟人类生活大数据相关的,都可以产生大模型。
但在百花齐放的同时,我们也要清醒认识到,目前国内的模型基础还是与OpenAI存在代差,要赶上GPT-4,依旧面临不小的挑战。
首先,人才储备不足。AI大模型建设需要大量的数学、计算机科学和工程方面的人才。目前AI相关人才在市场上属于“一将难求”的状态,虽然可以通过国内外高校合作或自主培养等方式来解决,但人才并不是一朝一夕就能培养出来的。
以提示工程师为例,所谓提示工程师,也就是AI训练师,即通过与AI交互写出相关提示,以帮助用户操作AI生成更完美的内容,并帮助公司培训员工使用这些工具。简而言之,提示工程师相当于是设计师、文案和程序员三者的结合体。目前ChatGPT热潮下的“提示工程师”已经成抢手职业,年薪高达34万美元!
顺便一提,与提示工程师的火热程度不同,一些如文案撰写、方案撰写的岗位,确实面临着被AI取代的危险,4月12日,国内公关广告营销巨头蓝色光标对华东区的“外包工作”,包括创意设计外包、方案撰写外包、文案撰写外包、短期雇员按下了“全面停止”的按钮,全面拥抱AIGC,这也是变相的人才危机。
其次,算法和模型质量不高。在AI大模型领域,相关产品的算法、模型的质量和精度与OpenAI相比还有差距。比如在测试“通义千问”发现,其已经具备一定基础常识与初步的逻辑思考能力,但对于文学类的回答还有很大的进步空间。
写在最后
随着大数据和算法应用越来越成熟,模型工具越来越完善,这都加速了生成式AI应用的迭代,生成式AI未来还有巨大的发展潜力。当然,跟所有新科技一样,开发AI大模型一定会遇到波折和低谷。国外的API很难直接对我们开放,因此接下来的追赶还需要更多发力。对于中国企业而言,不应追求速胜,而是应该坚持打“持久战”,将上述问题一一解决。
END
暂无评论内容