阿里云大模型“通义千问”开启内测!科大讯飞将推“1+N认知智能大模型”;中兴将推支持ChatGPT的GPU服务器!

随着ChatGPU的持续火爆,国内相关厂商也在积极的布局。继今年3月百度推出自研的大语言模型“文心一言”之后,今天阿里云也正式宣布,阿里云大模型“通义千问”开启内测。科大讯飞也宣布其“1+N认知智能大模型”将在5月6日正式发布。中兴通讯也宣布年底推出支持ChatGPT的GPU服务器。或许是受该消息影响

阿里云大模型“通义千问”开启内测

据介绍,阿里达摩院2019年便已启动中文大模型研发。通义千问官网显示,通义千问是一个专门响应人类指令的大模型,是效率助手,也是点子生成机。

现阶段“通义千问”主要定向邀请企业用户进行体验测试,用户可通过通义千问官网申请(tongyi.aliyun.com)。

图片[1]-阿里云大模型“通义千问”开启内测!科大讯飞将推“1+N认知智能大模型”;中兴将推支持ChatGPT的GPU服务器!-JieYingAI捷鹰AI

此前阿里巴巴CEO张勇透露,云计算是阿里巴巴面向未来的核心战略之一。目前,云计算和人工智能的结合正处于技术突破和发展的关键时期,生成式AI正在发生颠覆性突破,阿里巴巴将全力构建自己的AI预训练大模型,并为市场上风起云涌的模型和应用提供算力支撑。

科大讯飞将推“1+N认知智能大模型”

4月7日消息,在人工智能大模型发展论坛上,科大讯飞副总裁、研究院执行院长刘聪透露:科大讯飞“1+N认知智能大模型”将在5月6日正式发布。

其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”则是应用于多个行业领域的专用大模型版本。同时,“N”个场景的示范性应用产品也将随之呈现。

刘聪表示,认知智能大模型改变了信息分发获取模式、革新了内容生产模式、在万物互联时代实现全新人机交互方式,也将为科研工作、个人工作生活辅助、编程等带来全新变革。

此前科大讯飞曾表示,科大讯飞多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术、算力支撑等方面形成了扎实的积累。

在Transformer深度神经网络算法方面拥有丰富经验,已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平。

基于此,科大讯飞在认知智能方面开拓了丰富的应用场景,例如教育行业的因材施教和个性化学习、医疗行业的人工智能辅诊、智慧城市的便民便企服务、面向企事业单位的智能办公等等。

另外,科大讯飞在总部自建有数据中心,为大模型训练平台建设奠定了很好的硬件基石。在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

在上述积累基础上,科大讯飞于2022年12月份进一步启动生成式预训练大模型任务攻关,2023年5月6日进行产品级发布。

中兴通讯股价涨停,今年将推支持ChatGPT的GPU服务器

4月6日,中兴通讯总裁徐子阳在业绩说明会上透露,公司年底推出支持ChatGPT的GPU服务器。或许是受该消息影响,4月7日,中兴通讯股价涨停,收于37元/股,市值达1752.54亿元。

在2022年度业绩说明会上,中兴通讯表示,随着数字中国建设整体框架的提出,以及近期Chat-GPT、文心一言等AI创新应用的火爆,数字产业的浪潮正席卷而来,数字经济逐渐成为社会经济发展的新动能。

在人工智能领域,基于Transformer的基础大模型是当前人工智能最重要的根技术,围绕这个根技术,中兴的目标是利用领先的软硬件数智基座能力,支撑客户训好、用好大模型,持续降低大模型部署成本和能耗。

未来将重点投入三个产品方向:

1、公司的新一代智算中心基础设施产品,全面支持大模型训练和推理,包括高性能AI服务器、高性能交换机、DPU等;

2、下一代数字星云解决方案,利用生成式AI技术,在代码生成、办公智能化、运营智能化等领域展开研究,全面提升企业效率;

3、新一代AI加速芯片、模型轻量化技术,大幅降低大模型推理成本。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享