通义千问发布深度推理模型QwQ-Max-Preview

01

模型简介

今天早上,通义千问团队发布了全新的深度推理模型QwQ-Max-Preview,这是继QwQ-32B-Preview发布之后,千问团队再次更新语言推理模型。

体验地址:

记得要选中“深度思考(QwQ)”按钮。

图片[1]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

QwQ-Max-Preview是基于Qwen2.5-Max而衍生出来的推理模型,在数学、编程以及通用任务中展现了更强的能力,同时在与 Agent相关的工作流中也有不错的表现。

值得注意的是,今天发布的只是QwQ-Max的预览版本,千问团队还在持续优化中,更强大的模型肯定还在路上。

Qwen2.5-Max是千问团队于今年春节期间发布的超大规模的MoE模型,在Chatbot Arean超越DeepSeek-V3,在各个榜单都展现出强大的性能,与DeepSeek-V3打得有来有回。

DeepSeek-R1基于DeepSeek-V3展现出了惊艳的能力,所以此次基于Qwen2.5-Max强大基础能力的QwQ-Max也非常值得期待。

更重要的是,千问团队计划在不久的将来以 Apache 2.0 许可协议开源发布QwQ-Max以及Qwen2.5-Max。

以下是Qwen团队接下来的部分计划:

1、推出Qwen Chat APP:这款应用将让用户以最简单的方式与 AI 模型互动,专注于实时响应体验,并与主流生产力工具无缝衔接,让全球用户随时随地享受先进人工智能带来的便利。

2、开源更小的推理模型:将推出更小巧的 QwQ 系列模型,例如QwQ-32B,在大幅降低计算需求的同时,依然保持出色的推理能力。

3、开源Qwen2.5-Max、QwQ-Max及其轻量级变体。

02

模型体验

“如果下辈子你投胎成为真正的人,你最想做什么”,从QwQ的回复中,感受到了文字的温度,貌似它不是冷冰冰的AI,而是一个真实的人,泪目了。

图片[2]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

让QwQ以指定的首字母(QWQMAX)为每段诗词的开头,生成一段温暖的英文诗。特意去查了一下“xoxo”的含义:网络流行语,表达Hugs and kisses(拥抱和亲吻)。模型的思考过程也很有意思,会计划每段诗词的起始单词。

图片[3]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

以下是QwQ生成的诗词的谷歌翻译版,文字大意看着确实挺温馨。

图片[4]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

试试经典文字反转的问题(思考过程太长,不利于展示,将其隐藏了),最终的回复完全正确。

图片[5]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

模仿经典的计算“strawberry”中“r”的个数,不过这次是让QwQ计算一下文本中“q”的个数。在给定文本中,中英夹杂,难度比单纯的“strawberry”单词更难,但模型的思考过程与最终回复也正确。

图片[6]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

经典的“农夫过河”逻辑推理题(思考过程太长,隐藏起来了),回复逻辑清晰,完全正确。

图片[7]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

测试一下QwQ的创作类能力,模仿《过秦论》,写一篇《过美利坚论》。QwQ会预先梳理美国的关键历史节点,生成的古文也颇有意味,细细品味,蛮有意思的。

图片[8]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

这次不比较9.11和9.3的大小,随机敲了一长串数字,改变了其中一位数字,模型也能够清晰地给出理由和答案。

图片[9]-通义千问发布深度推理模型QwQ-Max-Preview-JieYingAI捷鹰AI

初步体验下来,感觉QwQ-Max具有非常不错的性能,期待后续进一步的更新迭代和模型上新,以及期待后续开源版本的QwQ模型。

在「知乎」也能找到我们了,搜索「红雨瓢泼」即可。欢迎在后台加入我们的大模型微信交流群。

给公众号添加【星标️】不迷路

您的点赞、在看、关注是我坚持的最大动力!

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享