这个假期,我着实被AI狠狠吸引了一把,体验了几款国内的大语言模型,像文小言、豆包、Kimi、DeepSeek以及元宝,着重对它们的用户体验进行了测试。
首次测试:输入“2825628257”,文小言和豆包迅速给出答案,指出这串数字源自我国第一颗原子弹相关的童谣《马兰开花二十一》 。而Kimi、DeepSeek和元宝的回答则聚焦于数字的数学含义、谐音等,完全未提及《马兰开花二十一》。于是,我又把“小皮球,架脚踢,马兰开花二十一,二八二五六,二八二五七,二八二九三十一”输入到Kimi、DeepSeek和元宝中,它们基本都判断出这是一首童谣。再次输入“2825628257”时,Kimi给出了与我国第一颗原子弹相关的童谣《马兰开花二十一》的内容,可DeepSeek和元宝的回答仍和第一次差不多。
二次测试:我抛出“网红‘澳门老黑’参演了电影《误判》,演员真实姓名是什么?”这个问题,只有豆包回答正确,指出演员真名叫雷诺,其他几个大模型都未能答对。之后,我把“网红‘澳门老黑’的真名叫雷诺”输入到其他几个大模型,再问同样的问题。这次,文小言回答出了正确答案,Kimi的回答与第一次相同,DeepSeek和元宝则表明,根据用户提供的信息,演员真名叫雷诺。
通过这两轮小测试,结果如下:
1、数据搜索与已有数据储备:文小言和豆包优势明显,能快速关联到相关内容。
2、新数据处理方式:Kimi对新数据的过滤最为严格,不会轻易引用用户提供的数据;文小言继承了百度知道的特性,不论数据真假,先采用再说;DeepSeek和元宝在数据引用逻辑上较为出色,会明确注明信息来源于用户。
3、运算逻辑:DeepSeek-R1在运算时,就像在进行自我思考,会先对各个方面进行考量,在有限算力下,能先筛选再运算,这无疑是它的一大优势。
4、LLM发展关键:大语言模型的发展,除了依赖算法和算力,数据的输入同样至关重要。要是数据匮乏或者来源单一,必然会限制其未来发展。真心期待我国互联网能够进一步开放,实现与全球数据的深度接轨。