接上一个文章,我们继续分析在分析报表和代码解释和优化的对比。
3、分析报表的对比
先从上市交易所拿到公开某公司的季度报表,然后挨个放到三个问答系统中去测试,看看到底效果如何。
声明:本次主要是测试分析报表能力,报表的数据都来自官方公开资料。
1)ChatGPT的解读表现
2)问心一言的解读表现
3)通义千问的解读表现
结论:从分析来看,都能对数据进行了详细梳理,也都有各自的结论。ChatGPT提到的是“营业收入的增长,但净利润大幅下降,主要由于产品组合变动和折旧增加”;问心一言提到的是“净利润受多方面因素影响出现较大下滑。公司对未来季度和全年保持谨慎乐观的态度,并继续加大研发投入以巩固市场地位。”,通义千问提到是“尽管收入和出货量有所增长,但净利润、现金流和每股收益的下降表明公司面临成本增加的压力,可能是由于折旧费用上升和投资收益减少导致。同时,研发投入的增加反映了公司对技术创新的重视。”从结论看,ChatGPT和问心一言都各提到了一部分。而通义千问是把利润较少和研发增加都说了。
4、对比代码的解读和优化对比
这里就不提供大量的图片证据了,从局部代码的分析,基本上都能做的十分好,能够说清楚代码的内容结构。同时从优化来说,也都能找到问题,并且提供解决办法。其中有些差异。
1、问心一言对于代码了解不多,在模型的使用上不是很了解所以出现了提示未定义的情况,而阿里就直接提供了相关的补充,这里阿里做的更细腻。那么ChatGPT连提都没提,它默认是你应该知道的。这也是ChatGPT以前经常犯的一个错误,就是认为你应该知道。所以如果是新手很容易就掉坑了。
2、对于上下文的连续提问,这个ChatGPT是相当有优势的,基本能够做到上下文能够很有效的解答,这点对代码的优化是特别有用。问心一言和通义千问相对就弱一点。
从前面的几个分析来了,如果您是想做文字方面的话,那么通义千问是个不错的选择,而且这个模型其实很多已经用到了政府相关产业是经过实践检验的。问心一言在图片的输出有很大优势;编程方面ChatGPT目前还是最好的。
尾声
目前的ai还在不断发展中,每家也都在拼命努力在提高自己的ai能力,虽然中国的两个问心一言和通义千问出发的晚,但是还是不断在进步中。这跟我较早之前测试的情况完全不一样,那个时候问心一言还挺懂问题,并回答。通义千问基本就胡言乱语了。而现在都已经接近ChatGPT的能力。
最新消息是新的一代TTT模型已经出来了,Transformers短板在处理和分析大量数据方面并不是特别高效,至少在现成的硬件上运行是这样,所以需要大量资源才行。TTT模型将来有机会会替代Transformers。如果是那样的话,相当于大家都在同一个起跑线了。
暂无评论内容