大语言模型(LLM)到底是个什么厉害东东?

这是一系列轻松愉快的关于大语言模型的胡咧咧"科普"。本系列致力于用广场舞大妈的智慧解读科技前沿,让您蹲马桶刷手机时就能完成赛博修仙。没有微积分咒语,不念概率论佛经,保证让楼下煎饼摊老板看完都能达到老罗的水平

图片[1]-大语言模型(LLM)到底是个什么厉害东东?-JieYingAI捷鹰AI

。(老罗是谁啊?嗯,就是你想到的那个老罗,隔壁姓罗的老头~)

图片[2]-大语言模型(LLM)到底是个什么厉害东东?-JieYingAI捷鹰AI

“林泽!林泽!快来!”安然清脆的声音像一只快乐的小鸟,从客厅里传来,惊得正对着电脑屏幕,埋头苦战的林泽差点把刚敲完的一行代码删掉。

他摘下耳机,揉了揉酸涩的眼睛,心里嘀咕着:“这丫头又有什么鬼点子了?”

起身走到客厅,只见安然正盘腿坐在地毯上,手里抱着一本厚厚的《大语言模型(LLM)》,书页上密密麻麻的公式和英文单词,与她那张明媚的脸显得有些格格不入。

“你这是…?”林泽有些疑惑地看着她,印象里安然的兴趣爱好一直停留在画笔、颜料和各种艺术展览上,怎么突然对计算机科学感兴趣了?

安然抬起头,冲他甜甜一笑,眼睛亮晶晶的:“嘿嘿,好奇嘛!AI这几年发展这么快,能回答各种问题,能画图,还能做视频,连你也每天对着这些东西敲敲打打。我听别人说,这些全都是因为大语言模型的快速发展以及大语言模型在AI上的应用,那这个…这个…大语言模型是怎么回事?”

她指着书上的综述,一脸求知欲旺盛的样子,仿佛发现了新大陆。林泽看着她充满好奇的眼神,心中一动,原本的疲惫也消散了大半。他走过去,在她身边坐下,拿起那本厚重的书,嘴角不自觉地扬起一抹微笑:“好,今天就给安然同学讲讲,这神秘的大语言模型是怎么回事。”

图片[3]-大语言模型(LLM)到底是个什么厉害东东?-JieYingAI捷鹰AI

1. 大语言模型是什么?

核心能力:

不是“知道答案”,而是“根据统计规律模仿人类说话”。

像极了考前突击背书的学生——虽然不懂原理,但能靠死记硬背答题。

2. 它怎么学会的?——分两步训练(1) 预训练:疯狂读书

结果:

比喻:

预训练=让一个婴儿在图书馆住十年,每天随机翻书。

(2) 微调:岗前培训

结果:

例子:

3. 为什么它这么厉害?——三大绝招(1) 海量数据

所以能和你聊诗词、编笑话、假装懂量子物理。

(2) 模式识别(3) 随机应变4. 它能做什么?——像瑞士军刀

场景例子本质

聊天

陪你吐槽工作、编睡前故事

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
Every day is beautiful if you choose to see it.
如果你愿意去发现,其实每一天都很美