这是一系列轻松愉快的关于大语言模型的胡咧咧"科普"。本系列致力于用广场舞大妈的智慧解读科技前沿,让您蹲马桶刷手机时就能完成赛博修仙。没有微积分咒语,不念概率论佛经,保证让楼下煎饼摊老板看完都能达到老罗的水平
。(老罗是谁啊?嗯,就是你想到的那个老罗,隔壁姓罗的老头~)
“林泽!林泽!快来!”安然清脆的声音像一只快乐的小鸟,从客厅里传来,惊得正对着电脑屏幕,埋头苦战的林泽差点把刚敲完的一行代码删掉。
他摘下耳机,揉了揉酸涩的眼睛,心里嘀咕着:“这丫头又有什么鬼点子了?”
起身走到客厅,只见安然正盘腿坐在地毯上,手里抱着一本厚厚的《大语言模型(LLM)》,书页上密密麻麻的公式和英文单词,与她那张明媚的脸显得有些格格不入。
“你这是…?”林泽有些疑惑地看着她,印象里安然的兴趣爱好一直停留在画笔、颜料和各种艺术展览上,怎么突然对计算机科学感兴趣了?
安然抬起头,冲他甜甜一笑,眼睛亮晶晶的:“嘿嘿,好奇嘛!AI这几年发展这么快,能回答各种问题,能画图,还能做视频,连你也每天对着这些东西敲敲打打。我听别人说,这些全都是因为大语言模型的快速发展以及大语言模型在AI上的应用,那这个…这个…大语言模型是怎么回事?”
她指着书上的综述,一脸求知欲旺盛的样子,仿佛发现了新大陆。林泽看着她充满好奇的眼神,心中一动,原本的疲惫也消散了大半。他走过去,在她身边坐下,拿起那本厚重的书,嘴角不自觉地扬起一抹微笑:“好,今天就给安然同学讲讲,这神秘的大语言模型是怎么回事。”
1. 大语言模型是什么?
核心能力:
不是“知道答案”,而是“根据统计规律模仿人类说话”。
像极了考前突击背书的学生——虽然不懂原理,但能靠死记硬背答题。
2. 它怎么学会的?——分两步训练(1) 预训练:疯狂读书
结果:
比喻:
预训练=让一个婴儿在图书馆住十年,每天随机翻书。
(2) 微调:岗前培训
结果:
例子:
3. 为什么它这么厉害?——三大绝招(1) 海量数据
所以能和你聊诗词、编笑话、假装懂量子物理。
(2) 模式识别(3) 随机应变4. 它能做什么?——像瑞士军刀
场景例子本质
聊天
陪你吐槽工作、编睡前故事