学习路径
本文分为四个章节,各章节的学习目标如下。请注意本文主要是面向工程界撰写,学术部分较少。
入门篇
提高篇
应用篇
深入篇(本文涉及少量资料)
读者可以根据自己需要选择对应的章节,如对大语言模型的原理不感兴趣,可只关注入门篇和应用篇。考虑到阅读背景,本文尽可能提供中文资料或有中文翻译的资料。
入门篇
在入门之前,请申请 OpenAI API,并具备良好的国际互联网访问条件。
大语言模型综述大语言模型迄今为止最好的学术向中文综述。中文版本:LLM_Survey_Chinese_0418.pdf作为入门资料偏难,看不懂的部分可以等到后面章节再回头重看。ChatGPT Prompt Engineering for Developers虽然是 Prompt 工程,但是内容比较简单,适合入门者。
中英双语字幕:OpenAI QuickstartOpenAI 官方 Quickstart 文档。以及 API ReferenceState of GPT:GPT 联合创始人做的演示,极好的总结了 GPT 的训练和应用。
视频:PPT:
提高篇
清华大模型公开课:从NLP到大模型的综合课程,挑选感兴趣的了解。
深度学习:台湾大学李宏毅:台湾大学李宏毅,国语教程里最好的,讲的很清楚,也比较有趣。Understanding large language models :理解大语言模型。The Illustrated GPT-2 (Visualizing Transformer Language Models):图解 GPT2中文翻译:
InstructGPT: Training language models to follow instructions with human feedback:著名的 InstructGPT 论文。另外一篇中文介绍:Huggingface NLP Course:NLP 入门课程0x30 应用篇Building Systems with the ChatGPT API中文字幕:LangchainLangchain 是大语言模型最火的应用框架。即使不使用,也可以借鉴。
LangChain for LLM Application Development中文字幕:GPT best practices:OpenAI 官方出的最佳实践。openai-cookbook:OpenAI 官方 Cookbook。Brex’s Prompt Engineering Guide:Prompt 工程简介
深入篇
Huggingface Transformer 文档:Transformer 官方文档
复杂推理:大语言模型的北极星能力 :略学术,解释大语言模型能力的来源。
GPT,GPT-2,GPT-3 论文精读:视频精读。Building LLM applications for production:在生产环境中构建 LLM 应用。
文章提的资源 如何获取?
扫码添加微信
▲备注「大模型」,即可获取本文中所有的PDF/教程