🤖 大模型基础 (So-Large-LM)

从理论到实战，全面构建大模型知识体系

🚀 精选资源 (最新更新)

💡 核心推荐：配合视频与文档学习，效果更佳。

本项目致力于打造一个开源、系统、深入的大规模预训练语言模型（LLM）教程。

项目以斯坦福 CS324 和李宏毅生成式AI课程为理论基石，结合开源社区的最新实践与前沿动态，涵盖从数据准备、模型构建、训练策略到模型评估、安全伦理的全链路知识。

为了帮助初学者更高效地入门，Datawhale 构建了完整的 LLM 学习矩阵：

章节	内容亮点	链接
01. 引言	项目背景、GPT-3 崛起、LLM 发展简史	阅读
02. 大模型的能力	迁移学习、In-context Learning、性能评估分析	阅读
03. 模型架构	Transformer 深度解析、位置编码、注意力机制	阅读
04. 新的架构方向	混合专家模型 (MoE)、基于检索的模型 (RAG基础)	阅读

章节	内容亮点	链接
05. 数据工程	The Pile 数据集、数据清洗、分词策略 (Tokenization)	阅读
06. 模型训练	目标函数设计、优化算法选择	阅读
07. 适配与微调	Adaptation 必要性、PEFT (高效微调)、Probing	阅读
08. 分布式训练	数据并行、模型并行、流水线并行、混合策略	阅读

章节	内容亮点	链接
09/10. 有害性分析	社会偏见、有毒信息检测、虚假信息 (Hallucination)	上篇 / 下篇
11. 法律与伦理	版权法挑战、合理使用、司法案例汇总	阅读
12. 环境影响	碳排放估算、绿色 AI	阅读
13. 智能体 (Agent)	Agent 组件详解、挑战与机遇	阅读
14. Llama 家族	Llama 1-3 进化史、架构对比、生态复盘	阅读

感谢所有为本项目付出心血的贡献者！

_陈安东
(负责人/内容构建)

_张帆
(内容构建)

_王茂霖
(Issues维护)

项目负责人: 陈安东 (ands691119@gmail.com)

🌟 如果这个项目对你有帮助，请给我们一个 Star！