🚀 AI-Practices

系统化人工智能学习与实践平台

从数学原理到工程实践，构建完整的AI知识体系

项目概览

500+ Python文件	280+ Notebooks	14大核心模块	100+ 单元测试	2枚Kaggle金牌
生产级代码实现	可交互式学习	系统化知识体系	代码质量保证	竞赛实战验证

核心特点

系统化学习路径 — 从基础数学到前沿技术，14个模块循序渐进
理论与实践结合 — 每个概念都有数学推导和代码实现
工程化标准 — 遵循工业级代码规范，包含完整测试
竞赛级方案 — 包含Kaggle Top 1%金牌解决方案

模块架构

AI-Practices/
│
├── 第一阶段：机器学习基础
│   └── 01-foundations/              # 线性模型、SVM、决策树、集成学习、降维、聚类
│
├── 第二阶段：深度学习核心
│   ├── 02-neural-networks/          # 神经网络基础、优化器、正则化
│   ├── 03-computer-vision/          # CNN架构、迁移学习、目标检测
│   └── 04-sequence-models/          # RNN/LSTM、Attention、Transformer
│
├── 第三阶段：高级专题
│   ├── 05-advanced-topics/          # 函数式API、回调函数、模型优化
│   ├── 06-generative-models/        # VAE、GAN、Diffusion Models
│   └── 07-reinforcement-learning/   # DQN、PPO、SAC、Actor-Critic
│
├── 第四阶段：大模型与多模态
│   ├── 10-large-language-models/    # Transformer、GPT/LLaMA、LoRA、RAG、Agent
│   └── 11-multimodal-learning/      # CLIP、Stable Diffusion、Whisper、TTS
│
├── 第五阶段：工程化部署
│   ├── 12-deployment-optimization/  # 量化剪枝、TensorRT、FastAPI、MLOps
│   └── 13-distributed-training/     # DDP、FSDP、ZeRO、混合精度训练
│
├── 第六阶段：智能体系统
│   └── 14-agents-reasoning/         # 工具调用、推理策略、多智能体、自主Agent
│
├── 理论参考
│   └── 08-theory-notes/             # 激活函数、损失函数、架构速查
│
└── 实战项目
    └── 09-practical-projects/       # Kaggle竞赛、游戏AI、跨模块集成系统

详细模块说明

01-foundations | 机器学习基础

子模块	核心内容	关键算法
01-training-models	模型训练基础	线性回归、梯度下降、正则化
02-classification	分类算法	逻辑回归、MNIST实战
03-support-vector-machines	支持向量机	核技巧、软间隔、SVM回归
04-decision-trees	决策树	CART、剪枝策略
05-ensemble-learning	集成学习	Bagging、Boosting、XGBoost、Stacking
06-dimensionality-reduction	降维技术	PCA、t-SNE、LLE、UMAP
07-unsupervised-learning	无监督学习	K-Means、DBSCAN、GMM
08-end-to-end-project	完整ML项目	加州房价预测

02-neural-networks | 神经网络

子模块	核心内容
01-keras-introduction	Keras入门、Sequential/Functional API
02-training-deep-networks	BatchNorm、Dropout、初始化策略
03-custom-models-training	自定义层、训练循环、TensorFlow底层
04-data-loading-preprocessing	数据管道、TFRecord、预处理

03-computer-vision | 计算机视觉

子模块	核心内容
01-cnn-basics	CNN基础、池化层、ResNet实现
02-classic-architectures	经典架构演进
03-transfer-learning	迁移学习、猫狗分类实战
04-visualization	特征可视化、中间层激活

04-sequence-models | 序列模型

子模块	核心内容
01-rnn-basics	RNN基础、LSTM、时间序列预测
02-lstm-gru	LSTM/GRU高级用法
03-text-processing	词嵌入、One-hot编码
04-cnn-for-sequences	一维卷积处理序列
05-transformer	Self-Attention、Multi-Head、BERT/GPT基础

05-advanced-topics | 高级专题

子模块	核心内容
01-functional-api	多输入多输出、残差连接、Inception
02-callbacks-tensorboard	回调函数、TensorBoard可视化
03-model-optimization	量化、剪枝、知识蒸馏、部署

06-generative-models | 生成模型

子模块	核心内容
01-vae	Vanilla AE、VAE、VQ-VAE
02-gans	GAN、DCGAN、WGAN-GP
03-diffusion	DDPM原理与实现
04-text-generation	字符级LSTM文本生成
05-deepdream	DeepDream艺术生成

07-reinforcement-learning | 强化学习

子模块	核心内容	测试覆盖
01-mdp-basics	MDP、值迭代、策略迭代	✅
02-temporal-difference	TD学习、SARSA	✅
03-q-learning	Q-Learning、探索策略	✅
04-deep-q-learning	DQN、Double DQN、Dueling DQN、Rainbow	✅
05-policy-gradient	REINFORCE、基线方法	✅
06-actor-critic	A2C、PPO	✅
07-advanced-algorithms	SAC、TD3、DDPG	✅
08-reward-optimization	奖励塑形、好奇心驱动、逆强化学习	✅

08-theory-notes | 理论笔记

快速参考手册，包含：

激活函数对比与选择
损失函数详解
网络架构速查（CNN、RNN、Dense）

09-practical-projects | 实战项目

子模块	项目内容
01-ml-basics	Titanic生存预测、Otto分类、SVM文本分类、XGBoost进阶
02-computer-vision	MNIST CNN分类
03-nlp	情感分析LSTM、Transformer文本分类、NER、机器翻译
04-time-series	温度预测、股票预测LSTM
05-kaggle-competitions	4个Kaggle竞赛方案（含2个金牌）
06-reinforcement-learning	Flappy Bird DQN、Dino Run、股票交易RL
07-integrated-systems	多模态检索、视觉问答Agent、代码助手（109个测试）

Kaggle竞赛成绩

竞赛	排名	奖牌
Feedback Prize - ELL	Top 1%	🥇 金牌
RSNA Abdominal Trauma	Top 1%	🥇 金牌
American Express Default	Top 5%	🥈 银牌
RSNA Lumbar Spine	Top 10%	🥉 铜牌

10-large-language-models | 大语言模型

子模块	核心内容	测试覆盖
01-llm-fundamentals	Transformer架构、Tokenizer	✅
02-pretrained-models	GPT、LLaMA从零实现	✅
03-fine-tuning	LoRA、QLoRA高效微调	✅
04-prompt-engineering	Few-shot、Chain-of-Thought	✅
05-rag	向量数据库、检索增强生成	✅
06-agents	工具调用、记忆管理	✅
07-alignment	RLHF、DPO对齐训练	✅

11-multimodal-learning | 多模态学习

子模块	核心内容	测试覆盖
01-vision-language	CLIP、BLIP、LLaVA	✅
02-image-generation	VAE、Diffusion、ControlNet	✅
03-audio-models	Whisper语音识别、TTS语音合成	✅

12-deployment-optimization | 部署优化

子模块	核心内容	测试覆盖
01-model-optimization	量化、剪枝、蒸馏、ONNX导出	✅
02-inference-engines	TensorRT、vLLM、ONNX Runtime	✅
03-serving-systems	FastAPI、Triton、负载均衡	✅
04-mlops	实验追踪、模型注册、监控告警	✅

13-distributed-training | 分布式训练

子模块	核心内容	测试覆盖
01-data-parallel	DDP、FSDP、ZeRO	✅
02-model-parallel	张量并行、流水线并行、序列并行	✅
03-mixed-precision	AMP、BF16、梯度缩放	✅
04-large-scale-training	DeepSpeed、Megatron-LM	✅

14-agents-reasoning | 智能体与推理

子模块	核心内容	测试覆盖
01-tool-use	Function Calling、工具注册、结构化输出	✅
02-reasoning	CoT、ReAct、ToT、自一致性、反思	✅
03-memory-systems	短期记忆、长期记忆、向量检索	✅
04-planning	任务分解、计划生成、动态重规划	✅
05-multi-agent	辩论式推理、协作式推理、共识达成	✅
06-autonomous-agent	目标管理、行动执行、自主循环	✅

核心算法覆盖

机器学习

线性模型: OLS, Ridge, Lasso, ElasticNet
分类算法: Logistic Regression, SVM, KNN
树模型: Decision Tree, Random Forest, GBDT
集成学习: Bagging, Boosting, Stacking, XGBoost, LightGBM
降维聚类: PCA, t-SNE, UMAP, K-Means, DBSCAN

深度学习

优化器: SGD, Momentum, Adam, AdamW, LAMB
正则化: Dropout, BatchNorm, LayerNorm, Weight Decay
CNN架构: LeNet → AlexNet → VGG → ResNet → EfficientNet → ViT
序列模型: RNN → LSTM → GRU → Transformer → BERT → GPT

强化学习

值函数方法: Q-Learning, DQN, Double DQN, Dueling DQN, Rainbow
策略梯度: REINFORCE, PPO, TRPO
Actor-Critic: A2C, A3C, SAC, TD3

生成模型

自编码器: AE, VAE, VQ-VAE
对抗网络: GAN, DCGAN, WGAN-GP, StyleGAN
扩散模型: DDPM, Stable Diffusion

大模型技术

架构: Transformer, GPT, LLaMA
微调: LoRA, QLoRA, Adapter
推理: RAG, CoT, ReAct, ToT
对齐: RLHF, DPO

技术栈

深度学习框架	数据科学	开发工具
PyTorch 2.x	NumPy	Python 3.10+
TensorFlow 2.13+	Pandas	Jupyter Lab
Keras 3.x	Scikit-Learn	Docker

快速开始

# 克隆仓库
git clone https://github.com/zimingttkx/AI-Practices.git
cd AI-Practices

# 创建环境
conda create -n ai-practices python=3.10 -y
conda activate ai-practices

# 安装依赖
pip install -r requirements.txt

# 启动Jupyter
jupyter lab

硬件要求

组件	最低配置	推荐配置
CPU	4核	8核+
内存	8 GB	32 GB
GPU	GTX 1060	RTX 3080+
存储	50 GB	200 GB SSD

学习路径建议

入门阶段 (1-2个月)
├── 01-foundations          # 机器学习基础
├── 02-neural-networks      # 神经网络入门
└── 08-theory-notes         # 理论参考

进阶阶段 (2-3个月)
├── 03-computer-vision      # 计算机视觉
├── 04-sequence-models      # 序列模型
├── 05-advanced-topics      # 高级专题
└── 06-generative-models    # 生成模型

高级阶段 (2-3个月)
├── 07-reinforcement-learning  # 强化学习
├── 10-large-language-models   # 大语言模型
└── 11-multimodal-learning     # 多模态学习

工程化阶段 (1-2个月)
├── 12-deployment-optimization # 部署优化
├── 13-distributed-training    # 分布式训练
└── 14-agents-reasoning        # 智能体系统

实战阶段 (持续)
└── 09-practical-projects      # 项目实战

引用

@misc{ai-practices2024,
  author       = {zimingttkx},
  title        = {AI-Practices: 系统化人工智能学习与实践平台},
  year         = {2024},
  publisher    = {GitHub},
  howpublished = {\url{https://github.com/zimingttkx/AI-Practices}}
}

许可证

本项目采用 MIT License 开源协议 - 详见 LICENSE

Star History

如果这个项目对你有帮助，请给一个 ⭐ Star！

🚀 AI-Practices

系统化人工智能学习与实践平台

项目概览

核心特点

模块架构

详细模块说明

01-foundations | 机器学习基础

02-neural-networks | 神经网络

03-computer-vision | 计算机视觉

04-sequence-models | 序列模型

05-advanced-topics | 高级专题

06-generative-models | 生成模型

07-reinforcement-learning | 强化学习

08-theory-notes | 理论笔记

09-practical-projects | 实战项目

Kaggle竞赛成绩

10-large-language-models | 大语言模型

11-multimodal-learning | 多模态学习

12-deployment-optimization | 部署优化

13-distributed-training | 分布式训练

14-agents-reasoning | 智能体与推理

核心算法覆盖

机器学习

深度学习

强化学习

生成模型

大模型技术

技术栈

快速开始

硬件要求

学习路径建议

引用

许可证

Star History

关于 About

语言 Languages

提交活跃度 Commit Activity

核心贡献者 Contributors