AI 整体学习框架
一、基础能力层
1. 数学基础
- 线性代数:矩阵、向量、特征值、张量
- 概率论与数理统计:分布、期望、方差、贝叶斯、假设检验
- 微积分:导数、偏导、梯度、积分
- 优化理论:极值、凸优化、损失函数原理
2. 编程基础
- Python 核心语法、数据结构、面向对象
- 常用库:NumPy、Pandas、Matplotlib/Seaborn
- 版本控制:Git & GitHub
3. 计算机基础
- 计算机网络、操作系统基础
- 数据库:SQL 基础(MySQL/SQLite)
二、传统机器学习层
1. 入门理论与算法
- 机器学习概述:监督/无监督/强化学习、训练/验证/测试集、过拟合/欠拟合
- 经典监督算法:线性回归、逻辑回归、决策树、随机森林、SVM、KNN
- 经典无监督算法:K-Means、聚类、降维(PCA)、关联规则
2. 模型训练与调优
- 特征工程:特征筛选、归一化、编码、特征构造
- 模型评估:准确率、召回率、F1、AUC、MSE 等指标
- 调参技巧:网格搜索、随机搜索、交叉验证
3. 实战工具
- Scikit-learn 全流程实战
- 小型数据集项目练手
三、深度学习层(当下主流 AI 方向)
1. 深度学习基础
- 神经网络原理:神经元、激活函数、反向传播、梯度下降
- 网络结构:全连接神经网络
2. 细分网络体系
- 计算机视觉 CV
- CNN 卷积神经网络:卷积、池化、经典模型(LeNet、AlexNet、VGG、ResNet)
- 任务:图像分类、目标检测、图像分割、图像生成
- 自然语言处理 NLP
- 词向量、RNN/LSTM/GRU
- Transformer 核心(注意力机制)
- 预训练模型:BERT、GPT 系列基础原理
- 任务:文本分类、情感分析、翻译、摘要
3. 深度学习框架
- 主流二选一:PyTorch / TensorFlow + Keras
- 高阶工具:分布式训练、混合精度训练
4. 进阶方向
- 生成式模型:GAN、Diffusion 扩散模型
- 强化学习 RL:Q-Learning、DQN、PPO
- 多模态:图文、音视频融合
四、大模型 & 应用工程层(当下就业/落地核心)
1. 大模型基础认知
- LLM 发展脉络、基座模型、微调、对齐(RLHF/DPO)
- 上下文窗口、Token、Prompt 原理
2. 大模型应用开发
- 提示工程 Prompt Engineering:基础提示、Few-shot、思维链 CoT
- 检索增强生成 RAG:向量数据库、文档解析、向量召回、问答系统
- 智能体 Agent:工具调用、规划、记忆、多 Agent 协作
3. 工程部署 & 运维
- 模型推理:本地部署、API 调用、批量推理
- 部署框架:FastAPI、Gradio、Streamlit(快速做演示应用)
- 容器化:Docker 打包 AI 服务
- 云端部署:云服务器、模型托管平台
4. 低代码/开源生态
- 开源大模型使用、模型量化、轻量化部署
- 开源项目二次开发(RAG 框架、Agent 框架)
五、专项进阶 & 职业方向
根据目标挑选 1~2 个主线深入:
- 算法研究方向
- 模型微调、预训练、模型压缩/量化/剪枝
- 论文阅读、实验复现、顶会基础
- AI 应用开发方向
- 全栈 AI 应用、前后端结合、产品落地
- AI+业务(办公、客服、教育、工业等)
- 数据/AI 工程方向
- 数据治理、数据标注、AI 数据流水线
- 算力调度、集群运维
- AI 产品方向
- 能力拆解、需求设计、原型、AI 产品落地逻辑