← 返回博客首页

AI 整体学习路线图（附进度标记）

2026-06-07 · 预计阅读 4 分钟 AI学习

AI 整体学习框架

一、基础能力层

1. 数学基础

线性代数：矩阵、向量、特征值、张量
概率论与数理统计：分布、期望、方差、贝叶斯、假设检验
微积分：导数、偏导、梯度、积分
优化理论：极值、凸优化、损失函数原理

2. 编程基础

Python 核心语法、数据结构、面向对象
常用库：NumPy、Pandas、Matplotlib/Seaborn
版本控制：Git & GitHub

3. 计算机基础

计算机网络、操作系统基础
数据库：SQL 基础（MySQL/SQLite）

二、传统机器学习层

1. 入门理论与算法

机器学习概述：监督/无监督/强化学习、训练/验证/测试集、过拟合/欠拟合
经典监督算法：线性回归、逻辑回归、决策树、随机森林、SVM、KNN
经典无监督算法：K-Means、聚类、降维（PCA）、关联规则

2. 模型训练与调优

特征工程：特征筛选、归一化、编码、特征构造
模型评估：准确率、召回率、F1、AUC、MSE 等指标
调参技巧：网格搜索、随机搜索、交叉验证

3. 实战工具

Scikit-learn 全流程实战
小型数据集项目练手

三、深度学习层（当下主流 AI 方向）

1. 深度学习基础

神经网络原理：神经元、激活函数、反向传播、梯度下降
网络结构：全连接神经网络

2. 细分网络体系

计算机视觉 CV
- CNN 卷积神经网络：卷积、池化、经典模型（LeNet、AlexNet、VGG、ResNet）
- 任务：图像分类、目标检测、图像分割、图像生成
自然语言处理 NLP
- 词向量、RNN/LSTM/GRU
- Transformer 核心（注意力机制）
- 预训练模型：BERT、GPT 系列基础原理
- 任务：文本分类、情感分析、翻译、摘要

3. 深度学习框架

主流二选一：PyTorch / TensorFlow + Keras
高阶工具：分布式训练、混合精度训练

4. 进阶方向

生成式模型：GAN、Diffusion 扩散模型
强化学习 RL：Q-Learning、DQN、PPO
多模态：图文、音视频融合

四、大模型 & 应用工程层（当下就业/落地核心）

1. 大模型基础认知

LLM 发展脉络、基座模型、微调、对齐（RLHF/DPO）
上下文窗口、Token、Prompt 原理

2. 大模型应用开发

提示工程 Prompt Engineering：基础提示、Few-shot、思维链 CoT
检索增强生成 RAG：向量数据库、文档解析、向量召回、问答系统
智能体 Agent：工具调用、规划、记忆、多 Agent 协作

3. 工程部署 & 运维

模型推理：本地部署、API 调用、批量推理
部署框架：FastAPI、Gradio、Streamlit（快速做演示应用）
容器化：Docker 打包 AI 服务
云端部署：云服务器、模型托管平台

4. 低代码/开源生态

开源大模型使用、模型量化、轻量化部署
开源项目二次开发（RAG 框架、Agent 框架）

五、专项进阶 & 职业方向

根据目标挑选 1~2 个主线深入：

算法研究方向
- 模型微调、预训练、模型压缩/量化/剪枝
- 论文阅读、实验复现、顶会基础
AI 应用开发方向
- 全栈 AI 应用、前后端结合、产品落地
- AI+业务（办公、客服、教育、工业等）
数据/AI 工程方向
- 数据治理、数据标注、AI 数据流水线
- 算力调度、集群运维
AI 产品方向
- 能力拆解、需求设计、原型、AI 产品落地逻辑

← 返回博客首页