← 返回博客首页

AI 整体学习路线图(附进度标记)

2026-06-07 · 预计阅读 4 分钟 AI学习

AI 整体学习框架

一、基础能力层

1. 数学基础

  • 线性代数:矩阵、向量、特征值、张量
  • 概率论与数理统计:分布、期望、方差、贝叶斯、假设检验
  • 微积分:导数、偏导、梯度、积分
  • 优化理论:极值、凸优化、损失函数原理

2. 编程基础

  • Python 核心语法、数据结构、面向对象
  • 常用库:NumPy、Pandas、Matplotlib/Seaborn
  • 版本控制:Git & GitHub

3. 计算机基础

  • 计算机网络、操作系统基础
  • 数据库:SQL 基础(MySQL/SQLite)

二、传统机器学习层

1. 入门理论与算法

  • 机器学习概述:监督/无监督/强化学习、训练/验证/测试集、过拟合/欠拟合
  • 经典监督算法:线性回归、逻辑回归、决策树、随机森林、SVM、KNN
  • 经典无监督算法:K-Means、聚类、降维(PCA)、关联规则

2. 模型训练与调优

  • 特征工程:特征筛选、归一化、编码、特征构造
  • 模型评估:准确率、召回率、F1、AUC、MSE 等指标
  • 调参技巧:网格搜索、随机搜索、交叉验证

3. 实战工具

  • Scikit-learn 全流程实战
  • 小型数据集项目练手

三、深度学习层(当下主流 AI 方向)

1. 深度学习基础

  • 神经网络原理:神经元、激活函数、反向传播、梯度下降
  • 网络结构:全连接神经网络

2. 细分网络体系

  1. 计算机视觉 CV
    • CNN 卷积神经网络:卷积、池化、经典模型(LeNet、AlexNet、VGG、ResNet)
    • 任务:图像分类、目标检测、图像分割、图像生成
  2. 自然语言处理 NLP
    • 词向量、RNN/LSTM/GRU
    • Transformer 核心(注意力机制)
    • 预训练模型:BERT、GPT 系列基础原理
    • 任务:文本分类、情感分析、翻译、摘要

3. 深度学习框架

  • 主流二选一:PyTorch / TensorFlow + Keras
  • 高阶工具:分布式训练、混合精度训练

4. 进阶方向

  • 生成式模型:GAN、Diffusion 扩散模型
  • 强化学习 RL:Q-Learning、DQN、PPO
  • 多模态:图文、音视频融合

四、大模型 & 应用工程层(当下就业/落地核心)

1. 大模型基础认知

  • LLM 发展脉络、基座模型、微调、对齐(RLHF/DPO)
  • 上下文窗口、Token、Prompt 原理

2. 大模型应用开发

  • 提示工程 Prompt Engineering:基础提示、Few-shot、思维链 CoT
  • 检索增强生成 RAG:向量数据库、文档解析、向量召回、问答系统
  • 智能体 Agent:工具调用、规划、记忆、多 Agent 协作

3. 工程部署 & 运维

  • 模型推理:本地部署、API 调用、批量推理
  • 部署框架:FastAPI、Gradio、Streamlit(快速做演示应用)
  • 容器化:Docker 打包 AI 服务
  • 云端部署:云服务器、模型托管平台

4. 低代码/开源生态

  • 开源大模型使用、模型量化、轻量化部署
  • 开源项目二次开发(RAG 框架、Agent 框架)

五、专项进阶 & 职业方向

根据目标挑选 1~2 个主线深入:

  1. 算法研究方向
    • 模型微调、预训练、模型压缩/量化/剪枝
    • 论文阅读、实验复现、顶会基础
  2. AI 应用开发方向
    • 全栈 AI 应用、前后端结合、产品落地
    • AI+业务(办公、客服、教育、工业等)
  3. 数据/AI 工程方向
    • 数据治理、数据标注、AI 数据流水线
    • 算力调度、集群运维
  4. AI 产品方向
    • 能力拆解、需求设计、原型、AI 产品落地逻辑