Files
cs249r_book/README/README_zh.md

17 KiB
Raw Permalink Blame History

机器学习系统

人工智能系统工程的原理与实践

English中文日本語한국어

Book TinyTorch Updated License Cite Fund Us

📖 在线阅读Tiny🔥Torch📄 下载 PDF📓 下载 EPUB🌐 探索生态系统

📚 2026 年 MIT Press 将出版纸质版


使命

世界正急速构建 AI 系统,却缺乏系统性的工程方法。

这正是我们所说的 AI 工程。

AI 工程是一门学科,致力于在真实世界中构建高效、可靠、安全且稳健的智能系统,而不仅仅是孤立的模型。

我们的使命: 将 AI 工程确立为基础学科与软件工程和计算机工程并列通过教学让人们掌握端到端智能系统的设计、构建与评估方法。AI 的长期影响将由能够将想法转化为可运行、可信赖系统的工程师塑造。


本仓库包含的内容

本仓库是 AI 系统工程的开放学习栈。

它包括教材源码、TinyTorch、硬件套件以及即将推出的将原理与可运行代码、真实设备相连接的协作实验colabs


入门指南

根据你的目标选择路径。

READ教材开始。先阅读第 1 章Benchmarking 章节

BUILD 按照入门指南启动 TinyTorch。从 Module 01 开始,逐步学习 CNN、Transformer 以及 MLPerf 基准。

DEPLOY 选择硬件套件,在 Arduino、Raspberry Pi 等边缘设备上进行实验。

CONNECTDiscussions中打声招呼,我们会尽快回复。


学习栈

下面的示意图展示了教材如何与动手实践和部署相连接。阅读教材后,挑选你感兴趣的路径:

┌───────────────────────────────────────────────────────────────────────────────┐
│                                                                               │
│                           MACHINE LEARNING SYSTEMS                            │
│                              Read the Textbook                                │
│                                                                               │
│                    Theory • Concepts • Best Practices                         │
│                                                                               │
└───────────────────────────────────────┬───────────────────────────────────────┘
                                        │
                          ┌─────────────┼─────────────┐
                          │             │             │
                          ▼             ▼             ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                            HANDSON ACTIVITIES                                │
│                           (pick one or all)                                   │
│                                                                               │
│     ┌─────────────────┐      ┌─────────────────┐      ┌─────────────────┐     │
│     │                 │      │                 │      │                 │     │
│     │    SOFTWARE     │      │    TINYTORCH    │      │    HARDWARE     │     │
│     │    COLABS      │      │    FRAMEWORK    │      │      LABS       │     │
│     │                 │      │                 │      │                 │     │
│     │ EXPLORE         │      │ BUILD           │      │ DEPLOY          │     │
│     │                 │      │                 │      │                 │     │
│     │ Run controlled  │      │ Understand      │      │ Engineer under  │     │
│     │ experiments on  │      │ frameworks by   │      │ real constraints│     │
│     │ latency, memory,│      │ implementing    │      │ memory, power,  │     │
│     │ energy, cost    │      │ them            │      │ timing, safety  │     │
│     │                 │      │                 │      │                 │
│     │ (coming 2026)   │      │                 │      │ Arduino, Pi     │
│     └─────────────────┘      └─────────────────┘      └─────────────────┘     │
│                                                                               │
│           EXPLORE                  BUILD                   DEPLOY             │
│                                                                               │
└───────────────────────────────────────┬───────────────────────────────────────┘
                                        │
                                        ▼
┌───────────────────────────────────────────────────────────────────────────────┐
│                                                                               │
│                                  AI OLYMPICS                                  │
│                                 Prove Mastery                                 │
│                                                                               │
│       Compete across all tracks • University teams • Public leaderboards      │
│                                                                               │
│                                (coming 2026)                                  │
│                                                                               │
└───────────────────────────────────────────────────────────────────────────────┘
Component What You Do Link
READ 📖 教材 理解机器学习系统概念 book/
EXPLORE 🔮 Software CoLabs 进行延迟、内存、能耗、成本实验 Coming 2026
BUILD 🔥 TinyTorch 亲手实现框架 tinytorch/
DEPLOY 🔧 Hardware Kits 在受内存、功耗、时延、安全约束的硬件上工程实现 kits/
PROVE 🏆 AI Olympics 参与所有赛道的竞技与基准测试 Coming 2026

每条路径的学习内容:

  • EXPLORE 解释 为什么 —— 了解权衡。改变 batch size、精度、模型结构观察延迟、内存和准确率的变化。
  • BUILD 解释 怎么做 —— 理解内部实现。自行实现 autograd、优化器、注意力机制感受 TensorFlow 与 PyTorch 的工作原理。
  • DEPLOY 解释 在哪里 —— 了解约束。真实硬件的内存上限、功耗预算和时延要求下进行实验。

你将学到的内容

本教材教会你在机器学习与系统工程的交叉点思考。每一章都将算法概念与支撑其运行的基础设施相连接。

ML ↔ Systems Bridge

ML Concept Systems Concept What You Learn
Model parameters Memory constraints 如何在资源受限的设备上容纳大型模型
Inference latency Hardware acceleration GPU、TPU、加速器如何执行神经网络
Training convergence Compute efficiency 混合精度与优化技术如何降低计算成本
Model accuracy Quantization and pruning 在保持性能的前提下压缩模型的方法
Data requirements Pipeline infrastructure 如何构建高效的数据加载与预处理流水线
Model deployment MLOps practices 在生产环境中监控、版本管理与更新模型的方式
Privacy constraints Ondevice learning 如何在不将数据上传云端的情况下进行学习与适应

书的结构

Part Focus Chapters
I. Foundations 基础概念 Introduction, ML Systems, DL Primer, Architectures
II. Design 构建模块 Workflow, Data Engineering, Frameworks, Training
III. Performance 加速性能 Efficient AI, Optimizations, HW Acceleration, Benchmarking
IV. Deployment 实际部署 MLOps, Ondevice Learning, Privacy, Robustness
V. Trust 可信可靠 Responsible AI, Sustainable AI, AI for Good
VI. Frontiers 前沿展望 Emerging trends and future directions

与众不同之处

本书是一本活的教材。随着领域的发展,我们会持续更新,并吸收社区的反馈。

AI 的发展速度如闪电般,但支撑其运行的工程模块并不会像头条新闻那样快速更迭。本项目围绕这些稳固的基础构建。

把它想象成乐高。新套装层出不穷,但积木本身保持不变。只要学会如何拼接积木,就能构建任何东西。这里的 "AI 积木" 就是让 AI 正常工作的坚实系统原理。

无论是阅读章节、动手实验还是提供反馈,你都在帮助让这些理念对下一代学习者更加易得。

Research to Teaching Loop

我们使用相同的循环进行研究与教学:定义系统问题 → 构建参考实现 → 基准测试 → 将其转化为课程与工具 → 让他人能够复现与扩展。

Loop Step Research Artifacts Teaching Artifacts
Measure Benchmarks, suites, metrics Benchmarking chapter, assignments
Build Reference systems, compilers, runtimes TinyTorch modules, colabs
Deploy Hardware targets, constraints, reliability Hardware labs, kits

支持我们的工作

我们目标是在 2030 年之前培养 100 万学习者,让 AI 工程成为共享的、可教学的学科,而不是零散的实践集合。每一次星标、分享与贡献都在推动这一目标前进。

为什么 GitHub Stars 很重要?

有度量才会改进。

每一个星标代表一位相信 AI 系统应在严格且真实约束下进行工程化的学习者、教育者或支持者。

Stars

Star History Chart

1 位学习者 → 10 位 → 100 位 → 1,000 位 → 10,000 位 → 100,000 位 → 1M 位

星标不是终点,而是信号。

一个可见的社区让大学、基金会和行业合作伙伴更容易采用本资源、捐赠硬件、资助研讨会。此举降低了下一所学校、下一间教室以及下一批学习者的门槛。

捐助将流向 Open Collective,用于 TinyML4D 研讨会、为资源匮乏的课堂提供硬件套件以及维持免费、开放资源的基础设施。

一次点击即可打开下一间教室、下一位贡献者以及下一代 AI 工程师。

为使命捐款

All contributions go to Open Collective, a transparent fund that supports educational outreach.

Open Collective


社区与资源

Resource Description
📖 教材 交互式在线教材
🔥 TinyTorch 从零实现机器学习框架
🔧 Hardware Kits 部署至 Arduino、Raspberry Pi、边缘设备
🌐 Ecosystem 资源、研讨会、社区
💬 Discussions 提问与想法

贡献指南

我们欢迎对教材、TinyTorch 与硬件套件的贡献!

我想… 前往
修正错别字或改进章节 book/docs/CONTRIBUTING.md
添加 TinyTorch 模块或修复 bug tinytorch/CONTRIBUTING.md
改进硬件实验 kits/README.md
报告问题 GitHub Issues
提问 GitHub Discussions

引用与许可证

引用

@inproceedings{reddi2024mlsysbook,
  title        = {MLSysBook.AI: Principles and Practices of Machine Learning Systems Engineering},
  author       = {Reddi, Vijay Janapa},
  booktitle    = {2024 International Conference on Hardware/Software Codesign and System Synthesis (CODES+ ISSS)},
  pages        = {41--42},
  year         = {2024},
  organization = {IEEE},
  url          = {https://mlsysbook.org}
}

许可证

本项目采用双许可证结构:

Component License What It Means
Book content CC BYNCND 4.0 在署名、非商业、禁止演绎的前提下自由分发
TinyTorch code Apache 2.0 自由使用、修改、分发并附带专利保护

教材内容(章节、图表、解释)属于教育资料,应在署名且非商业使用的前提下自由共享。软件框架则是供任何人使用、修改、集成的工具。


贡献者

以下优秀的贡献者让本资源更加完善:


在 GitHub 上给我们加星✉️ 订阅更新💬 参与讨论🌐 访问 mlsysbook.ai

本教材由 MLSysBook 社区倾情打造。