| 从零开始补 Python 常用能力 |
常用内置函数 → string → os → pathlib |
| 打牢语法和基础心智模型 |
语法与数据类型 → 控制流 → 函数与作用域 → 推导式与生成器 |
| 写脚本、命令行工具、自动化任务 |
argparse → sys → subprocess → logging |
| 做文件处理和数据清洗 |
csv → json → pathlib → 文件处理专题 → 数据清洗专题 |
| 做网络请求和接口调用 |
urllib → requests → httpx → 网络编程专题 |
| 补测试、调试和排错能力 |
unittest → pdb → traceback → 性能与调试专题 |
| 补算法、数据结构和刷题基础 |
算法与数据结构专题 → collections → itertools 与 functools |
| 做 Excel、图表和数据汇报 |
pandas → openpyxl → matplotlib → 数据可视化专题 |
| 进入现代 Python 测试流 |
pytest → unittest.mock → 测试与质量专题 → 接口测试专题 |
| 进入 Web 后端开发 |
Flask 入门 或 FastAPI 入门 → SQLAlchemy 2.x 基础 → 项目结构专题 |
| 做异步网络或高并发抓取 |
asyncio → httpx → aiohttp → Web 抓取专题 |
| 学数据库建模和迁移 |
sqlite3 → SQLAlchemy 2.x 基础 → Alembic → 数据库开发专题 |
| 学配置、发布和部署 |
导入、包与虚拟环境 → 配置管理专题 → 打包与发布专题 → 部署与运维专题 |
| 学现代 Python 包管理 |
导入、包与虚拟环境 → Python 包管理专题 → uv / Poetry |
| 建立团队工程质量约束 |
typing 与 dataclasses → mypy → ruff → 代码质量专题 → CI/CD 专题 |
| 做缓存、后台任务和实时系统 |
queue → redis-py → celery → websockets → 缓存与队列专题 |
| 做缓存稳定性治理 |
缓存与队列专题 → Redis 高级专题 → 缓存稳定性专题 |
| 做浏览器自动化与端到端测试 |
Playwright → 浏览器自动化专题 → 测试进阶专题 |
| 做调度、流处理和服务观测 |
APScheduler → kafka-python → 消息系统专题 → 可观测性专题 |
| 做服务治理和生产可观测 API |
FastAPI 入门 → FastAPI 进阶专题 → 认证与授权专题 → 健康检查与指标专题 |
| 做 OpenAPI 契约治理 |
OpenAPI 治理专题 → 契约测试专题 → Schemathesis |
| 做 API 分页、过滤与错误模型治理 |
API 开发专题 → API 分页与过滤专题 → API 错误契约专题 → OpenAPI 治理专题 |
| 做 GraphQL 服务 |
GraphQL API 专题 → Graphene 或 Strawberry GraphQL → 契约测试专题 |
| 做 API 契约和兼容治理 |
API 开发专题 → API 版本治理专题 → 契约测试专题 → Schema 演进专题 |
| 做回调与异步事件接入 |
Webhooks 专题 → 幂等与重试专题 → 消息系统专题 → Outbox / Inbox 模式专题 |
| 做权限与策略抽象 |
认证与授权专题 → RBAC 与 ABAC 专题 → 策略引擎专题 → Casbin |
| 做数据平台和语义检索 |
数据管道专题 → 数据仓库与 ETL 专题 → 向量检索专题 |
| 做对象存储与数据湖 |
对象存储专题 → boto3 或 MinIO → 数据湖存储专题 → Lakehouse 表格式专题 |
| 做搜索与混合检索 |
搜索系统专题 → rank-bm25 或 Elasticsearch → 混合检索专题 → 元数据过滤专题 |
| 做 MongoDB 异步服务 |
MongoDB 开发专题 → PyMongo / Motor → Beanie |
| 做 MongoDB 文档建模与聚合优化 |
MongoDB 开发专题 → MongoDB 模式设计专题 → MongoDB 索引与聚合专题 |
| 做 PostgreSQL 类型化后端 |
PostgreSQL 开发专题 → psycopg → psycopg_pool → SQLModel → API 开发专题 |
| 做异步数据库服务 |
异步数据库专题 → asyncpg / databases → SQLAlchemy 进阶专题 |
| 做 MySQL 业务库开发 |
MySQL 开发专题 → PyMySQL / mysqlclient → SQL 优化专题 |
| 做 MySQL 执行计划与锁争用治理 |
MySQL 开发专题 → MySQL 查询计划专题 → MySQL 锁冲突与争用专题 |
| 做分析型日志与宽表查询 |
ClickHouse 分析专题 → clickhouse-connect → 列式数据处理专题 |
| 做 Spark / Lakehouse 数据平台 |
Spark 数据处理专题 → PySpark → Delta Lake 专题 → deltalake |
| 做数据库事务、索引和迁移治理 |
数据库开发专题 → 事务与隔离级别专题 → 索引设计专题 → Schema 迁移与回填专题 → PostgreSQL 分区维护专题 |
| 做工程化爬虫 |
Web 抓取专题 → Scrapy 爬取专题 → 数据清洗专题 → 任务调度专题 |
| 做高质量测试体系 |
测试与质量专题 → 测试进阶专题 → 属性测试专题 → 并行测试专题 |
| 做覆盖率、时间测试和接口模糊测试 |
coverage.py → pytest-cov → 时间与时钟测试专题 → API Fuzzing 专题 |
| 做多版本和多环境兼容测试 |
测试矩阵专题 → CI/CD 专题 → Hatch |
| 做异步服务测试 |
异步测试专题 → pytest-asyncio → HTTP Mock 与录制专题 |
| 做压测与容量评估 |
压测专题 → Locust → 连接池专题 → 可观测性专题 |
| 做异步服务资源治理 |
异步编程专题 → AnyIO → 异步资源生命周期专题 → 背压与流控专题 |
| 做 Redis Streams 与轻量消息流 |
Redis 高级专题 → Redis Streams 消费专题 → 消息系统专题 |
| 做缓存失效与回源保护 |
缓存与队列专题 → Redis 缓存失效策略专题 → 缓存稳定性专题 |
| 做现代分析工程与列式分析 |
Polars → DuckDB → 列式数据处理专题 → 分析工程专题 |
| 做现代认证与权限治理 |
Token 认证专题 → OAuth2 与 OpenID Connect 专题 → RBAC 与 ABAC 专题 |
| 做 RAG 和向量检索应用 |
文档切分专题 → 向量检索专题 → RAG 流水线专题 → LangChain 或 LlamaIndex |
| 做 RAG 评测与上下文治理 |
RAG 流水线专题 → RAG 评测专题 → 上下文工程专题 → tiktoken |
| 做文档知识库与 OCR 入库 |
PDF 与 OCR 专题 → 文档抽取专题 → PyMuPDF / unstructured |
| 做向量召回与重排优化 |
向量检索专题 → Embedding 与 Rerank 专题 → sentence-transformers |
| 做数据契约与质量治理 |
数据质量测试专题 → 数据契约专题 → Great Expectations → Schema 演进专题 |
| 做事件流治理与 CDC |
流处理专题 → 变更数据捕获专题 → Schema Registry 专题 |
| 做实验追踪与模型治理 |
实验跟踪专题 → MLflow → 模型注册专题 → 特征库专题 |
| 做模型服务与推理平台 |
模型服务专题 → 推理优化专题 → ONNX Runtime → Triton 推理服务专题 |
| 做特征服务与一致性治理 |
特征库专题 → 特征服务专题 → 在线离线一致性专题 → 模型评估专题 |
| 做 Iceberg / Lakehouse 元数据治理 |
Lakehouse 表格式专题 → PyIceberg → Lakehouse Catalog 专题 |
| 做密钥与多环境配置治理 |
配置管理专题 → 密钥管理专题 → pydantic-settings → hvac |
| 做日志关联、埋点与指标治理 |
可观测性专题 → 观测埋点专题 → 日志关联与结构化日志专题 → 指标基数治理专题 |
| 做 PostgreSQL 复制、分区与故障切换 |
PostgreSQL 开发专题 → PostgreSQL 复制与故障切换专题 → PostgreSQL 分区维护专题 → 备份与归档专题 |
| 做 PostgreSQL 连接耗尽与池化排障 |
连接池专题 → PostgreSQL 连接耗尽专题 → 容量规划专题 → 可观测性专题 |
| 做 PostgreSQL 读写分离与复制延迟治理 |
PostgreSQL 读写分离专题 → PostgreSQL 复制延迟专题 → PostgreSQL 复制与故障切换专题 |
| 做 PostgreSQL 慢查询与语句超时治理 |
SQL 优化专题 → 查询计划分析专题 → PostgreSQL 语句超时专题 → PostgreSQL 统计与观测专题 |
| 做 PostgreSQL 多租户数据隔离 |
PostgreSQL 租户隔离专题 → 分片与分区专题 → 认证与授权专题 |
| 做检索索引构建与查询改写 |
索引构建流水线专题 → 文档切分专题 → 查询改写专题 → 元数据过滤专题 |
| 做搜索诊断与零结果治理 |
搜索诊断专题 → 搜索零结果分析专题 → 查询改写专题 → 搜索实验专题 |
| 做搜索自动补全与查询建议 |
搜索自动补全专题 → 搜索同义词与分析器专题 → 查询意图分类专题 |
| 做搜索过滤、Facet 与多租户隔离 |
搜索过滤设计专题 → Facet 聚合搜索专题 → 搜索多租户隔离专题 |
| 做搜索结果多样性与重排优化 |
搜索结果多样性专题 → 搜索相关性调优专题 → Reranker 服务化专题 |
| 做 Kubernetes 工程化交付 |
Kubernetes 运维专题 → Kubernetes 探针与优雅停机专题 → Kubernetes 滚动交付专题 → GitOps 交付专题 |
| 做 Kubernetes 资源规划与扩缩容 |
Kubernetes 资源治理专题 → Kubernetes 自动扩缩容专题 → 容量规划专题 |
| 做 Kubernetes 有状态与批处理任务 |
Kubernetes Stateful 工作负载专题 → Kubernetes Job 与 CronJob 专题 → Kubernetes 调度与亲和性专题 |
| 做 Kubernetes 网络、身份与密钥治理 |
Kubernetes NetworkPolicy 专题 → Kubernetes 工作负载身份专题 → Kubernetes Secret 分发专题 |
| 做 Kubernetes 配置发布与灰度回滚 |
Kubernetes ConfigMap 与运行时配置专题 → 运行时配置专题 → 配置灰度与回滚专题 |
| 做 Kubernetes Pod 与镜像排障 |
Kubernetes Pod 排障专题 → Kubernetes 镜像拉取故障专题 → Runbook 与运维手册专题 |
| 做 PostgreSQL 日志、备份与恢复 |
PostgreSQL WAL 与 Checkpoint 专题 → PostgreSQL 备份与恢复专题 → Runbook 与运维手册专题 |
| 做 CDC 与逻辑解码链路 |
PostgreSQL 逻辑解码专题 → 变更数据捕获专题 → Schema Registry 专题 → 数据契约专题 |
| 做搜索分析器、同义词与实验 |
搜索同义词与分析器专题 → 搜索相关性调优专题 → 搜索实验专题 |
| 做重排模型在线服务 |
Embedding 与 Rerank 专题 → Reranker 服务化专题 → 推理优化专题 |
| 做 Kubernetes 调度、PDB 与入口治理 |
Kubernetes PDB 与可用性专题 → Kubernetes 调度与亲和性专题 → Kubernetes Ingress 与流量入口专题 |
| 做 Kubernetes 多集群交付与容灾 |
Kubernetes 多集群专题 → GitOps 交付专题 → 事故响应专题 |
| 做故障演练与值班手册 |
事故响应专题 → 故障演练专题 → Runbook 与运维手册专题 → 可观测性专题 |
| 做 PostgreSQL 死锁与锁等待排障 |
PostgreSQL 锁与并发专题 → PostgreSQL 死锁排障专题 → PostgreSQL 统计与观测专题 |
| 做 PostgreSQL 长事务与膨胀治理 |
PostgreSQL 长事务专题 → PostgreSQL VACUUM 与膨胀专题 → PostgreSQL 语句超时专题 |
| 做 PostgreSQL 批量导入与历史回填 |
PostgreSQL 批量导入专题 → Schema 迁移与回填专题 → PostgreSQL WAL 与 Checkpoint 专题 |
| 做搜索拼写纠错与查询纠偏 |
搜索拼写纠错专题 → 搜索同义词与分析器专题 → 查询改写专题 |
| 做搜索索引新鲜度治理 |
搜索索引新鲜度专题 → 索引构建流水线专题 → 索引版本切换专题 |
| 做搜索分析指标与看板建设 |
搜索分析指标专题 → 搜索诊断专题 → 搜索实验专题 |
| 做搜索去重与结果合并 |
搜索去重专题 → 搜索结果多样性专题 → Facet 聚合搜索专题 |
| 做混合检索权重与候选校准 |
混合检索专题 → 混合检索校准专题 → 相关性调优专题 |
| 做 Kubernetes 驱逐、抢占与容量治理 |
Kubernetes 驱逐专题 → Kubernetes 资源治理专题 → 容量规划专题 |
| 做 Kubernetes 发布回滚与故障恢复 |
Kubernetes 回滚专题 → Kubernetes 滚动交付专题 → Runbook 与运维手册专题 |
| 做 Kubernetes ServiceAccount 与 RBAC 治理 |
Kubernetes ServiceAccount 与 RBAC 专题 → RBAC 与 ABAC 专题 → Kubernetes 工作负载身份专题 |
| 做 Kubernetes Ingress 灰度发布 |
Kubernetes Ingress 灰度专题 → Kubernetes Ingress 与流量入口专题 → 渐进式交付专题 |
| 做 Token 生命周期治理 |
Token 生命周期专题 → Token 认证专题 → OAuth2 与 OpenID Connect 专题 |
| 做 Token 吊销与会话失效控制 |
Token 吊销专题 → Token 生命周期专题 → 服务间认证专题 |
| 做策略灰度发布与规则变更控制 |
策略灰度发布专题 → 策略引擎专题 → 渐进式交付专题 |
| 做配置结构校验与配置防御 |
配置结构校验专题 → 配置管理专题 → 运行时配置专题 |
| 做 PostgreSQL 幂等写入与事件防重 |
PostgreSQL 幂等写入专题 → 幂等与重试专题 → 事务与隔离级别专题 |
| 做 PostgreSQL 轻量任务队列 |
PostgreSQL 任务队列专题 → 任务队列架构专题 → Worker 运行治理专题 |
| 做 PostgreSQL 分布式互斥与抢锁 |
PostgreSQL Advisory Lock 专题 → PostgreSQL 锁与并发专题 → 连接池专题 |
| 做 PostgreSQL 在线改表与数据修复 |
PostgreSQL 在线 DDL 专题 → PostgreSQL 数据修复专题 → Schema 迁移与回填专题 |
| 做搜索查询理解与意图结构化 |
搜索 Query Understanding 专题 → 查询意图分类专题 → 查询改写专题 |
| 做搜索排序信号与业务权重治理 |
搜索排序信号专题 → 搜索相关性调优专题 → 搜索实验专题 |
| 做搜索容量预算与重建规划 |
搜索容量规划专题 → 索引构建流水线专题 → 容量规划专题 |
| 做 Kubernetes 节点池与工作负载分层 |
Kubernetes 节点池专题 → Kubernetes 调度与亲和性专题 → Kubernetes 成本优化专题 |
| 做 Kubernetes 准入策略与变更拦截 |
Kubernetes 准入控制专题 → 策略引擎专题 → Kubernetes NetworkPolicy 专题 |
| 做 GitOps 配置漂移治理 |
Kubernetes 配置漂移专题 → GitOps 交付专题 → 审计日志专题 |
| 做 JWKS 密钥分发与轮换 |
JWKS 轮换专题 → Token 生命周期专题 → 密钥轮换专题 |
| 做多端登录与会话治理 |
会话管理专题 → Token 吊销专题 → 认证与授权专题 |
| 做控制器排障与多租户平台治理 |
Kubernetes 控制器排障专题 → Kubernetes 多租户专题 → Kubernetes 优先级与抢占专题 |
| 做策略回归验证与权限矩阵测试 |
策略测试专题 → 策略引擎专题 → 契约测试专题 |
| 做配置漂移检测与基线治理 |
配置漂移检测专题 → 配置管理专题 → 配置灰度与回滚专题 |
| 做 PostgreSQL 在线迁移与无停机 DDL |
PostgreSQL 在线 DDL 专题 → Schema 迁移与回填专题 → PostgreSQL 锁与并发专题 |
| 做 PostgreSQL 热点写入与争用缓解 |
PostgreSQL 热点争用专题 → PostgreSQL 锁与并发专题 → PostgreSQL 统计与观测专题 |
| 做 PostgreSQL 数据修复与补数治理 |
PostgreSQL 数据修复专题 → PostgreSQL 批量导入专题 → 审计日志专题 |
| 做搜索查询规则与运营干预 |
搜索 Query Rules 专题 → 搜索 Query Understanding 专题 → 搜索实验专题 |
| 做搜索召回评测与候选覆盖验证 |
搜索召回评测专题 → 混合检索校准专题 → RAG 评测专题 |
| 做搜索索引成本与资源治理 |
搜索成本治理专题 → 搜索容量规划专题 → 成本治理专题 |
| 做 Kubernetes 关键服务优先级保护 |
Kubernetes 优先级与抢占专题 → Kubernetes 驱逐专题 → Kubernetes PDB 与可用性专题 |
| 做 Kubernetes 多租户隔离治理 |
Kubernetes 多租户专题 → Kubernetes ServiceAccount 与 RBAC 专题 → Kubernetes NetworkPolicy 专题 |
| 做 Kubernetes 控制器收敛排障 |
Kubernetes 控制器排障专题 → Kubernetes Pod 排障专题 → Runbook 与运维手册专题 |
| 做高风险操作二次认证 |
风险认证专题 → 会话管理专题 → 限流专题 |
| 做策略变更离线回放与影响面评估 |
策略回放与模拟专题 → 策略测试专题 → 策略灰度发布专题 |
| 做配置审批与变更门禁 |
配置变更治理专题 → 配置结构校验专题 → 配置灰度与回滚专题 |
| 做多包仓库与共享组件治理 |
项目结构专题 → Monorepo 与多包项目专题 → PDM |
| 做 worker 运行治理与调优 |
任务队列架构专题 → Worker 运行治理专题 → psutil |
| 做服务韧性与安全发布 |
限流专题 → 幂等与重试专题 → 断路器与隔离专题 → 发布策略专题 |
| 做服务发现与渐进式发布 |
服务发现专题 → API 网关模式专题 → 渐进式交付专题 → 事故响应专题 |
| 做运行时配置与开关治理 |
配置管理专题 → 运行时配置专题 → 特性开关专题 → 发布策略专题 |
| 做 API Key 与服务间认证治理 |
API Key 治理专题 → 服务间认证专题 → 认证与授权专题 → 密钥轮换专题 |
| 做事件驱动系统协作 |
事件驱动架构专题 → 消息系统专题 → 数据契约专题 → 消费者驱动契约专题 |
| 做 CQRS / Event Sourcing / Saga 架构 |
CQRS 专题 → Event Sourcing 专题 → Saga 模式专题 |
| 做供应链安全与制品治理 |
安全基础专题 → 密码安全专题 → 供应链安全专题 |
| 做依赖治理与升级策略 |
Python 包管理专题 → 依赖治理专题 → 供应链安全专题 |
| 做依赖安全与隐私治理 |
依赖扫描专题 → Bandit / pip-audit → 审计日志专题 → 隐私治理专题 |
| 做 LLM 网关、路由与 Agent 编排 |
LLM 网关专题 → 模型路由专题 → 工具调用专题 → Agent 编排专题 |