2025年10月21日QA 合集 🧣📋114📌2025年11月01日LLM 训练优化 📋 22025年10月03日策略梯度定理及其推导 🧣2025年09月09日位置编码 ( Position Encoding ) 📋 242025年09月05日Transformer 模型架构 ✒️ 3📋 232025年09月24日策略梯度算法 ( RLHF 背景 ) 🧣✒️ 2📋 62025年09月18日RLHF ( 基于人类反馈的强化学习 ) 🧣✒️📋 132025年08月22日AutoPhrase 备忘2025年08月21日复合词检测2025年08月08日VSCode 备忘2025年08月06日开发环境配置 ( 基于 WSL )2025年08月05日uv备忘2025年08月02日批量删除历史已提交文件2025年07月08日链表操作备忘2025年07月08日过拟合与正则化 ✒️2025年07月08日设计模式 Wiki
Total Time: 12 hrs 51 mins Python 5 hrs 29 mins >>>>>>>>>>>-------------- 42.69 % Markdown 2 hrs 32 mins >>>>>-------------------- 19.74 % GitHub 2 hrs 20 mins >>>>>-------------------- 18.17 % Other 1 hr 33 mins >>>---------------------- 12.08 % TOML 28 mins >------------------------ 03.73 %
More Algorithm Topics 📚🧩🎲💡🚨
- Transformer 基础架构 ✒️ 3📋 23
Encoder-Decoder • 注意力机制 (MHA) • FFN • 正弦位置编码
- Transformer 改进 ✒️ 1
位置编码 📋 24 • 相对位置编码 • 旋转位置编码 (RoPE)🔥 • MoE (混合专家) ✒️ 1📋 8
- Transformer 改进 ✒️ 1
- LLM 训练优化 📋 2
- LLM 基座模型 ✒️ 1📋 6✨
- Transformer 常见面试问题 💾
- Transformer Wiki 💾
- BERT + CRF 备忘 💾
- SFT 基础概念 📋 9
- RLHF ( 偏好学习, 对齐学习 ) 🧣✒️📋 13
- 强化学习基础 ( LLM-based )
- 策略梯度定理及其推导 🧣
基本形式 • Q函数形式 • A函数形式 • Score Function 恒等式 • 基线不变性
- 策略梯度算法 🧣✒️ 2📋 6
- 强化学习基础 ( LLM-based )
技巧
模板
- BERT 常见面试问题
- BERT 系列 ( Encoder-only ) ✒️ 1📋 7
- GitBook 备忘
- Hive 常用 SQL 备忘
- Hive/Spark SQL 常用查询记录
- Hive/Spark/Presto SQL 备忘
- Jupyter & IPython 使用备忘
- KDD 2022
- LLM 应用收集
- LLM 训练方案整理
- Label Studio 使用记录
- Mac 环境配置
- NLP 领域术语 Wiki
- Node.js 环境搭建
- Obsidian
- PET ( Pattern-Exploiting Training ) 模型
- PySpark 笔记
- Python Wiki
- Python 标准项目实践
- Query 分析指南
- Query 扩展 ( 电商领域 )
- Query 纠错
- RLHF 及其实现 ( PPO, DPO, GRPO 等 )
- SMART Loss
- SQL优化之暴力扫描
- Transformer 的优势与劣势
- Transformer/BERT 常见变体
- Transformer与长度外推性
- Windows 使用备忘
split分割文件- huggingface 套件使用备忘
- query 理解参考资料
- requirements.txt 语法备忘
- 一些有趣的问题 📋2
- 低资源训练
- 使用 LLM 优化简历
- 使用 LLM 阅读论文
- 同义词挖掘
- 基于 BERT/MLM 的查询扩展方法
- 基于 SQL 计算信息熵与信息增益
- 基于用户行为数据的同义词挖掘方法 ( 英文 )
- 多轮MRC信息抽取的优缺点
- 实体链接相关概念
- 实验报告模板
- 常用 prompt 备忘
- 常见的文本相似度计算
- 常见面试问题 ( 非技术 )
- 快捷键记录
- 搜索指标
- 搜索相关阅读
- 数仓基础概念
- 文件夹模式测试-a
- 文件夹模式测试-b
- 文件夹模式测试
- 深度学习环境配置
- 电商搜索
- 电商领域的 NER
- 简历书写技巧 ( 算法 )
- 算法面试笔记
- 算法面试问题收录 ✒️