经典模型与架构
大模型经典架构笔记,记录多模态模型连接方式、视觉编码器选择、文本解码器设计和 DeepSeek 技术细节。
大模型经典架构笔记,记录多模态模型连接方式、视觉编码器选择、文本解码器设计和 DeepSeek 技术细节。
大模型训练与微调笔记,记录全量微调、参数高效微调、LoRA 原理和指令微调方法。
OpenWeb UI Docker 部署指南,记录 Windows WSL2 环境配置、网络代理设置和镜像源优化。解决常见安装问题,快速搭建本地 AI 聊天界面。
大模型训练数据集与评测指南:中文数据集资源汇总、数据处理方法、模型性能评测指标。构建高质量训练数据的实用教程。
大语言模型基础知识笔记,梳理 Token 机制、BPE 编码、模型微调、幻觉现象、涌现能力等核心概念,帮助初学者快速掌握 LLM 技术要点。
Transformer 架构笔记,记录 Encoder-Decoder 结构、多头自注意力、前馈网络、残差连接和层归一化等基础模块。
模型可解释性相关材料:定性研究、特征可视化,以及 Anthropic 对大语言模型思维追踪的实验。
PyTorch深度学习框架核心知识:Tensor存储机制、view与reshape区别、内存管理优化。掌握框架底层原理的实用指南。
深度学习基础概念笔记,记录反向传播、梯度消失、激活函数选择、神经网络基础理论和常见数学推导。
Python 进阶知识笔记,记录生成器、装饰器、标准库、内存优化和函数式编程等常见主题。