Posts

经典模型与架构

大模型经典架构笔记，记录多模态模型连接方式、视觉编码器选择、文本解码器设计和 DeepSeek 技术细节。

大模型训练与微调笔记，记录全量微调、参数高效微调、LoRA 原理和指令微调方法。

OpenWeb UI Docker 部署指南，记录 Windows WSL2 环境配置、网络代理设置和镜像源优化。解决常见安装问题，快速搭建本地 AI 聊天界面。

大模型训练数据集与评测指南：中文数据集资源汇总、数据处理方法、模型性能评测指标。构建高质量训练数据的实用教程。

大语言模型基础知识笔记，梳理 Token 机制、BPE 编码、模型微调、幻觉现象、涌现能力等核心概念，帮助初学者快速掌握 LLM 技术要点。

Transformer 架构笔记，记录 Encoder-Decoder 结构、多头自注意力、前馈网络、残差连接和层归一化等基础模块。

模型可解释性相关材料：定性研究、特征可视化，以及 Anthropic 对大语言模型思维追踪的实验。

PyTorch深度学习框架核心知识：Tensor存储机制、view与reshape区别、内存管理优化。掌握框架底层原理的实用指南。

深度学习基础概念笔记，记录反向传播、梯度消失、激活函数选择、神经网络基础理论和常见数学推导。

Python 进阶知识笔记，记录生成器、装饰器、标准库、内存优化和函数式编程等常见主题。