经典模型与架构

大模型经典架构笔记,记录多模态模型连接方式、视觉编码器选择、文本解码器设计和 DeepSeek 技术细节。

May 6, 2025 · 60 分钟 · 30004 字 · Yangless

训练与微调技术

大模型训练与微调笔记,记录全量微调、参数高效微调、LoRA 原理和指令微调方法。

May 6, 2025 · 28 分钟 · 13696 字 · Yangless

OpenWeb UI指南(基于Docker安装)

OpenWeb UI Docker 部署指南,记录 Windows WSL2 环境配置、网络代理设置和镜像源优化。解决常见安装问题,快速搭建本地 AI 聊天界面。

April 29, 2025 · 2 分钟 · 869 字 · Yangless

训练数据集与性能评测

大模型训练数据集与评测指南:中文数据集资源汇总、数据处理方法、模型性能评测指标。构建高质量训练数据的实用教程。

April 29, 2025 · 21 分钟 · 10354 字 · Yangless

LLM基础知识

大语言模型基础知识笔记,梳理 Token 机制、BPE 编码、模型微调、幻觉现象、涌现能力等核心概念,帮助初学者快速掌握 LLM 技术要点。

April 29, 2025 · 99 分钟 · 49480 字 · Yangless

Transformer模块

Transformer 架构笔记,记录 Encoder-Decoder 结构、多头自注意力、前馈网络、残差连接和层归一化等基础模块。

April 29, 2025 · 49 分钟 · 24512 字 · Yangless

模型可解释性论文

模型可解释性相关材料:定性研究、特征可视化,以及 Anthropic 对大语言模型思维追踪的实验。

April 28, 2025 · 1 分钟 · 51 字 · Yangless

深度学习框架知识点

PyTorch深度学习框架核心知识:Tensor存储机制、view与reshape区别、内存管理优化。掌握框架底层原理的实用指南。

April 25, 2025 · 56 分钟 · 27811 字 · Yangless

深度学习基础概念

深度学习基础概念笔记,记录反向传播、梯度消失、激活函数选择、神经网络基础理论和常见数学推导。

April 24, 2025 · 65 分钟 · 32309 字 · Yangless

Python进阶知识

Python 进阶知识笔记,记录生成器、装饰器、标准库、内存优化和函数式编程等常见主题。

April 24, 2025 · 38 分钟 · 18708 字 · Yangless