Agent2

本文梳理智能体的演进脉络,从传统基于模型与效用的控制架构,到大语言模型(LLM)驱动的认知范式。重点讨论 Agent 从“显式规则”到“隐式推理”的核心转变。

December 19, 2025 · 10 分钟 · 4645 字

LLM解释

解释大语言模型的工作原理,从数据收集清洗到模型训练全流程。梳理参数与词元概念、微调技术、工具使用减少幻觉、强化学习优化等核心技术,理解 LLM 的运作机制。

August 1, 2025 · 17 分钟 · 8412 字

提示工程

提示工程技巧笔记,记录清晰直接的示例、思维链推理、XML 标签、角色设定和评估方法。

July 22, 2025 · 59 分钟 · 29378 字

Agent

梳理 AI Agent 的概念演进,从强化学习 Agent 到基于大语言模型的智能代理系统,并记录自主程度分级、工作流模式和 Agent 与强化学习的关系。

June 20, 2025 · 14 分钟 · 6567 字

AIGC算法高频面试题目

整理 AIGC 算法面试高频题,覆盖推荐系统、大语言模型、深度学习等核心技术点。包含携程、字节跳动等大厂真题解析,并补充答案思路和实战经验。

May 8, 2025 · 98 分钟 · 48959 字

大模型的安全性

大模型安全性笔记,记录对抗攻击原理与防御策略,包括白盒、灰盒、黑盒攻击、token 操作和梯度攻击机制。

May 7, 2025 · 4 分钟 · 1915 字

经典模型与架构

大模型经典架构笔记,记录多模态模型连接方式、视觉编码器选择、文本解码器设计和 DeepSeek 技术细节。

May 6, 2025 · 60 分钟 · 30004 字

LLM基础知识

大语言模型基础知识笔记,梳理 Token 机制、BPE 编码、模型微调、幻觉现象、涌现能力等核心概念,帮助初学者快速掌握 LLM 技术要点。

April 29, 2025 · 99 分钟 · 49480 字

模型可解释性论文

模型可解释性相关材料:定性研究、特征可视化,以及 Anthropic 对大语言模型思维追踪的实验。

April 28, 2025 · 1 分钟 · 51 字