LLM基础

Agent2

本文梳理智能体的演进脉络，从传统基于模型与效用的控制架构，到大语言模型（LLM）驱动的认知范式。重点讨论 Agent 从“显式规则”到“隐式推理”的核心转变。

解释大语言模型的工作原理，从数据收集清洗到模型训练全流程。梳理参数与词元概念、微调技术、工具使用减少幻觉、强化学习优化等核心技术，理解 LLM 的运作机制。

提示工程技巧笔记，记录清晰直接的示例、思维链推理、XML 标签、角色设定和评估方法。

梳理 AI Agent 的概念演进，从强化学习 Agent 到基于大语言模型的智能代理系统，并记录自主程度分级、工作流模式和 Agent 与强化学习的关系。

整理 AIGC 算法面试高频题，覆盖推荐系统、大语言模型、深度学习等核心技术点。包含携程、字节跳动等大厂真题解析，并补充答案思路和实战经验。

大模型安全性笔记，记录对抗攻击原理与防御策略，包括白盒、灰盒、黑盒攻击、token 操作和梯度攻击机制。

大模型经典架构笔记，记录多模态模型连接方式、视觉编码器选择、文本解码器设计和 DeepSeek 技术细节。

大语言模型基础知识笔记，梳理 Token 机制、BPE 编码、模型微调、幻觉现象、涌现能力等核心概念，帮助初学者快速掌握 LLM 技术要点。

模型可解释性相关材料：定性研究、特征可视化，以及 Anthropic 对大语言模型思维追踪的实验。