解释大语言模型的工作原理,从数据收集清洗到模型训练全流程。梳理参数与词元概念、微调技术、工具使用减少幻觉、强化学习优化等核心技术,理解 LLM 的运作机制。
模型可解释性相关材料:定性研究、特征可视化,以及 Anthropic 对大语言模型思维追踪的实验。