模型解释 | 杨の草原

LLM解释

解释大语言模型的工作原理，从数据收集清洗到模型训练全流程。梳理参数与词元概念、微调技术、工具使用减少幻觉、强化学习优化等核心技术，理解 LLM 的运作机制。

模型可解释性论文

模型可解释性相关材料：定性研究、特征可视化，以及 Anthropic 对大语言模型思维追踪的实验。