模型可解释性论文 Posted on 2025-04-28 Edited on 2025-06-05 In LLM 这篇笔记整理了模型可解释性论文,主要记录了对定性研究的思考、特征可视化等。作为一个模型可解释性的初学者,我将结合自己的学习实践,以通俗易懂的方式进行介绍,希望能够帮助到大家,也方便自己日后复习巩固! 模型可解释性论文: 对定性研究的思考 — Reflections on Qualitative Research 特征可视化 — Feature Visualization Tracing the thoughts of a large language model \ Anthropic