梳理大型多模态推理模型(LMRMs)的技术演进路线:从早期感知驱动的模块化设计,到大模型时代的思维链(CoT)推理,再到基于强化学习的长程规划系统。
大模型经典架构笔记,记录多模态模型连接方式、视觉编码器选择、文本解码器设计和 DeepSeek 技术细节。