强化学习3

强化学习策略梯度代码的实现,以及优势函数的迭代思想。

October 23, 2025 · 20 min · 9857 words

强化学习2

强化学习算法分类和使用示例。

October 23, 2025 · 21 min · 10440 words

强化学习1

强化学习基础概念和主流学习框架。

October 22, 2025 · 24 min · 11550 words

小米面试

小米面试的一些不足和学习。

October 20, 2025 · 42 min · 20882 words

美团笔试

美团AI算法工程师笔试题目反思学习

October 15, 2025 · 13 min · 6278 words

SPARC源码分析

SPARC框架深度解析:量子启发意识编程范式,融合PolarisOne自适应Token加权技术。包括探索意识编码智能体架构,革新软件开发工作流。

September 25, 2025 · 16 min · 7717 words

Claude Code with Unix

深度解析Claude Code架构设计与Unix哲学,通过Gemini-cli源码分析探索AI编程工具实现原理。详解grep搜索策略、命令行工具设计模式和Unix风格编程思想。

September 23, 2025 · 26 min · 12913 words

CC router and MCP router

Claude Code Router和MCP Router配置使用指南,详解CLI编程工具安装配置、多模型路由设置、API集成等核心功能。提升大语言模型开发效率的实用工具教程。

September 15, 2025 · 1 min · 356 words

TONGYI Deep Research

通义DeepResearch开源深度研究智能体详解,支持ReAct模式与Heavy Mode。涵盖WebWalker网页逆向工程、全流程合成数据训练方案。

September 12, 2025 · 9 min · 4371 words

AutoGen入门

AutoGen多智能体框架入门指南,详解AssistantAgent、UserProxyAgent等核心组件。涵盖代码实例、架构设计、工具使用和最佳实践,助力快速构建多Agent协作系统。

September 1, 2025 · 31 min · 15486 words