美团笔试 | 杨の草原

寻找题库中美团笔试类似的题目，方便回顾掌握

选择题集与相关知识点解析

选择题 1

要求在对表达式 6 + 5 * (3 * 2 + 1) - 9 使用栈进行求值的过程中，当扫描到数字1时，对象栈（也叫操作数栈）中的内容是什么。

选择题 2

对10个关键字 {278, 109, 63, 930, 589, 184, 505, 269, 8, 83} 进行链式基数排序，则总共需要进行 () 趟分配收集，第二趟分配后，基数为6的队列中的元素为 ()。

选择题 3

下列关于同步和异步的说法，错误的是 ( )
A 同步是阻塞模式，进程需要等待 B 异步是非阻塞模式，进程无需等待 C 同步的解析速度比异步快 D 同步是有顺序的，异步没有顺序

名称	含义	关键特征	举例
同步 (Synchronous)	调用方必须等待操作完成后才能继续执行。	顺序执行，调用阻塞，逻辑简单。	Python 普通函数调用、Java 传统 I/O。
异步 (Asynchronous)	调用方在发出请求后无需等待，可在操作完成后通过回调/事件获得结果。	非顺序执行，通过事件驱动或 Future 机制管理结果。	JavaScript `async/await`、Python `asyncio`。
阻塞 (Blocking)	调用线程被挂起，直到操作完成。CPU 处于空闲等待状态。	占用线程但不占用 CPU。	`read()` 系统调用等待磁盘数据。
非阻塞 (Non-blocking)	调用立即返回，即使操作未完成，也可通过轮询或回调获得结果。	提高 CPU 利用率，典型于高并发 I/O。	Linux `epoll`、`select`、`aio`、Go runtime。

选择题 4

将 IP 地址空间 211.212.1.0/24 划分为 2 个子网，每个子网需分配的 IP 地址数不少于 120 个。

选择题 5

使用FlashAttention优化推理速度后，推荐系统NDCG下降5%。原因是：
A 近似计算忽略低频用户行为模式 B 块计算（Tiling）导致注意力权重截断误差 C 硬件指令集不兼容FP16精度损失 D 稀疏化掩码破坏行为序列连续性

选择题 6

跨城市迁移外卖推荐模型时，直接微调在新城市AUC下降20%。最优策略是：
A 用原城市数据继续预训练再微调 B 对新城市样本进行加权损失训练 C 采用课程学习渐进切换数据分布 D 冻结Transformer底层仅微调顶层

选择题 7

在10亿用户规模的实时推荐系统中，传统Transformer推理延迟超标。采用稀疏专家模型（MoE）后GPU内存溢出，根本原因是：
A. 专家路由算法（如GShard）未均衡负载 B. 专家参数未分区存储（Parameter Sharding） C. 门控网络（Gating Network）计算开销过高 D. FFN层未启用梯度检查点（Gradient Checkpointing）

选择题 8

联邦微调广告点击率模型时，参与方恶意上传噪声梯度。最可靠防御是：
A 采用RSA加密梯度传输 B 添加梯度范数截断（Gradient Clipping） C 使用Krum或多维中值聚合 D 启用同态加密本地训练

选择题 9

在显存充足、RoPE编码的情况下，使用Ring Attention训练长文本客服模型，序列长度扩展至1M tokens后训练崩溃。经查，Ring Attention的环形通信流程中缺少对超长序列下块处理超时的异常处理机制。根本原因是：
A 块间依赖导致死锁（Deadlock） B 位置编码未适配超长序列 C 显存分配策略导致通信缓冲区溢出 D 注意力计算未启用稀疏化

选择题 10

冷启动骑手调度系统中，大模型对新骑手能力评估误差>40%。当前首要目标是在不影响真实订单体验的前提下，快速获得对骑手能力的可靠估计。系统已积累了大量历史骑手的详细画像与初期表现数据。最优方案是：
A 在模拟环境中使用强化学习进行大量随机派单探索 B 让新骑手在真实环境中尝试高难度订单以测试其极限能力 C 基于历史相似骑手画像进行能力估计迁移 D 仅使用新骑手的年龄和性别进行简单线性回归预测

知识点详解：构建智能骑手冷启动系统

第一部分：从画像到向量——量化“相似”

特征工程 (Feature Engineering)：将骑手的所有信息（画像）转换成一个机器可以处理的特征向量。
1. 数值型特征：年龄、驾龄等（需归一化）。
2. 类别型特征：性别、交通工具、学历等（需独热编码）。
3. 地理/时间特征：常驻区域、活跃时段等（需地理编码或分段编码）。
相似度度量 (KNN方法)：
1. 对新骑手，计算其特征向量与数据库中每个历史骑手向量的距离或相似度。
2. 找到距离最近的 K 个历史骑手（Top-K）。
3. 将这 K 个历史骑手入职初期的表现数据进行加权平均，作为对新骑手能力的初始估计。
更复杂的模型 (Embedding)：使用双塔模型或图神经网络（GNN）学习一个更深刻、更准确的骑手嵌入向量表示，再进行相似度匹配。

第二部分：贝叶斯框架——从静态估计到动态学习

先验信念 (Prior Belief)：
1. 使用Beta分布 Beta(α, β) 来为骑手的能力（如准时率）建模。α 可理解为成功次数，β 为失败次数。
2. 基于第一部分找到的相似群体的初期表现，为新骑手设定一个先验分布。
收集证据与更新信念 (Posterior Update)：
1. 当新骑手完成订单后，利用贝叶斯更新规则更新其能力分布。
2. Posterior = Beta(α_prior + successes, β_prior + failures)。
3. 随着真实数据的积累，分布会变得越来越“瘦高”，代表我们对骑手能力的估计越来越确定。
决策：汤普森采样 (Thompson Sampling)：
1. 一种优雅地平衡“探索与利用”的算法。
2. 流程：当有新订单时，为每个可用骑手，从其当前的能力分布中随机采样一个值。将订单派给采样值最高的那个骑手。
3. 效果：能力确定且高的老骑手有很大概率被选中（利用）；能力不确定的新骑手偶尔能采到高值，从而获得证明自己的机会（探索）。

选择题集与相关知识点解析#

选择题 1#

相关知识点：表达式求值#

1. 中缀表达式 (Infix Notation)#

2. 前缀表达式 (Prefix Notation / Polish Notation)#

3. 后缀表达式 (Postfix Notation / Reverse Polish Notation, RPN)#

使用双栈计算中缀表达式#

选择题 2#

相关知识点：基数排序 (Radix Sort)#

1. 时间复杂度：为什么能突破 O(n log n)？#

2. 优缺点#

选择题 3#

相关知识点：同步/异步 vs. 阻塞/非阻塞#

选择题 4#

相关知识点：IP地址与子网划分#

选择题 5#

相关知识点 1：推荐系统评估指标 (NDCG)#

相关知识点 2：FlashAttention 核心原理#

相关知识点 3：数值精度 (FP16/BF16)#

选择题 6#

相关知识点：迁移学习与领域自适应#

参数微调 (Fine-tuning)#

领域自适应 (Domain Adaptation)#

选择题 7#

相关知识点：稀疏专家模型 (MoE) 工作流#

相关知识点：分布式训练与显存优化#

选择题 8#

相关知识点：联邦学习 (Federated Learning, FL)#

相关知识点：拜占庭攻击与鲁棒聚合#

经典鲁棒聚合算法#

选择题 9#

相关知识点：FlashAttention vs. Ring Attention#

FlashAttention：单卡 GPU 的极致优化#

Ring Attention：多卡 GPU 的协同扩展#

为什么 Ring Attention 会导致死锁？#

选择题 10#

知识点详解：构建智能骑手冷启动系统#

第一部分：从画像到向量——量化“相似”#

第二部分：贝叶斯框架——从静态估计到动态学习#

编码题集与相关知识点解析#

选择题集与相关知识点解析

选择题 1

相关知识点：表达式求值

1. 中缀表达式 (Infix Notation)

2. 前缀表达式 (Prefix Notation / Polish Notation)

3. 后缀表达式 (Postfix Notation / Reverse Polish Notation, RPN)

使用双栈计算中缀表达式

选择题 2

相关知识点：基数排序 (Radix Sort)

1. 时间复杂度：为什么能突破 O(n log n)？

2. 优缺点

选择题 3

相关知识点：同步/异步 vs. 阻塞/非阻塞

选择题 4

相关知识点：IP地址与子网划分

选择题 5

相关知识点 1：推荐系统评估指标 (NDCG)

相关知识点 2：FlashAttention 核心原理

相关知识点 3：数值精度 (FP16/BF16)

选择题 6

相关知识点：迁移学习与领域自适应

参数微调 (Fine-tuning)

领域自适应 (Domain Adaptation)

选择题 7

相关知识点：稀疏专家模型 (MoE) 工作流

相关知识点：分布式训练与显存优化

选择题 8

相关知识点：联邦学习 (Federated Learning, FL)

相关知识点：拜占庭攻击与鲁棒聚合

经典鲁棒聚合算法

选择题 9

相关知识点：FlashAttention vs. Ring Attention

FlashAttention：单卡 GPU 的极致优化

Ring Attention：多卡 GPU 的协同扩展

为什么 Ring Attention 会导致死锁？

选择题 10

知识点详解：构建智能骑手冷启动系统

第一部分：从画像到向量——量化“相似”

第二部分：贝叶斯框架——从静态估计到动态学习

编码题集与相关知识点解析