面试笔试算法题
二叉树经典问题
1. 什么是满二叉树、完全二叉树、完美二叉树、二叉搜索树和平衡二叉树?
很好,这是学习树结构中最常见的五类二叉树概念。下面我会逐一解释它们的定义、特征,并附上例子。
🌳 1. 满二叉树(Full Binary Tree)
✅ 定义:
每个非叶子节点都有且只有两个子节点(左、右各一个)。
❌ 注意:
- 不要求所有叶子节点在同一层。
- 但没有“只有一个子节点”的节点。
🌰 例子:
1 | A |
这是满二叉树,每个非叶子节点都有两个子节点。
🌳 2. 完全二叉树(Complete Binary Tree)
✅ 定义:
一棵有 n 个节点 的二叉树:
- 从上到下、从左到右填满(层序编号连续)。
- 只允许最底层节点右侧缺失,不能左边缺失。
🌰 例子:
1 | A |
- 节点 F 没有右兄弟,但没问题。
- 如果 F 在右边而 E 缺失,就不是完全二叉树。
🌳 3. 完美二叉树(Perfect Binary Tree)
✅ 定义:
满足两个条件:
- 所有非叶子节点都有两个子节点(即满二叉树);
- 所有叶子节点都在同一层。
所以「完美二叉树 = 满二叉树 + 叶子在同一层」
🌰 例子:
1 | A |
这个是完美二叉树(也是满的),因为所有叶子都在第3层。
🌳 4. 二叉搜索树(BST,Binary Search Tree)
✅ 定义:
对任意一个节点:
- 左子树上所有节点值 小于 当前节点;
- 右子树上所有节点值 大于 当前节点;
- 中序遍历是升序排列。
🌰 例子:
1 | 8 |
中序遍历:2 → 4 → 6 → 8 → 10 → 12
,是升序的。
🌳 5. 平衡二叉树(AVL树)
✅ 定义:
一种 高度平衡 的二叉搜索树(BST),要求:
- 任意节点左、右子树的高度差 不超过 1。
🌰 例子:
1 | 5 |
每个节点左右子树高度差不超过 1,是平衡的。
✅ 总结对比表
类型 | 特点 |
---|---|
满二叉树 | 所有非叶子节点都有两个子节点 |
完全二叉树 | 除最后一层外都满,最底层从左到右连续填充 |
完美二叉树 | 满二叉树 + 所有叶子节点在同一层 |
二叉搜索树 | 左 < 根 < 右,适用于快速查找 |
平衡二叉树 | BST + 每个节点左右子树高度差 ≤ 1 |
2. 给定节点总数 $n$ ,完全二叉树可能的最小高度是多少?
高度(从1开始)为$h$的完美二叉树有 $2^h-1$ 个节点。那么可以得到高度为 $h$ 的完全二叉树的节点数量 $n$ 满足 $2^{h-1}\le n\le 2^h-1$ 。于是给定节点数量 $n$ ,我们试图找到第一个 $h$ ,其满足 $2^h-1 \ge n$ ,那么就可以得到最小的高度 $h_{min}=\lceil\log_2(n+1)\rceil$ 。
3. 给定节点总数 $n$ ,这有可能是一棵满二叉树吗?
满二叉树的节点数量 $n=2*h-1$ ,所以只需要判断 $n+1$ 是否为偶数即可。
4. 二叉搜索树的前驱后继怎么找(迭代实现)?
下面给出二叉树的寻找前驱的迭代实现。
1 | class TreeNode: |
5. 二叉搜索树的怎么删除一个节点?
二叉搜索树的删除操作没有那么简单,总共可以分为以下几种情况:
- 删除的节点是叶子节点,直接删除即可。
- 删除的节点只有一个子节点,那么直接将子节点替换到删除节点的位置即可。
- 删除的节点有两个子节点,那么需要找到这个节点的右子树中的最小节点,将这个节点的值替换到删除节点的位置,然后删除这个最小节点即可。
下面是实现的参考代码:
1 | def tranplant(root, u, v): |
6. 结点数量为 $n$ 的二叉树,有多少种不同的结构?
由于不同的二叉树结构决定了递归的顺序问题(出栈和入栈),令 $1$ 表示进栈, $0$ 表示出栈,则可转化为求一个 $2n$ 位、含 $n$ 个 $1$、 $n$ 个 $0$ 的二进制数,满足从左往右扫描到任意一位时,经过的 $0$ 数不多于 $1$ 数。显然含 $n$ 个 $1$ 、 $n$ 个 $0$ 的 $2n$ 位二进制数共有 $\binom{2n}{n}$ 个,下面考虑不满足要求的数目。
假设其中不合法的序列在位置 $2m+1$ 处,此时恰好 $0$ 的数量比 $1$ 多一位,那么必然后面的有 $1$ 的数量比 $0$ 多一位,具体而言, $0$ 有 $n-m-1$ 位, $1$ 有 $n-m$ 位。我们将 $2m+2$ 及之后的序列进行反转,即可得到一个包含了 $n+1$ 个 $0$, $n-1$ 个 $1$ 的序列。注意这是一个双射的过程,即一个不合法的序列经过构造始终得到唯一的一个包含了 $n+1$ 个 $0$, $n-1$ 个 $1$ 的序列,而反过来该序列唯一对应一个不合法的序列。下面证明:
定义映射 $f$ :从不满足条件的 $n$ 个 $1$ 和 $n$ 个 $0$ 的序列到 $n+1$ 个 $0$ 和 $n-1$ 个 $1$ 的序列。
映射 $f$ 的构造:找到第一个违反条件的位置(称为关键位置)将此位置之后的所有 $0$ 变 $1$ , $1$ 变 $0$ 。
证明 $f$ 是单射(一对一):
假设两个不同的不满足条件的序列 A 和 B 映射到同一个序列
- A 和 B 的关键位置必然相同(否则映射结果会不同)
- 如果 A 和 B 在关键位置之前有任何不同,映射后仍然不同
- 如果 A 和 B 在关键位置之后有任何不同,由于0和1互换,映射后仍然不同
因此,不可能有两个不同的序列映射到同一个序列。
证明 $f$ 是满射(映上):
对于任何 $n+1$ 个 $0$ 和 $n-1$ 个 $1$ 的序列 $S$ ,从左到右扫描,必然存在一个位置, $0$ 的数量比 $1$ 的数量多2(因为总共多2个0)。这个位置就是我们寻找的关键位置,
将此位置之后的 $0$ 和 $1$ 互换,得到一个 $n$ 个 $1$ 和 $n$ 个 $0$ 的序列 $T$。 $T$ 在关键位置之前满足条件,在关键位置不满足条件,因此 $T$ 是一个不满足原条件的序列,且 $f(T) = S$ 。
证明 $f$ 的逆映射:
对于任何 $n+1$ 个 $0$ 和 $n-1$ 个 $1$ 的序列,找到 $0$ 比 $1$ 多2的位置(一定存在且唯一)。将此位置之后的 $0$ 和 $1$ 互换,这个过程是上述映射的逆过程。
证毕。
所以合法的序列(也就是二叉树不同结构数量)等于:
$$
\binom{2n}{n} - \binom{2n}{n+1}
$$
也就是卡特兰数,其实卡特兰数还满足以下的性质:
$$
C_0 = 1, C_{n+1} = \sum_{i=0}^{n} C_i C_{n-i}
$$
$C_i$ 可以看成是左子树的数量, $C_{n-i}$ 可以看成是右子树的数量,根据乘法原理即可得到总的数量。
数组经典问题(双指针、滑动窗口、二分)
1. 二分查找如何实现?开区间写法、闭区间写法?
二分查找是在有序数组中进行高效查找的简单算法,而且可以更加广义的使用在单调(非严格、严格)的函数上,于是可以得到算法模板常用的二分答案,其中最重要的事实在于证明计算的结果是具有某种单调性质的。
不同于二分查找的思想,二分查找的实现具有大量的细节。下面主要以开闭区间为依据介绍三种常见的实现。
闭区间的写法是最为经典也是最为常见的实现,其中核心的形式为 $l \le r \le n$ ,其中 $l$ 和 $r$ 分别为左右边界, $n$ 为数组长度。
我们可以定义一个函数 $f(x)$ ,如果 $f(x)$ 为真,则 $x$ 属于右侧合法区间,否则 $x$ 属于不合法区间。
如果区间的中点值 $mid=(l+r)/2$ 满足 $f(mid)$ ,那么更新 $r=mid-1$ ,否则更新 $l=mid+1$ 。
基于此,我们可以观察到两个循环不变量 $[0,l)$ 都是非法的, $(r,n-1]$ 都是合法的,而 $[l,r]$ 是待确定的,那么结束的时候也可以知道 $l$ 或者 $r+1$ 是答案。
1 | # 举一个例子,我们寻找有序数组中第一个大于等于 target 的位置 |
练习题目:在排序数组中查找元素的第一个和最后一个位置
那么基于上述的闭区间的写法,我们可以推导得到等价的开区间写法和左闭右开区间写法。
对于开区间而言,我们的循环不变量就是 $[0,l]$ 都是非法的, $[r,n-1]$ 都是合法的,那么其中的 $(l,r)$ 是不确定的。
1 | # 开区间写法 |
对于左闭右开区间而言,循环不变量就变成了 $[0,l)$ 是非法的, $[r,n-1]$ 都是合法的,那么其中的 $[l,r)$ 是不确定的。
1 | # 左闭右开写法 |
2. 滑动窗口算法与二分答案算法
题目:假设有一个长度为 $n$ 的非负整数的数组,我们需要找到其中和不大于 $sum$ 的最长子数组的长度。
上述题目是最经典的滑动窗口算法和二分答案算法的应用。先讲其中的二分答案算法。
首先我们可以知道非负整数子数组的和总是越长和就越大,不会因为增加了长度反而和变小了。那么假设我们找到了一个长度为 $L$ 的子数组,我们是否可以找到一个大小介于 $[0,L)$ 的子数组呢?显然可以,因为我们只需要不断减少这个子数组的长度即可。因此我们可以知道这个答案是具有单调性质的,可以使用二分的方法加速寻找答案。
1 | # 使用二分答案算法 |
使用了二分答案之后可以很明显感受到一点:这个最长的子数组是不是可以动态维护?比如说对于以 $nums[i]$ 结尾的子数组,我们知道了它的左边界最远为 $left$ ,那么对于以 $nums[i+1]$ 结尾的子数组,它的最远左边界能够是多少呢?因为刚才已经推导过了,对于长度越长的子数组,和会保持不减,所以其左边界最远就是 $left$ ,这可以使用反证法证明,这里就不啰嗦了。因此我们可以使用两个指针维护当前的最大子数组长度,也就是经典的双指针算法。
1 | # 双指针(滑动窗口) |
二分答案经常用来解决一种答案具有单调性质的问题,而根据计算复杂度理论,检查是否成立比求解简单。而滑动窗口算法则是一种全局的优化,本质上是动态规划的思想。二分答案在面试算法题中是一种非常重要的算法。
回溯算法经典问题
回溯算法是一种通过穷举所有可能的解来求解问题的方法,广泛应用于各种经典的数学和计算机科学问题中。在面试中也是比较容易考察到的算法题目类型。而这种算法由于基于搜索,因此有很强的套路,需要熟练掌握。这类题目在思考的过程中可以遵循下面的思考步骤:
- 确定搜索的空间。
- 确定搜素的策略。
- 确定搜素的终止条件。
枚举子集
定义:给定一个集合,求出其所有子集(或者统计其信息)。
子集问题的核心在于每个元素都有两种状态:要么被选入当前子集,要么不被选入。因此,子集问题的规模为 $2^n$ ,即每个元素的选择组合。
练习题目1:17. 电话号码的字母组合
分析一下题目,我们对于其中的每一个数字按键都有多种选择,形式上如果我们知道了按键长度,是可以使用迭代方法获取所有方案的,但是由于我们不知道按键的长度,这个时候就需要回溯算法来实现动态的搜索。
1 | choice = ["", "", "abc", "def", "ghi", "jkl", "mno", "pqrs", "tuv", "wxyz"] |
练习题目2:78. 子集
对于每一个数字我们可以选或者不选,因为每一个元素都是不相同的,所以这保证了所有方案的独立性,不需要去重。
1 | class Solution: |
练习题目3:131. 分割回文串
回溯算法的思路是,对于每一个位置,我们尝试选择或者不选择,如果选择,那么判断是否为回文串,如果不是回文串,那么就直接剪枝。
1 | class Solution: |
解决组合问题
定义:从给定的元素中选取一定数量的元素,求出所有可能的组合。
组合问题的核心在于,每次选择时后面的元素不能再被重新选择,且每个组合的顺序不影响结果。这是区别于排列问题的最为关键的点。
练习题目1:77. 组合
这道题目就是最为经典的组合问题,我们需要在原有的子集问题基础上加多一个选择次数的限制,而利用这些限制,我们可以在原有的简单的搜索策略加上一些启发式的规则,统称为剪枝。
1 | class Solution: |
练习题目2:216. 组合总和 III
这道题目和练习题目1十分类似,但是多出了一个限制,那就是最后选择的元素和要等于一个制定的数字,那么我们就可以将这个限制放在搜索的策略中,并且制定对应的剪枝方法,从而实现高效的搜索。
1 | class Solution: |
解决排列问题
定义:从给定的元素中选取一定数量的元素,使得元素间满足一定的顺序,求出所有可能的排列。
排列问题和组合问题的最大区别在于,排列问题需要考虑元素间的顺序,而组合问题只需要考虑元素是否被选择。
练习题目1:46. 全排列
1 | class Solution: |
这里使用了二进制集合的方法表示了当前的选择的数字以及还没有选择的数字,比如数字nums[i]
就对应了 $s$ 中的第 $i$ 位,0表示已经选择了,否则就表示还没有选择。
练习题目2:51. N 皇后
此题的难点在于检查皇后是否处于同一行、同一列、同一对角线上。我们可以将对角线进行一个哈希编码,从而用于快速判断在某条对角线上是否存在皇后。
1 | class Solution: |
动态规划经典问题
背包问题
背包问题是一类经典的可以使用动态规划解决的问题,它包含大量的变形,对于一般面试而言,只需要掌握其中的01背包和完全背包问题即可。
01背包问题和完全背包问题与以上的回溯算法思想非常类似,主要围绕着选还是不选做规划。对于动态规划的题目,一定要多加练习才能够掌握其中的精髓。
01背包
1. 问题描述
给定 $N$ 件物品和一个容量为 $V$ 的背包。第 $i$ 件物品的费用为 $C_i$ ,价值为 $W_i$ 。每种物品只能选择一次,问如何选择物品使得总价值最大,且总费用不超过背包容量。
2. 动态规划求解
状态定义: 设 $F[i][v]$ 表示前 $i$ 件物品放入容量为 $v$ 的背包时的最大价值。
状态转移方程:
$$F[i][v] = \max(F[i-1][v], F[i-1][v-C_i] + W_i)$$
优化空间复杂度: 可以使用一维数组 $F[v]$ ,并采用逆序遍历来避免覆盖问题。
3. 基础Python代码模板
1 | def knapsack_01(weights, values, V): |
完全背包问题
1. 问题描述
与01背包不同,每种物品可以选择无限次。仍给定 $N$ 件物品和一个容量为 $V$ 的背包,求在总费用不超过背包容量的情况下,如何选择物品使得总价值最大。
2. 动态规划求解
- 状态定义: 设 $F[v]$ 表示容量为 $v$ 的背包可以获得的最大价值。
- 状态转移方程:
$$F[v] = \max(F[v], F[v - C_i] + W_i)$$ - 算法优化: 采用顺序遍历更新 $F[v]$ ,以允许同一物品多次选择。
3. 基础的Python代码模板
1 | def knapsack_complete(weights, values, V): |
递推顺序的问题
可以发现一点,01背包和完全背包的实现代码十分类似,主要不同在于第二层循环的容量枚举顺序。在01背包中,枚举顺序是逆序的而在完全背包中则是顺序的。
为什么这样会可以呢?01背包限定了每一种物品选择的次数只能为1次,我们使用逆序的方法主要是为了首先更新大容量的dp值,保证了当前容量的dp值是仅仅依赖于前面的状态。
在完全背包中,每种物品可以被选取任意次,因此在更新 $F[v]$ 时,需要使用可能已经包含当前物品的状态。顺序遍历 $v$ 可以确保 $F[v - C_i]$ 已经包含了当前物品 $i$ 的选取情况。
更加具体的,如果我们按从 $C_i$ 到 $V$ 的顺序进行遍历,那么 $F[v]$ 的更新过程相当于在考虑“再选一次第 $i$ 种物品”的情况。这种更新方式允许我们在已经选取若干次当前物品的基础上,再次选取,从而得到正确的解。
练习题目
1、目标和
对于每一个数字我们可以选择使用它的正数或者是负数,形式上,我们可以假设将不同的数字放到两个堆里面,相当于是01选择。我们可以假设其中的正数和为 $sp$ ,然后其中的负数的绝对值和为 $sn$ ,那么就有:
$$
sp - sn = target
$$
由于 $sp + sn = s$ , $s$ 是数组的和,就可以得到:
$$
\begin{align}
s - sn - sn &= target \
s - target &= 2 * sn \
\end{align}
$$
因此我们可以得到其中的 $sn = (s-target)/2$ ,这是一个固定的值,那么问题就转换为了从一堆数字中选取和恰好为 $sn$ 的方案数,这是一个经典的01背包题目。
参考代码:
1 | class Solution: |
2、分割等和子集
此题和上面的题目非常类似,读者可以自己体会。
参考代码:
1 | class Solution: |
这道题目中的dp值只包含了0或者1,所以可以使用bitset优化。对于位置 $j$ 而言, 每一次 $dp[j]$ 都是或上了前面的 $nums[i]$ 位置上的数字 $dp[j-nums[i]]$ 而已。
因此我们可以将整个数组看成是一个bitset去优化,并行计算所有的位置。
1 | class Solution: |
3、零钱兑换 I
本题就是最为经典的完全背包问题。
参考代码:
1 | inf = 0x3f3f3f3f |
4、零钱兑换 II
这道题目和上题有所区别,这道题目更加关注的是不同的方案数量,但是也是属于完全背包的问题范畴,不过最优化目标函数变化了。
1 | class Solution: |
区间DP
区间DP是一种特殊的动态规划方法,主要用于解决一种区间子结构的线性DP问题,严格来说也属于下面的序列DP。其特点是:
- 状态定义:通常定义 $dp[i][j]$ 表示闭区间 $[i,j]$ 上的最优解
- 区间长度:一般从小区间逐渐扩展到大区间
- 状态转移:通常需要在区间内枚举分割点 $k$
对于区间DP,有三种很常见的状态转移模式:
- 合并模式: $dp[i][j] = \min/\max(dp[i][k] + dp[k+1][j]) + cost$
- 首尾关联: $dp[i][j] = dp[i+1][j-1] + f(i,j)$
- 区间扩展: $dp[i][j] = dp[i][j-1]$ 或 $dp[i+1][j] + f(i,j)$
其中, $f(i,j)$ 表示了我们需要自定义的处理或者代价函数。
练习题目
1、最长回文子串
这个问题的动态规划转移方程确实属于你提到的第二种常见的区间 DP 转移模式,即 $dp[i][j]$ 的计算依赖于其内部的子区间的 DP 值。
具体的转移方程如下:
基本情况 (Base Cases):
- 长度为 1 的子串: 任何单个字符都是回文。所以,对于所有的 $i$, $dp[i][i] = \text{true}$。
- 长度为 2 的子串: 子串 $s[i \dots i+1]$ 是回文当且仅当 $s[i]$ 和 $s[i+1]$ 相等。所以,$dp[i][i+1] = (s[i] == s[i+1])$。
递推关系 (Transition):
- 考虑长度大于 2 的子串 $s[i \dots j]$。它是一个回文子串当且仅当:
- 它的首尾字符相等,即 $s[i] == s[j]$。
- 去掉首尾字符后剩下的子串 $s[i+1 \dots j-1]$ 也是一个回文子串。
- 所以,对于 $j > i+1$(即子串长度大于 2),转移方程为:
$$ dp[i][j] = (s[i] == s[j]) \land dp[i+1][j-1] $$
这里的 $\land$ 表示逻辑与 (AND)。
- 考虑长度大于 2 的子串 $s[i \dots j]$。它是一个回文子串当且仅当:
DP 的计算顺序:
由于 $dp[i][j]$ 依赖于 $dp[i+1][j-1]$(一个更短的子串),我们需要先计算短子串的 DP 值,再计算长子串的。因此,典型的计算顺序是按照子串的长度 (length) 从小到大进行迭代:
- 长度 $L = 1$: 计算所有的 $dp[i][i]$。
- 长度 $L = 2$: 计算所有的 $dp[i][i+1]$。
- 长度 $L = 3, 4, \dots, n$: 对于每个长度 $L$,遍历所有可能的起始索引 $i$(从 0 到 $n-L$),计算 $j = i+L-1$,然后使用转移方程 $dp[i][j] = (s[i] == s[j]) \land dp[i+1][j-1]$ 来计算 $dp[i][j]$。
为什么是“第二种常见模式”?
常见的区间 DP 模式通常有两种:
- 依赖于区间分裂点: $dp[i][j]$ 的计算需要枚举一个分裂点 $k$ ($i \le k < j$),然后结合 $dp[i][k]$ 和 $dp[k+1][j]$ 的结果。例如,矩阵链乘法、最优二叉搜索树等。
- 依赖于内部子区间: $dp[i][j]$ 的计算依赖于去掉首尾或只去掉一端的子区间的 DP 值,例如 $dp[i+1][j-1]$、$dp[i+1][j]$ 或 $dp[i][j-1]$。最长回文子串(依赖 $dp[i+1][j-1]$)、一些字符串匹配问题(如编辑距离的变种)等属于此类。
最长回文子串的 DP 转移方程 $dp[i][j] = (s[i] == s[j]) \land dp[i+1][j-1]$ 正是依赖于去掉首尾字符后的内部子区间 $s[i+1 \dots j-1]$ 的 DP 值 $dp[i+1][j-1]$,因此符合第二种模式。
在填充完整个 $dp$ 表后,你需要遍历所有的 $dp[i][j]$,找到所有值为 true 的项,并记录其中 $j-i+1$(子串长度)最大的那个子串,它就是最长的回文子串。
1 | class Solution: |
3、数字1的个数
给定一个整数 $n$ ,计算所有小于等于 $n$ 的非负整数中数字 $1$ 出现的个数。
这道题目属于比较复杂的计数DP类型,也称数位DP。这种类型的题目一般来说都具备类似的套路,且通常形式为求解在一个具体的限制区间中的满足某种性质的数字的个数。
这种性质通常来说和数位有关系。比如上题,我们需要求解所有数字中的1出现的具体的次数,这就是很经典的数位DP的出现形式。
通常我们使用记忆化搜索实现数位DP的动态规划求解而不是使用递推的方法,因为记忆化搜索非常灵活,相对来说,递推实现难度较大。
在记忆化搜索的时候,我们脑海中应该想象着填数字的过程,而且通常来说我们需要关注以下的一些变量:
is_num
,表示当前位置下,前面是否已经填了任何一个大于0的数字。(因为不能包含前导零)is_limit
,表示当前位置下,能够填的数字是9还是对应的一个上限。
1 | class Solution: |
基础数据结构经典问题(链表、队列、栈)
栈
栈是一种后进先出(LIFO)的数据结构,只能在一端(栈顶)进行操作。主要操作包括:
push
: 将元素添加到栈顶pop
: 移除栈顶元素peek/top
: 查看栈顶元素但不移除
栈在递归、表达式求值、括号匹配等场景中应用广泛,而且属于面试中经常考察的内容,对思考的要求偏高,需要深刻理解掌握经典的问题以及变式问题。下面主要介绍栈的经典运用题目和单调栈的应用题目。
1、有效的括号
这是一道十分经典的栈的运用题目,但是思维很深刻。建模上,我们将左括号看作是进栈,右括号看作是出栈,那么理论上所有的合法的有效括号序列都可以唯一对应一个出进栈的操作序列。
1 | class Solution: |
在Python语言中没有像java, cpp这些语言拥有内置的栈的数据结构,但是我们可以使用一个列表来模拟栈的行为,由于栈每一次都是操作最后面的一个元素,所以性能上可以得到保证。
2、最长有效括号
此题是上题的强化版本,思维难度高了很多。简单来讲,此题需要在不合法的括号序列中找到最长的合法的括号子串,也就意味着找到的合法子串一定也可以唯一对应一个栈的操作序列,由于我们需要找到的是子串,这说明所有合法的括号子串在原来的括号序列中是一段一段的形式。
比方说我们有这个字符串:(()())))()()(()))((())
,可以看到其中的合法括号子串有:
(()())
()()(())
(())
从上面的结果来看,我们首先可以使用一个栈将所有的合法的括号位置标记出来,然后在从左到右遍历即可。
1 | class Solution: |