CSPJ 教学思考:动态规划
引言
动态规划是 CSPJ 拉分的关键知识点。
之所以这样,是因为动态规划不像 DFS、BFS、二分那样有固定的模版格式。学生要在动态规划问题上融汇贯通,需要花费大量的练习,也需要足够的聪明。
笔者自己在高中阶段,也是在动态规划问题上困扰许久。我自己的学习经验是:动态规划还是需要多练,练够 100 道题目,才能够熟悉动态规划的各种变型。之后在比赛中看到新的题目,才会有点似曾相识的感觉,进一步思考出状态转移方程。
所以,我打算写 100 道动态规划方程的题解,希望有志攻破此难关的学生和家长一起加油!
动态规划解题的核心问题
虽然动态规划没有模版可以套,但是动态规划有三个核心问题:
- 状态的定义
- 状态转移方程
- 初始状态的设置
一般思考动态规划就是思考以上三个问题,这三个问题解决了,动态规划的程序也可以写出来了。
教学题目
推荐的教学题目如下:
题目名 | 说明 |
---|---|
P2842 纸币问题 1 | 基础 DP,记忆化搜索 |
P1216 数字三角形 | 基础 DP,记忆化搜索 |
P2840 纸币问题 2 | 基础 DP |
P2834 纸币问题 3 | 基础 DP,有多处可优化的点 |
P1048 采药 | NOIP2005 普及组第三题。01 背包问题。 |
P2196 挖地雷 | NOIP1996 提高组第三题。涉及输出路径技巧。 |
P1434 滑雪 | 上海市省队选拔 2002 |
例题代码
P2842 纸币问题 1
此题可以带着孩子一步步推导和演进。具体步骤如下。
先引导孩子用最暴力的 DFS 的方式来做此题,建立基础的解题框架,虽然会超时,但是也帮助我们后面引导孩子学会记忆化搜索。代码如下:
/** |
有了上面的代码,通过分析,发现大部分的超时是因为有重复的计算过程。以下是一个以 10,5,1 为例的示意:
所以,我们可以将重复计算的过程保存下来,以后再次需要计算的时候,直接读取保存的结果即可。在此思想下,我们只需要在上面改动三行,即可将超时的程序改为通过。具体代码如下:
/** |
有了以上两段代码的尝试,我们能够发现:
- dfs(pt) 只与 dfs( 0 ~ pt-1) 有关,与 dfs(pt+1~w)无关。
- 如果我们知道了 dfs(0~pt),就可以推出 dfs(pt+1)
那么,我们就可以思考,如果我们用 dp[i] 来表示钱币总额为 i 的结果数。那么,dp[i] 的计算过程(即:状态转移方程)为:dp[i] = min( dp[i-v[j]] )+1
,其中j=0~N
。
这样,我们就可以引导学生写出第一个动态规划程序。
/** |
P1216 数字三角形
P1216 数字三角形同样可以用记忆化搜索引入。先写记忆化搜索的代码有助于我们理解动态规划的状态转移方程。
搜索的代码为:
/** |
由搜索代码可知,每一个位置的最价结果由它下面两个结点的最价结果构成。于是,我们可以构造出状态转移方程:dp[i][j] = v[i][j] + max(dp[i+1][j], dp[i+1][j+1])
另外,我们可以引导学生:上层的依赖于下层的数据,那应该怎么推导呢?让学生想到用倒着 for 循环的方式来从下往上推导。
最后,我们再引导学生构建一下初始值。由此,我们建立起动态规划解题的三个核心问题:
- 状态的定义
- 状态转移方程
- 初始状态的设置
/** |
P2840 纸币问题 2
状态转移方程为:dp[i] = sum(dp[i- v[j]]), j = 0~N
,结果需要每次模 1000000007。
#include <bits/stdc++.h> |
P2834 纸币问题 3
此题不能像之前的题目那样,用金钱数为阶段。因为此题是计算的组合数,所以 1,5 和 5,1 是一种答案。如果以金钱数为阶段,就无法方便将这种重复计算的排除掉。
那么,以什么为阶段,可以保证每个阶段可以基于过去的阶段推导出来?可以用不同的钱币种类为阶段!
接下来就是思考这种情况下的状态转移方程。可以得出,状态转移方程如下:
-
dp[i][j]
表示用前 i 种钱币组成金额 j 的组合数 dp[i][j] = dp[i-1][j-v[i]] + dp[i-1][j - v[i]*2] + …. dp[i-1][j-v[i]*n]; (j >= v[i]*n)
- 初始状态:
dp[1][0] = 1; dp[1][v[1]] = 1; dp[1][v[1]*2] = 1;
参考程序如下:
#include <bits/stdc++.h> |
此题还有另外一种状态转移方程,把阶段分为没有用过 a,和至少用过一张 a。
这样的话,状态转移方程优化为:dp[i][j] = dp[i-1][j] + dp[i][j-v[i]]
这样,代码的复杂度进一步降低,代码如下:
#include <bits/stdc++.h> |
此题还可以进一步简化,因为 dp[i] 那一层算完之后 dp[i-1] 层就没有用了。有没有可能我们将 dp[i]层和 dp[i-1]都合并在一起呢?
答案是可以的。我们可以将关键代码进一步简化如下,把 dp 改成一个一维数组。状态转移方程变为了:dp[j] = dp[j] + dp[j-v[i]]
#include <bits/stdc++.h> |
P1048 采药
P1048 采药这题是经典的 01 背包问题。为了方便教学,我们还是从最简单的动态规划思路开始推导。
我们把每个草药是一个阶段,这样:
-
dp[i][j]
表示前 i 个草药,花费 j 时间可以得到的最大价值 - 状态转移方程为:
dp[i][j] = max(dp[i-1][j], dp[i-1][j-v[i]])
这样写出来的参考程序如下:
/** |
与上一题一样,通过分析,我们发现 dp[i][j] 中的 i 一层可以优化掉,变成只有 dp[j]。
这样,状态转移方程被优化成:dp[j]=max(dp[j],dp[j-t[i]]+v[i])
。
但是,因为每一个草药只能用一次,如果我们正着循环 j 的话,会出现多次使用第 i 个草药的情况。所以,我们倒着进行递推,就可以避免这种情况。
最终实现的代码如下:
/** |
P2196 挖地雷
P2196 挖地雷 是 NOIP1996 提高组第三题。这道题的解法有点类似于P1216 数字三角形。
但是,这道题更难的是:它需要我们输出路径。
我们先说状态转移方程:
- dp[i] 表示第 i 个地窖能够挖到的最多地雷数。
- w[i] 表示第 i 个地窖的地雷数。
- 转移方程:
dp[i] = max(dp[i+1~N]中能够与 dp[i] 连通的地窖) + w[i]
与dp[i] = w[i]
中的较大者。
我们再说说如何输出路径。因为计算之后 dp 数组中保存了每个结点能够挖的最大地雷数。所以,我们从答案 dp[ans]开始,找哪一个地窖与当前相连,同时值又等于 dp[ans] - w[ans],则表示那个地窖是下一个点。
参数代码:
#include <bits/stdc++.h> |
P1434 滑雪
这道题的麻烦点是如何定义状态转移的阶段,因为没有明显的阶段。
可以考虑的办法是:将点按高度排序,这样从高度低的点开始,往高的点做状态转移。
所以:
- 定义:dp[i][j] 表示从 (i,j) 这个位置开始滑的最长坡。
- 转移方程:
dp[x][y] = max(dp[x'][y'])+1
-
dp[x'][y']
为上下左右相邻并且高度更低的点
- 初始化:无
#include <bits/stdc++.h> |
此题更容易想到的写法还是记忆化搜索:对每一个点作为开始点进行一次 DFS,同时在进行递归调用的时候,如果当前点处理过,则返回上次的结果。
参考代码如下:
/** |