引入

总体思路

此类问题一般是寻找最优解，但由于最终的最优解取决于前面一系列的决策，局部最优不一定能导出整体最优，所以贪心的思想对此种问题束手无策。所以需要从最简单的小问题开始，逐步扩展，最终扩展到我们需要的地方为止。这里的扩展就是决策，就是状态转移。根据动态规划解题步骤（问题抽象化、建立模型、寻找约束条件、判断是否满足最优性原理、找大问题与小问题的递推关系式、填表、寻找解组成）找出问题的最优解以及解组成，然后编写代码实现。

动态规划的原理

动态规划与分治法类似，都是把大问题拆分成小问题，通过寻找大问题与小问题的递推关系，解决一个个小问题，最终达到解决原问题的效果。但不同的是，分治法在子问题和子子问题等上被重复计算了很多次，而动态规划则具有记忆性，通过填写表把所有已经解决的子问题答案纪录下来，在新问题里需要用到的子问题可以直接提取，避免了重复计算，从而节约了时间，所以在问题满足最优性原理之后，用动态规划解决问题的核心就在于填表，表填写完毕，最优解也就找到。

最优性原理是动态规划的基础，最优性原理是指“多阶段决策过程的最优决策序列具有这样的性质：不论初始状态和初始决策如何，对于前面决策所造成的某一状态而言，其后各阶段的决策序列必须构成最优策略”。

01背包

问题描述

有n个物品，它们有各自的体积和价值，现有给定容量的背包，如何让背包里装入的物品具有最大的价值总和？

算法思想

在解决问题之前，为描述方便，首先定义一些变量：Vi表示第 i 个物品的价值，Wi表示第 i 个物品的体积，定义V(i,j)：当前背包容量 j，前 i 个物品最佳组合对应的价值，同时背包问题抽象化（X1，X2，…，Xn，其中 Xi 取0或1，表示第 i 个物品选或不选）。

1、建立模型，即求max(V1X1+V2X2+…+VnXn)；

2、寻找约束条件，W1X1+W2X2+…+WnXn<capacity；

3、寻找递推关系式，面对当前商品有两种可能性：

（1）包的容量比该商品体积小，装不下，此时的价值与前i-1个的价值是一样的，即V(i,j)=V(i-1,j)；
（2）还有足够的容量可以装该商品，但装了也不一定达到当前最优价值，所以在装与不装之间选择最优的一个，即V(i,j)=max｛V(i-1,j)，V(i-1,j-w(i))+v(i)｝。
其中V(i-1,j)表示不装，V(i-1,j-w(i))+v(i) 表示装了第i个商品，背包容量减少w(i)，但价值增加了v(i)；

由此可以得出递推关系式：

j<w(i) V(i,j)=V(i-1,j)
j>=w(i) V(i,j)=max｛V(i-1,j)，V(i-1,j-w(i))+v(i)｝

这里需要解释一下，为什么能装的情况下，需要这样求解（这才是本问题的关键所在！）：

可以这么理解，如果要到达V(i,j)这一个状态有几种方式？

肯定是两种，第一种是第i件商品没有装进去，第二种是第i件商品装进去了。没有装进去很好理解，就是V(i-1,j)；装进去了怎么理解呢？如果装进去第i件商品，那么装入之前是什么状态，肯定是V(i-1,j-w(i))。由于最优性原理，V(i-1,j-w(i))就是前面决策造成的一种状态，后面的决策就要构成最优策略。两种情况进行比较，得出最优。

举个例子：

物品数量：4；背包容量：8

i（物品编号）	1	2	3	4
w（体积）	2	3	4	5
v（价值）	3	4	5	6

规划完的表格如下：

i/j	2	3	4	5	6	7	8
0	0	0	0	0	0	0	0
1	3	3	3	3	3	3	3
2	3	4	4	7	7	7	7
3	3	4	5	7	8	9	9
4	3	4	5	7	8	9	10

参考链接：【动态规划】01背包问题（通俗易懂，超基础讲解）_Yngz_Miao的博客-CSDN博客_动态规划解决01背包问题

最优解回溯

通过上面的方法可以求出背包问题的最优解，但还不知道这个最优解由哪些商品组成，故要根据最优解回溯找出解的组成，根据填表的原理可以有如下的寻解方式：

V(i,j)=V(i-1,j)时，说明没有选择第i 个商品，则回到V(i-1,j)；
V(i,j)=V(i-1,j-w(i))+v(i)时，说明装了第i个商品，该商品是最优解组成的一部分，随后我们得回到装该商品之前，即回到V(i-1,j-w(i))；
一直遍历到i＝0结束为止，所有解的组成都会找到。

就拿上面的例子来说吧：

最优解为V(4,8)=10，而V(4,8)!=V(3,8)却有V(4,8)=V(3,8-w(4))+v(4)=V(3,3)+6=4+6=10，所以第4件商品被选中，并且回到V(3,8-w(4))=V(3,3)；
有V(3,3)=V(2,3)=4，所以第3件商品没被选择，回到V(2,3)；
而V(2,3)!=V(1,3)却有V(2,3)=V(1,3-w(2))+v(2)=V(1,0)+4=0+4=4，所以第2件商品被选中，并且回到V(1,3-w(2))=V(1,0)；
有V(1,0)=V(0,0)=0，所以第1件商品没被选择。

代码实现

输入格式：

第一行两个整数n，m表示物品数量及背包容量
接下来n行每行两个整数wi和vi，分别表示第i个物品的体积和价值
要求输出一个整数表示最大价值总和

样例输入：
4 8
2 3
3 4
4 5
5 6

样例输出：
10

c++实现：

#include <iostream>
#include <algorithm>

using namespace std;

const int MAX = 1001;
int dp[MAX][MAX]; //dp[i][j]表示当前容量为j，前i个物品最佳组合对应的价值
int w[MAX];       //用于保存体积的数组
int v[MAX];       //用于保存价值的数组

void findWhat(int n, int j)
{
    int *item = new int[n + 1]; //保存最优解,0表示不拿，1表示拿
    for (int i = n; i >= 0; i--)
    {
        if (dp[i][j] == dp[i - 1][j])
            item[i] = 0; //和i-1的时候相等，说明第i个物品没拿
        else
        {
            item[i] = 1;
            j -= w[i]; //拿了第i个物品，那么容量得回到拿之前的状态，也就是要减去w[i]
        }
    }
    for (int i = 1; i <= n; i++)
        cout << item[i] << " ";
    cout << endl;
}

int main()
{
    int n, m;
    cin >> n >> m;
    //输入体积和价值
    for (int i = 1; i <= n; i++)
        cin >> w[i] >> v[i];
    //设置边界
    for (int i = 0; i <= n; i++)
        dp[i][0] = 0;
    for (int i = 0; i <= m; i++)
        dp[0][i] = 0;
    //开始动规
    for (int i = 1; i <= n; i++)
    {
        for (int j = 1; j <= m; j++)
        {
            if (j < w[i])
                dp[i][j] = dp[i - 1][j]; //装不下第i个物品，那么价值还是等于前面的dp[i-1][j]
            else
                dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - w[i]] + v[i]); //装的下第i个物品，那么既可以拿这个物品，也可以不拿，所以在这两种情况下选一个价值最大的
        }
    }
    cout << dp[n][m] << endl;

    // findWhat(n, m);//输出最优解
    return 0;
}

空间优化

两重for循环是跑不掉的，也就是时间复杂度已经没办法优化了。不过空间复杂度还有极大的优化空间。

观察下面01背包的核心代码：

for (int i = 1; i <= n; i++)
{
    for (int j = 1; j <= m; j++)
    {
        if (j < w[i])
            dp[i][j] = dp[i - 1][j]; 
        else
            dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - w[i]] + v[i]); 
    }
}

我们可以发现dp这个二维数组自始至终我们只用到了第i行和第i-1行。所以有一种朴素的想法就是dp可以压缩至两行，状态转移需要用到的空间只要在这两行之间反复横跳就行。

不过，这里我们要说的是可以优化到一维数组。再回到代码，我们可以发现j<w[i]时，我们只是把dp[i-1][j]的数据照搬了过来，其实并没有什么操作，如果用一维数组来刻画的话就是：现在这个一维数组里存的相当于是i-1行的数据，然后我们要转变为第i行还是存在这个数组里，j<w[i]时就相当于保留原数据。

再看else情况下，由于i-1行的数据也在这个一维数组里，所以我们可以直接删去i那一维，写成这样：

dp[j] = max(dp[j], dp[j - w[i]] + v[i]);

有一点需要注意，dp[j-w[i]]需要用到数组里前面的数据，如果我们从前往后遍历的话，显然前面的数据被更新后才被后面使用，而我们需要的原数据就被覆盖没了，这不符合我们初衷，所以我们需要从后往前遍历。

优化后的核心代码如下：

for (int i = 1; i <= n; i++)
{
    for (int j = m; j >= 0; j--)
    {
        if (j >= w[i])
            dp[j] = max(dp[j], dp[j - w[i]] + v[i]);
    }
}

我们再仔细分析一下这个代码，j>=w[i]时才需要操作，j<w[i]时不需要操作。j表示的是背包容量，当j过小时，对于第i件物品来说肯定是放不下的，根本没有我们选择放不放的余地。而且j遍历到0，对于dp[j - w[i]]是会发生越界的。所以我们完全可以直接遍历到w[i]，并且由于是从大到小遍历，j肯定不小于w[i]，那个if判断也可以拿掉。

最终优化版核心代码如下：

for (int i = 1; i <= n; i++)
{
    for (int j = m; j >= w[i]; j--)
        dp[j] = max(dp[j], dp[j - w[i]] + v[i]);
}

空间优化后的01背包是没办法进行最优解回溯的，因为历史数据我们都没有保留。所以，如果要进行最优解回溯的话，还是需要用二维数组来保存数据。

优化后完整版代码：

#include <iostream>
#include <algorithm>

using namespace std;

const int MAX = 1001;
int dp[MAX]; //dp[j]表示当前容量为j，前i个物品最佳组合对应的价值，i是隐含的
int w[MAX];  //用于保存体积的数组
int v[MAX];  //用于保存价值的数组

int main()
{
    int n, m;
    cin >> n >> m;
    //输入体积和价值
    for (int i = 1; i <= n; i++)
        cin >> w[i] >> v[i];
    //设置边界
    for (int i = 0; i <= m; i++)
        dp[i] = 0;
    //开始动规
    for (int i = 1; i <= n; i++)
    {
        for (int j = m; j >= w[i]; j--)
            dp[j] = max(dp[j], dp[j - w[i]] + v[i]);
    }
    cout << dp[m] << endl;
    return 0;
}