学而知之

从头编写 Skip-Gram Word2Vec

2024-12-13T17:06:46.000Z

摘要

本文介绍了 Word2Vec 的相关背景知识，以及背后的数学原理，并通过 Python源码实现 Skip-Gram 以及负采样方法。本文并不会涉及 Word2Vec的所有方面，而是从 Skip-Gram 入手，关注 Word2Vec最核心的思想，从头开始实现一个精简版的 Skip-Gram Word2Vec。对于算法的优化本文只会略微提及，感兴趣的读者可以自行阅读相关文献，或者原版的Word2Vec 源码。

背景

Word2Vec 是谷歌出品，自发布以引起了广泛的关注，论文引用次数已经达到了4 万多次。第一篇论文 Efficient Estimation of word Representationsin vector Space 对比了多种模型，并且引入了 CBOW 和 Skip-Gram 2 种Word2Vec 模型。 Word2Vec模型和神经网络模型相比，最大的优势加速了计算，据论文描述，单台机器每天可以训练1000 亿个单次。而且通过对比发现 Skip-Gram 模型在语义理解方面表现要比CBOW 更好。第二篇论文 Distributed Representations of Words andPhrases and their Compositionality 重点介绍的也是 Skip-Gram模型，提出了层次 SoftMax 以及负采样和 SubSample 优化方法。本文将只关注Skip-Gram 和负采样，并用 Python 源码实现该功能。

单词的表示

首先分析一下，不使用Word2Vec，直接使用神经网络训练词向量的方法以及问题。通常单词使用字符串表示，但神经网络只能接收浮点型向量，不能接收字符串，所以得换一种表示方式。一种简单的方式是使用 One-Hot 编码，这种方式可以把单词表示为向量。具体的做法是，先构建一个词表，词表的大小就是向量的长度，用将单词在词表的下标位置设置为1，其他位置设置为 0。比如词表大小为 6，构建的词表为[the, dog, is, walking, in, park] 对于第一个单词dog 的 One-Hot 编码为 $[0, 1, 0,0, 0, 0]$ 。第二个单词 is 的 One-Hot 编码为 $[0, 0, 1, 0, 0, 0]$ 。

网络结构

这里以最简单的例子说明：只考虑连续的 2 个单词，输入为第一个单词的One-Hot 表示，输出为第二个单词的 One-Hot 概率分布，构建一个 3层的神经网络。仍以上面的词表为例，那么输入和输出的 One-Hot 向量长度就是$6$, 隐藏层的个数为 $2$，同时隐藏层不使用激活函数，只在最终的输出层后面使用SoftMax 激活，生成输出词的 One-Hot 概率分布。损失函数使用神经网络的输出和真实词 One-Hot 编码的 CrossEntropy。

可能有人要产生疑问了，既然隐藏层没有激活函数，实际上第三层的 $\mathbf{y}$ 直接就相当于对输入层 ${\mathbf{x}}$做线性变换，隐藏层还有什么存在的必要呢？

\[\mathbf{y=b \cdot W = (x \cdot V) \cdot W = x \cdot (V \cdot W)}\]

实际上 Word2Vec 就是要训练隐藏层，把隐藏层的输出 $\mathbf{b}$当作单词的向量表示，可以理解为其实就是在做矩阵分解。

时间复杂度分析

假设词表大小为 $N$，隐藏层大小为$B$。那么输入词向量长度为 $N$；矩阵 $\mathbf{V}$ 的大小为 $N \times B$，即 $N$ 行 $B$ 列；矩阵 $\mathbf{W}$ 的大小为 $B \times N$, 即 $B$ 行, $N$ 列。

第一层是输入，无需计算。

第二层的计算 $\mathbf{b = x \cdotV}$ ，对于常规的矩阵计算，时间复杂度为 $N \times B$，由于输入向量是 One-Hot编码，相当于直接从 $\mathbf{V}$中取出第 $k$ 行，时间复杂度为 $O(1)$。

第三层的计算 $\mathbf{y = b \cdotW}$，由于 $\mathbf{b}$ 和$\mathbf{W}$都是稠密向量，无法优化，计算的时间复杂度为 $B\times N$。

可以发现第一层和第二层的计算开销可忽略不计，最关键的是第三层的计算开销。如果词表大小达到百万量级，隐藏层达到 $1000$维的话，单是训练一个单词，计算量就达到了 $10^3 \times 10^6 =10^9$，而语料库中的单词可能达到数十亿以上。这种时间复杂度对于训练整个语料库几乎是不可行的，需要进行优化。

在 Word2Vec 中，提到了 2 种优化的方法：层次化 SoftMax 和负采样。由于层次化 SoftMax实现起来更加复杂，而且优化效果也不如负采样，本文重点儿阐述负采样方法。

层次化 SoftMax

层次化 SoftMax方法构建了一颗哈夫曼树，在训练的过程中使用贪心方式沿着二叉树路径从上到下做二分类，最终遍历到叶子节点，也就是概率最大的词。该方法可以将时间复杂度降低为 $B \timeslog(N)$。

负采样

使用负采样方法时，神经网络的输入为一个词的 One-Hot编码，输出层不再使用 SoftMax，而是使用 Sigmoid 做二分类。仍然以上面的词表为例，假设有这样一条样本：第一个词为dog，第二个词为is，把在原始训练中的样本称为正样本。由于 dog在词表中的下标为 $1$，那么神经网络的输入就是向量 $[0,1,0,0,0,0]$；is在词表中的下标为 $2$，在训练的时候，在输出层只计算 $z_2 = Sigmoid(y_2)$，把 $z_2$ 的当成是输出为 is的概率。我们希望 $z_2$ 尽可能的接近$1$，损失函数为 $z_2$ 和 $1$ 的 CrossEntropy。

如此一来，训练的开销会大大降低，但是也丢失了一些信息，需要加入一些负样本。负样本的生成方法是随机生成，原始的 Word2Vec方法是按照词频的概率生成负样本，本文为了简单起见，使用的是均匀分布生成负样本。比如对于第一个词 dog，随机生成的下一个词是park，把这条训练数据当作负样本。由于 park在词表的下标为 $5$，神经网络在输出层只计算 $z_5=Sigmoid(y_5)$，把 $z_5$ 的当成是输出为 park的概率。由于是负样本，我们希望 $z_5$尽可能的接近 $0$，损失函数为 $z_5$ 和 $0$ 的 CrossEntropy。

对于每条正样本，同时构造生成 $K$条负样本，对于每条训练样本，第三层的时间复杂度为 $O(K \times B)$，这里 $K$ 是超参数。 $K$ 可以取 $10$ 左右，而 $B$ 取到 $1000$也足够了，训练一个单词的开销比原始的方法下降了好几个数量级，更具备可操作性。谷歌的论文提到单台机器每天可训练千亿个词。

Skip-Gram

前面的介绍只是为了便于理解，简化后的场景。实际上 Skip-Gram的做法是：给定一个单词，需要预测其周围 $2\times c$ 个单词的概率，即这个单词之前的 $c$ 个词以及之后的 $c$个词，而且不考虑单词之间的顺序，以及单词和中心词的距离。假设语料库中有一句话是the dog is walking in the park，当前中心词是is，$c$ 等于2，那么就有三条正样本：

(is, the)
(is, dog)
(is, walking)
(is, in)

以下开始实战部分，通过 Python 代码以及 numpy 库实现一个简化版的Word2Vec。

数据准备

这里的数据集使用原版的 Word2Vec 用到的数据集。

1 2	wget http://mattmahoney.net/dc/text8.zip -O text8.gz gzip -d text8.gz -f

语料库解析

语料库中就是一个接一个的单词，但是这个语料库中没有句子的分隔符。以下代码把它们当成一句话来处理了。为了便于测试，可以在解析时支持指定最大的单词个数，本例中指定单词个数为10000。在解析时需要将单词转换为整数，这个整数就是单词在词表中的下标。比如语料库为：the dog is walking in the park，词表为：[the, dog, is, walking, in, park]，输出的Tokens 为 [0, 1, 2, 3, 4, 0, 5]

#!/usr/bin/env python
#-*- coding:utf-8 -*-

max_words_size = 10000
data_map = {}

def read_tokens():
    tokens = []
    with open('text8') as f:
        content = f.read()
        word = []
        for i in range(0, len(content)):
            if content[i].isspace():
                if len(word) > 0:
                    k = ''.join(word)
                    if k in data_map:
                        v = data_map[k]
                    else:
                        v = len(data_map)
                        data_map[k] = v
                    tokens.append(v) # 将单词作为 Token
                    word = []
            else:
                word.append(content[i])
            # 最大读取单词个数为 max_words_size
            if len(tokens) >= max_words_size:
                break
    return tokens

构建训练正样本

首先枚举每一个单词作为中心词，然后再枚举周围词，作为正样本。

def get_skip_gram_pairs(tokens, window):
    pairs = []
    for i in range(len(tokens)): # 枚举中心词
        for j in range(max(0, i - window), min(len(tokens), i + window + 1)): # 枚举周围词
            if j == i:
                continue
            # 添加元组（中心词_id，周围词_id）
            pairs.append((tokens[i], tokens[j]))
    return pairs

梯度更新

这里没有使用机器学习框架，也没有自动微分功能，需要推导梯度更新公式。损失函数为 $\sigma(y)$ 和真实值之间的CrossEntropy。 \[ L = −[label*log(\sigma(y))+(1−label)log(1−\sigma(y))]\]

其中 $\displaystyle \sigma(y) =\frac{1}{1+e^{-y}}$，$\displaystyle\frac{\mathrm{d}}{\mathrm{d} y} log(\sigma(y)) =1-\sigma(y)$，$label$的取值只能是 $0$ 或者 $1$。

当 $label$ 取值为 $1$ 时： \[\begin{align}L_+ &= -\log(\sigma(y)) \\\frac{\partial L_+}{\partial y} &= \sigma(y) - 1 \\\end{align}\] 当 $label$ 取值为 $0$ 时： \[\begin{align}L_- &= -\log[1 - \sigma(y)] \\\frac{\partial L_-}{\partial y} &= \sigma(y) - 0 \\\end{align}\] 综合起来，可以得到输出层的梯度公式： \[\begin{align}\frac{\partial L}{\partial y} &= \sigma(y) - label \\\end{align}\] 而之前层的网络参数，可以通过反向传播算法更新梯度计算。

模型训练

这里使用随机梯度下降以及反向传播训练模型。需要定义 $2$ 个变量 $embed\_in$ 和 $embed\_out$来存储网络模型参数，分别对应之前介绍的矩阵 $V$ 和矩阵 $W$。输入为中心词的下标假设为 $s$，当前预测的周围词下标为 $t$。第二层的输出直接就是 $embed\_in[s]$，第三层的输出为 $y = embed\_in[s] \cdot embed\_out[t]$

import numpy as np
import math
import random

hidden_dim = 4
vocab_size = 0
embed_in = None
embed_out = None

def soft_max(x):
    return 1.0 / (1 + math.exp(-x))

def train(pairs):
    learning_rate = 1e-4
    for epoch in range(3):
        for p in pairs:
            # 第一个为正样本，之后的是构造的负样本
            examples = [(1, p[1])]
            # 这里写死构造 8 个负样本
            for i in range(8):
                j = random.randrange(0, vocab_size) # 随机选一个词当负样本
                while j == p[1]: # 由于 p[1] 是正样本，随机选其他词
                    j = random.randrange(0, vocab_size)
                examples.append((0, j))
            # 遍历样本，使用梯度下降更新参数值
            for examp in examples:
                label = examp[0] # label 为 1 表示当前为正样本，label 为 0 表示当前为负样本
                # 这里 x0 和 x1 就是词的 Embedding，通过梯度下降算法自动更新求解
                x0 = embed_in[p[0]] # p[0] 是中心词_id
                x1 = embed_out[examp[1]] # examp[1] 是周围词_id
                y = np.dot(x0, x1) # 计算 Embedding 的内积
                g = (soft_max(y) - label) * learning_rate # 计算梯度，learning_rate 是超参数学习率
                tmp0 = x0.copy() # 保留原来的 x0
                x0 -= g * x1 # 反向传播，梯度下降，更新 x0
                x1 -= g * tmp0 # 反向传播，梯度下降，更新 x1
    nc = 0
    for k,v in data_map.items():
        print(k, embed_in[v])
        nc += 1
        if nc > 5:
            break

主流程

将之前的代码组合起来，形成完成代码。

def main():
    global vocab_size, embed_in, embed_out
    # 1. 读入语料库
    tokens = read_tokens()
    # 2. 构建训练样本
    pairs = get_skip_gram_pairs(tokens, 3)
    # 3. 初始化模型参数
    vocab_size = len(data_map)
    embed_in = np.random.rand(vocab_size, hidden_dim)
    embed_out = np.random.rand(vocab_size, hidden_dim)
    # 4. 训练模型
    train(pairs)

最长回文子串

2023-07-01T15:13:46.000Z

题目大意：

输入多个字符串，对于每个字符串输出一个整数 $N$，表示该字符串的最长回文子串。

输入

最多 $30$个字符串，每个字符串长度不超过 $1000000$，最后一个字符串为END(该字符串不需要处理)。

输出

对于每组测试用例，输出以"Case N: "作为开头，N是测试用例的编号,然后是对应字符串的最长回文子串。

样例输入

1
2
3

abcbabcbabcba
abacacbaaaab
END

样例输出

1 2	Case 1: 13 Case 2: 6

求解最长回文子串的经典算法为 Manacher 算法。

定理1：如果某个字符串本身是回文串，对于其内部的任何一个回文子串$s$，它的 $s$ 的镜像串 $s'$也是回文子串，并且 $s = s'$。

这是由回文串本身的对称性决定的，对 $s$ 做中心对称变化，然后再做平移，就会得到$s'$。由于对回文串做对称变换保持不变，所以$s$ 跟 $s'$ 相等。

当回文串的长度为偶数时，回文串的中心并不是某一个字符，原版的 Manacher算法为了解决这个问题，通过对原字符串添加特殊字符的方法，使得每一个字串长度都是奇数。实际上这一步是不必要的，因为找回文中心的本质原因是为了找回文串的镜像变换，只需要知道镜像变换公式即可。

对于一个回文子串，其中心对称的两个下标之和是定值 $C$，而 $\displaystyle \frac C 2$就是回文子串的中心，这里把 $C$称为回文串的二倍中心。对于回文子串的任意一个下标 $j$，其对称的下标变换公式为 $i = C - j$。假设回文子串的右边界为 $r$，那么回文子串左边界 $l = C - r$，回文串的长度为 $len = r - l + 1 = 2*r -C + 1$

对于每一个中心都有一个最长的回文子串，而每个回文子串也都有一个唯一的中心，也就有一个唯一的变换公式，所以我们可以用$C$ 来唯一标识这个子串。

最长回文子串算法

该算法是动态规划的，定义 $rd[c]$表示二倍中心为 $c$的最长回文子串的长度，用 $r$ 表示以$c$为二倍中心的回文串向右最远扩展的位置加一，可以把这个状态称为循环不变状态，并用下图表示。那么$l = c- r$，从 $l+1$ 至 $r-1$为回文子串，回文子串的长度 $rd[c] = (r - 1) - l = (r - 1) - (c - r) =2r-c-1$。

让 $c$ 从零开始依次递增并计算$rd[c]$，当 $rd[c]$ 被计算出来之后，我们观察中心位于$\displaystyle \frac c2$ ~ $r$ 之间的回文子串。

下一步，我们只需要识别上图中的情况，即回文子串的右边界无法触及 $r-1$。不妨设中心位置为 $\displaystyle \fracn2$，根据定理1可知，关于 $\displaystyle \fracc2$对称处存在一个完全一样的回文串，只要对称串的左边界无法触及$l+1$，那么以 $\displaystyle \frac n2$为中心的最大回文串右边界就无法触及 $r-1$，最大回文串长度也就确定了 $rd[n] = rd[2c-n]$。

处理完这种情况之后，会遇到第一个右边界达到 $r-1$ 的回文子串，变成下图情况。

由于此时对于 $s[l] = s[r] ?$我们无法确定，所以就不能确定 $r-1-l$是否为最长回文子串长度。如果二者不想等 $r-1-l$就是最大回文字串长度，而且可以发现当前就是循环不变状态。而如果 $s[l] =s[r]$，就要一直向右扩展，直到二者不相等。扩展完成之后就会发现，也回到了循环不变状态，可以开启下一轮的计算了。

C++ 代码

#include 
#include 

using namespace std;
std::string str;
int rd[2000008];

int main() {
  ios_base::sync_with_stdio(false);
  std::cin >> str;
  int T = 0;
  rd[0] = 1;
  while (str != "END") {
    int r = 1, n = 0, res = 1;
    while (r < str.size()) {
      int c = n;
      while (++n <= 2*(r - 1) && rd[2*c - n] < r - (n - r) - 1) {
          rd[n] = rd[2*c - n];
      }
      while (0 <= n - r && str[n-r] == str[r]) {
          r++;
      }
      rd[n] = (r - 1) - (n - (r - 1)) + 1;
      if (res < rd[n]) {
          res = rd[n];
      }
    }
    std::cout << "Case " << ++T << ": " << res << std::endl;
    std::cin >> str;
  }
  return 0;
}

线性规划单纯形法

2022-07-30T10:53:46.000Z

线性规划是最优化问题中的一个重要领域。许多实际问题都可以归结为线性规划问题，例如：网络流、多商品流量等问题。我们在高中已经学习过只有$2$个变量的场景，可以使用图解法来求最优解。该方法虽然直观，易于理解，但是难以推广到$n$个变量的场景。面对更加复杂的线性规划问题，单纯形法是则是更加常用的方法。本文尝试从线性代数基础知识出发，一步一步的推导出单纯形法，并提出一种避免退化基变换的迭代方法，从而避免了单纯形陷入无限循环的情况。

线性规划的标准形式

线性规划问题的标准形式如下

目标：$\max : c_1 \cdot x_1 + c_2 \cdotx_2 + ... + c_n \cdot x_n$ ，$c_i$ 是给定的常量。$x_i$ 是变量，需要满足如下约束：

\[\begin{aligned}a_{11} \cdot x_1 + a_{12} \cdot x_2 + ... + a_{1n} \cdot x_n &= b_1\\a_{21} \cdot x_1 + a_{22} \cdot x_2 + ... + a_{2n} \cdot x_n &= b_2\\... \\a_{m1} \cdot x_1 + a_{m2} \cdot x_2 + ... + a_{mn} \cdot x_n &= b_m\end{aligned}\] 而且对于每一个 $x_i$需要满足约束条件： $x_i \geq 0$。在标准形式中，要求 $b_i \geq0$，但是如果其中某个 $b_i <0$，可以将该方程两边同时乘以 $-1$ 转化为标准形式。

将标准形式写成矩阵形式：

目标：$\max : \mathbf{c^T \cdotx}$

约束：$\mathbf{Ax} = \mathbf{b}, \mathbf{x\geq 0}$

在标准形式下，$\mathbf{b}$也需要满足 $\mathbf{b \geq 0}$，即$\mathbf{b}$ 的每一个分量都大于等于0。

有时候目标是求最小值，基本方法是一样的，也可以通过将目标函数乘以$-1$，转化为最大值问题求解。

基础知识

线性代数

回顾一下线性代数基础知识，对于线性方程组 $\mathbf{Ax} = \mathbf{b}$，其中 $\mathbf{A}$ 是一个 $m \times n$ 的矩阵（$m$ 个方程，$n$ 个未知量）。用 $rank(\mathbf{A})$ 代表矩阵 $\mathbf{A}$ 的秩，方程组的增广矩阵为 $[\mathbf{A|b}]$，只有当 $rank(\mathbf{A}) = rank([\mathbf{A|b}])$时，该方程组才可能有解，在此情况下，还可以分为以下 3 种情况：

如果 $rank(\mathbf{A}) < n$，那么该线性方程组有无穷多组解
如果 $rank(\mathbf{A}) = n$，那么该线性方程组有唯一解
如果 $rank(\mathbf{A}) > n$，那么该线性方程组无解

对于情况 2 和情况3，对于使用线性代数方法很容易解决，这里不在赘述。

情况 $1$是我们研究的对象，在这种情况下，设矩阵 $\mathbf{A}$ 的秩是 $K$，由于 $K< n$，那么矩阵 $\mathbf{A}$可以通过高斯消元法（加减消元法）消除冗余的方程，最终只剩下由 $K$个线性无关的方程（通过手动计算，或者计算机程序都很容易做到）。在以下的讨论中，均假设$\mathbf{A}$已经是经过高斯消元之后的方程组。

定义一 ：如果对于某个 $\mathbf{x_0}$，满足约束条件：$\mathbf{Ax_0} = \mathbf{b}, \mathbf{x_0 \geq0}$，那么称 $\mathbf{x_0}$是该线性规划的一个可行解。由所有可行解组成的集合为可行域。

定义二 ：已知线性规划问题中，矩阵 $\mathbf{A}$ 的秩是 $m$，则矩阵 $\mathbf{A}$ 中存在 $m$ 个线性无关的列向量。只将这 $m$ 个列向量对应的 $x$ 视作未知量，将其他列向量对应的 $x$ 取值为 $0$，则方程 $\mathbf{Ax} = \mathbf{b}$ 有唯一解 $\mathbf{x_0}$，将这个解称之为基解。这$m$个列向量被称为基向量。基向量对应的 $x$分量称为基变量，基变量的个数也是 $m$。基变量中也有可能取值为 $0$，这种情况称为退化。如果所有基变量都大于等于$0$，那么称 $\mathbf{x_0}$是一个基可行解。

备注：基解、可行解、基可行解只和约束条件有关，和目标函数无关

例一：对于如下线性方程组，求它的一个基解。 \[\begin{aligned}x_1 + x_2 + 2x_3 + x_4 + x_5 &= 9 \\2x_1 + x_2 + x_3 + 3x_4 + x_5 &= 12\end{aligned}\] 该方程组中有 $5$个未知量，$2$个线性无关的方程，所以矩阵 $\mathbf{A}$ 的秩是 $2$。前 $2$ 个列向量为： \[\left (\begin{array}{c|c}1 & 1 \\2 & 1 \\\end{array}\right )\] 这 $2$个列向量是线性无关的，对应的 $\mathbf{x}$ 的分量分别为 $x_1, x_2$，将其他分量 $x_3,x_4,x_5$ 取值为 $0$，方程组可简化为： \[\begin{array}{rrrrr}x_1 &+& x_2 &+& 2 \cdot 0 &+& 1 \cdot 0&+& 1 \cdot 0 &=& 9 \\2x_1 &+& x_2 &+& 1\cdot 0 &+& 3 \cdot 0&+& 1 \cdot 0 &=& 12\end{array}\] 该方程有唯一解，可以解得： $\mathbf{x_0} = (3,6,0,0,0)^T$，这里的$\mathbf{x_0}$ 就是一个基解，对应的$x_1$ 和 $x_2$是基变量。由于每一个非零分量都是正数，所以也是基可行解。

对于有 $n$个未知量的线性规划问题，由于基变量有 $m$ 个，所以基解的个数最多为 $\displaystyle \binom{n}{m} =\frac{n!}{m!(n-m)!}$

定理一：已知 $m$个向量组 $\{\mathbf{a_1},\mathbf{a_2},...,\mathbf{a_m}\}$线性无关，向量 $\mathbf{b}$可以唯一表示为 $\mathbf{b} = \lambda_1\mathbf{a_1} + \lambda_2 \mathbf{a_2} + ... + \lambda_m\mathbf{a_m}$，而且其中存在一个 $\lambda_i \neq 0$，那么向量组 $\{\mathbf{a_1}, ..., \mathbf{a_{i-1}}, \mathbf{b},\mathbf{a_{i+1}}, ..., \mathbf{a_{m}}\}$ 线性无关。

证明：由于 $\lambda_i \neq 0$，对$\mathbf{b} = \lambda_1 \mathbf{a_1} +\lambda_2 \mathbf{a_2} + ... + \lambda_m \mathbf{a_m}$做等价变换可得： \[\frac{-\lambda_1}{\lambda_i}\mathbf{a_1} +... +\frac{-\lambda_{i-1}}{\lambda_i}\mathbf{a_{i-1}} +\frac{1}{\lambda_i}\mathbf{b} +\frac{-\lambda_{i+1}}{\lambda_i}\mathbf{a_{i+1}} +... +\frac{-\lambda_{m}}{\lambda_i}\mathbf{a_{m}}= \mathbf{a_i}\] 由于以上的表示法是唯一的，所以线性方程组 $\mathbf{[{a_1}, ..., a_{i-1}, b, a_{i+1}, ...,a_m]x = a_i}$ 有唯一解，矩阵 $\mathbf{[{a_1}, ..., a_{i-1}, b, a_{i+1}, ...,a_m]}$ 的秩为 $m$。由于向量的个数也是 $m$，所以向量组 $\{\mathbf{a_1}, ..., \mathbf{a_{i-1}}, \mathbf{b},\mathbf{a_{i+1}}, ..., \mathbf{a_{m}}\}$ 线性无关。

凸集

定义三：对于集合 $\mathbf{C}$ 中的任意 $2$ 个点 $\mathbf{x_1,x_2}$，如果其连线上的任意一个点也都属于集合$\mathbf{C}$，那么称集合 $\mathbf{C}$ 为凸集。其中$\mathbf{x_1,x_2}$连线上的点可以形式化表示为 $a \cdot\mathbf{x_1} + (1-a) \cdot \mathbf{x_2}$，其中 $0 \leq a \leq 1$ 。

定理二：如果线性规划存在可行解，那么所有可行解组成的集合是一个凸集。

证明：假设 $\mathbf{x_1,x_2}$ 是线性规划 $\mathbf{Ax} = \mathbf{b}, \mathbf{x \geq0}$ 的可行解。那么对于任意 $0 \leq a\leq 1$，都有： \[\begin{aligned}\mathbf{x_1 \geq 0} &\Rightarrow a \cdot \mathbf{x_1} \geq\mathbf{0} \\\mathbf{x_2 \geq 0} &\Rightarrow (1 - a) \cdot \mathbf{x_2} \geq\mathbf{0} \\\end{aligned}\] 将以上两式相加可得： \[a \cdot \mathbf{x_1} + (1-a) \cdot \mathbf{x_2} \geq \mathbf{0}\] 类似的： \[\begin{aligned}\mathbf{Ax_1} = \mathbf{b} &\Rightarrow \mathbf{A} \cdot (a\mathbf{x_1}) = a \cdot \mathbf{b} \\\mathbf{Ax_2} = \mathbf{b} &\Rightarrow \mathbf{A} \cdot ((1-a)\mathbf{x_1}) = (1-a) \cdot \mathbf{b}\end{aligned}\] 将以上两式相加可得： \[\mathbf{A}(a \cdot \mathbf{x_1} + (1-a) \cdot \mathbf{x_2}) = \mathbf{b}\] 所以 $a \cdot \mathbf{x_1} + (1-a)\cdot \mathbf{x_2}$ 也是一个可行解。证毕！

定义三：在凸集 $\mathbf{C}$ 中，如果点 $\mathbf{x}$不在任何两个不同的点的连线上，那么称 $\mathbf{x}$ 为 $\mathbf{C}$的顶点。换而言之，如果 $\mathbf{x}$ 是顶点，且 $\mathbf{x} = a \cdot \mathbf{x_1} + (1-a) \cdot\mathbf{x_2}$，其中 $0 \leq a \leq1$，那么必然有 $\mathbf{x_1} =\mathbf{x_2}$ 。

定理二：如果凸集 $\mathbf{C}$ 中顶点的个数是有限的，那么$\mathbf{C}$中的任意一个点，都可以写成顶点的凸组合。即 $\mathbf{C}$ 中有 $n$ 个顶点 $\mathbf{P_1,P_2,...P_n}$，对于 $\mathbf{C}$ 中任意一个点 $\mathbf{P}$，可以写为 $\mathbf{P} =\sum\limits_{i=1}^{n}\lambda_i\mathbf{P_i}$，其中 $0 \leq \lambda_i \leq 1$，并且 $\sum\limits_{i=1}^{n}\lambda_i = 1$。

证明：使用数学归纳法证明。首先考虑最简单的情况，$\mathbf{C}$ 中只有 $2$ 个顶点 $\mathbf{P_1,P_2}$，那么根据凸集的定义，其内的点$\mathbf{P}$ 满足关系： $\mathbf{P} = \lambda_1\mathbf{P_1} +\lambda_2\mathbf{P_2}$，其中 $0 \leq\lambda_1,\lambda_2 \leq 1$ ，且 $\lambda_1 + \lambda_2 = 1$。

归纳假设对于任何一个顶点个数为 $n$的凸集 $\mathbf{C_n}$，该结论是成立的，那么再新增一个顶点$\mathbf{P_{n+1}}$，使得 $\mathbf{C_n}$ 中的部分区域和 $\mathbf{P_{n+1}}$围成一个新的区域，再加上原有的 $\mathbf{C_n}$ 会形成一个顶点个数为 $n+1$ 的凸集 $\mathbf{C_{n+1}}$。对于老区域中的点，由归纳假设可直接得证。而从新区域的构成可知，新区域中的任何一个点$\mathbf{Q}$ 都是老区域中的点 $\mathbf{P}$ 和 $\mathbf{P_{n+1}}$ 连接线上的点。所以 $\mathbf{Q} = \lambda\mathbf{P} +\lambda_{n+1}\mathbf{P_{n+1}}$，其中 $0 \leq \lambda,\lambda_{n+1} \leq 1$ ，且$\lambda + \lambda_{n+1} = 1$。

由归纳假设可知：$\mathbf{P} =\sum\limits_{i=1}^{n}\lambda_i\mathbf{P_i}$，其中 $0 \leq \lambda_i \leq 1$，并且 $\sum\limits_{i=1}^{n}\lambda_i = 1$。

所以： \[\begin{aligned}\mathbf{Q} &= \lambda\mathbf{P} + \lambda_{n+1}\mathbf{P_{n+1}} \\ &= \lambda\sum\limits_{i=1}^{n}\lambda_i\mathbf{P_i} +\lambda_{n+1}\mathbf{P_{n+1}} \\ &= \sum\limits_{i=1}^{n}\lambda\lambda_i\mathbf{P_i} +\lambda_{n+1}\mathbf{P_{n+1}}\end{aligned}\] 由于 $\lambda 和 \lambda_i$均为非负，所以 $\mathbf{P_i}$ 的系数$\lambda\lambda_i$ 和 $\lambda_{n+1}$ 均为非负，而且满足关系： $$\[\begin{aligned}\sum\limits_{i=1}^{n}\lambda\lambda_i + \lambda_{n+1} &= \lambda\sum\limits_{i=1}^{n}\lambda_i + \lambda_{n+1} \\ &= \lambda + \lambda_{n+1} \\ &= 1 \end{aligned}\]

$$ 由此可知，如果凸集 $\mathbf{C}$中顶点的个数是有限的，那么 $\mathbf{C}$中的任意一个点，都可以写成顶点的凸组合。

定理三：如果线性规划问题的可行域是有界的，那么在可行域中一定存在某个顶点是最优解。

证明：线性规划的目标为 $\max : \mathbf{c^T \cdot x}$，假设最优解为 $\mathbf{x_0}$。由定理二可知， $\mathbf{x_0}$可以写为顶点的凸组合。不妨设可行域有 $n$ 个顶点：$\mathbf{x_1,x_2,...x_n}$ 。那么 $\mathbf{x_0} =\sum\limits_{i=1}^{n}\mathbf{x_i}$，其中 $0 \leq \lambda_i \leq 1$，并且 $\sum\limits_{i=1}^{n}\lambda_i =1$。假设在集合 $\{\mathbf{c^T x_1},\mathbf{c^T x_2}, ..., \mathbf{c^T x_n}, \}$ 中，最大的元素为$\mathbf{c^Tx_k}$。那么可以得到以下关系： \[\begin{aligned}\mathbf{c^T x_0} &=\mathbf{c^T}\sum\limits_{i=1}^{n}\lambda_i\mathbf{x_i} \\ &= \sum\limits_{i=1}^{n}\lambda_i\mathbf{c^T x_i} \\ &\leq \sum\limits_{i=1}^{n}\lambda_i\mathbf{c^T x_k} \\ &= \mathbf{c^T x_k}\sum\limits_{i=1}^{n}\lambda_i \\ &= \mathbf{c^T x_k}\end{aligned}\] 由于 $\mathbf{x_0}$是最优解（不管是否为顶点），而 $\mathbf{c^Tx_0} \leq \mathbf{c^T x_k}$，所以 $\mathbf{x_k}$ 也是最优解。证毕！

注：如何可行域是无界的，如果存在最优解的话，也一定可以在顶点处取得，这里将证明略去。

定理四：线性规划中可行域的每一个顶点都是基可行解；同样每个基可行解也都是可行域的顶点。

证明：首先证明线性规划中可行域的每一个顶点都是基可行解。

假设线性规划约束条件中，矩阵 $\mathbf{A}$ 的秩为 $m$，当前顶点为 $\mathbf{x}$，且 $\mathbf{x}$ 的分量中，非 $0$ 分量的个数为 $k$。分为以下 $2$ 种情况讨论：

$\mathbf{x}$ 的非零分量对应 $\mathbf{A}$中的列向量线性无关，有基可行解的定义可知， $\mathbf{x}$ 是一个基可行解。
$\mathbf{x}$ 的非零分量对应 $\mathbf{A}$中的列向量线性相关。以下使用反正法证明该情况不存在。首先假设这种情况存在，为使描述更加方便，这里假设$\mathbf{x}$ 的前 $k$ 个分量不为 $0$，其余分量均为 $0$，所以 $\mathbf{x} =(x_1,x_2,...,x_k,0,0,..,0)^T$。由于 $\mathbf{x}$在可行域中，所以非零分量都只能是正数。将矩阵 $\mathbf{A}$ 写成列向量的形式：$\mathbf{A} =[\mathbf{a_1},\mathbf{a_2},...,\mathbf{a_n}]$。线性方程组的形式为

\[x_1 \mathbf{a_1} + x_2 \mathbf{a_2} + ... + x_n \mathbf{a_n} =\mathbf{b}\]

由于 $\mathbf{x}$ 中，只有前 $k$ 个分量非零，其余分量为 $0$，化简如下： \[\begin{equation}x_1 \mathbf{a_1} + x_2 \mathbf{a_2} + ... + x_k \mathbf{a_k} =\mathbf{b} \tag{1}\end{equation}\] 另外由于向量 $\mathbf{a_1},\mathbf{a_2},...,\mathbf{a_k}$线性相关，所以方程组：$[\mathbf{a_1},\mathbf{a_2},...,\mathbf{a_k}] \cdot\mathbf{x} = \mathbf{0}$ 有无穷多组解。设其中一组非零解为 $\mathbf{y}$，即： \[y_1 \mathbf{a_1} + y_2 \mathbf{a_2} + ... + y_k \mathbf{a_k} =\mathbf{0}\] 将以上方程两边同时乘以极小的正实数 $\varepsilon$ 可得： \[\varepsilon y_1 \mathbf{a_1} + \varepsilon y_2 \mathbf{a_2} + ... +\varepsilon y_k \mathbf{a_k} = \mathbf{0} \tag{2}\] $(1)$ 式减 $(2)$式可得： \[(x_1 - \varepsilon y_1) \mathbf{a_1} +(x_2 - \varepsilon y_2) \mathbf{a_2} +... +(x_k -\varepsilon y_k) \mathbf{a_k} = \mathbf{b} \tag{3}\] 由于 $\varepsilon$是一个任意小的正实数，可以保证方程 $(3)$ 中的每一项 $x_i - \varepsilon y_i$都是正数，所以得到了一个新的可行解 $\mathbf{x} - \varepsilon \mathbf{y}$。同理，将 $(1)$ 式加 $(2)$ 式也可得的一个新的可行解 $\mathbf{x} + \varepsilon \mathbf{y}$。由于$\varepsilon \neq 0$ ，所以 $\mathbf{x} - \varepsilon \mathbf{y} \neq\mathbf{x} + \varepsilon \mathbf{y}$。同时 $\mathbf{x} = \frac{1}{2}(\mathbf{x} - \varepsilon\mathbf{y}) + \frac{1}{2} (\mathbf{x} + \varepsilon\mathbf{y})$，所以 $\mathbf{x}$不是可行域的顶点，与前提条件矛盾，所以该情况不存在。

以下为证明线性规划的每个基可行解都是可行域的顶点。

设当前基可行解为 $\mathbf{x}$，矩阵 $\mathbf{A}$ 的秩为 $m$ ，那么 $\mathbf{x}$ 中就有 $m$ 个基变量，同时其余的非基变量均为 $0$。为了描述更加简便，不妨设 $\mathbf{x}$ 的前 $m$ 个分量为基变量，则 $\mathbf{x} = (x_1, x_2, ..., x_m,0,0,...,0)^T$，其中当 $1 \leq i \leqm$时，$x_i \ge0$。由于可行解是一个凸集，$\mathbf{x}$ 可以写为形式： $\mathbf{x} = \lambda \cdot \mathbf{y} +(1-\lambda) \cdot \mathbf{z}$，其中 $\mathbf{y,z}$ 也是可行解，$0 \leq \lambda \leq 1$。为了证明 $\mathbf{x}$ 是顶点，只需要证明 $\mathbf{y} = \mathbf{z}$ 即可。

由于 $\mathbf{y,z}$是可行解，所以它们的每一个分量都大于等于 $0$，而 $\lambda$ 和 $1- \lambda$ 也都大于等于 $0$，对于 $\mathbf{x}$ 取 $0$ 的分量， $\mathbf{y,z}$ 也只能取 0。$\mathbf{y,z}$ 的形式如下:

\[\mathbf{x} = (x_1, x_2, ... x_m, 0, 0, ..., 0)^T \\\mathbf{y} = (y_1, y_2, ... y_m, 0, 0, ..., 0)^T \\\mathbf{z} = (z_1, z_2, ... z_m, 0, 0, ..., 0)^T \\\] 另一方面，由于 $\mathbf{y,z}$是可行解，它们也满足关系：$\mathbf{Ay=b},\mathbf{Az=b}$

对 $\mathbf{x,y,z}$ 只截取前 $m$ 个分量，分别命名为 $\mathbf{\tilde x, \tilde y,\tilde z}$。\[\mathbf{\tilde x} = (x_1, x_2, ... x_m)^T \\\mathbf{\tilde y} = (y_1, y_2, ... y_m)^T \\\mathbf{\tilde z} = (z_1, z_2, ... z_m)^T \\\] 取矩阵 $\mathbf{A}$中对应的 $m$ 个列向量，组成一个 $m \times m$ 的方阵 $\mathbf{\tilde A}$，对应 $\mathbf{b}$ 中的 $m$ 个分量组成向量 $\mathbf{\tilde b}$。那么有以下关系： \[\begin{align*}\mathbf{\tilde A \tilde y} &= \mathbf{\tilde b} & (1) \\\mathbf{\tilde A \tilde z} &= \mathbf{\tilde b} & (2) \\\mathbf{\tilde A (\tilde y - \tilde z)} &= \mathbf{0} &(1)-(2) \\\end{align*}\] 由于 $\mathbf{\tilde A}$的列向量线性无关，方程 $\mathbf{\tilde A(\tilde y - \tilde z)} = \mathbf{0}$ 只有零解，所以 $\mathbf{\tilde y - \tilde z} =\mathbf{0}$。即 $\mathbf{\tilde y=\tilde z}$，再拼接上剩余的 $0$ 分量，可得 $\mathbf{y = z}$。所以 $\mathbf{x}$ 是可行域的顶点。证毕！

单纯形法

单纯形法的基本思路是基于迭代的思想，并非直接计算目标，而是通过迭代计算，一步一步的靠近目标，从而最终达到目标值。通过前面的介绍，我们知道线性规划如果能取到最大值，一定可以在某个基可行解取到最大值，所以迭代的方向是从一个基可行解变换到另一个相邻的基可行解，同时使得结果更加接近最大值。

定义四：如果两个基可行解仅有一个基变量互换，那么称这$2$ 个基可行解是相邻的。

例二：基可行解 $(x_1,x_2,x_3,0,0)^T$ 和 $(x_1,x_2,0,0,x_5)^T$就是相邻的，它们可以通过互换 $x_3\leftrightarrow x_5$ 获得。

最简形式

如果我们已经确定了基变量，那么通过初等行变换，必然能使基变量对应的矩阵形成一个单位矩阵，这里这种形式的矩阵称为最简形式。单位矩阵的$m$个列向量线性无关，被作为基向量，相应的 $x_i$为基变量。如果忽略列的下标，进行初等列变换之后，可以将单位矩阵放到最左边。\[\begin{pmatrix}1 & 0 & \dots & 0 & a_{1,m+1} & a_{1,m+2}, &\dots & a_{1,n} \\0 & 1 & \dots & 0 & a_{2,m+1} & a_{2,m+2}, &\dots & a_{2,n} \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \dots & 1 & a_{m,m+1} & a_{m,m+2}, &\dots & a_{m,n}\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\\vdots \\x_n\end{pmatrix}=\begin{pmatrix}b_1 \\b_2 \\\vdots \\b_m \\\end{pmatrix}\]矩阵这样变换之后，使得后面的分析和处理都更加方便。比如可以直接把对应的基解写出来：\[\mathbf{x} = (b_1, b_2, ... b_m, 0, 0, ..., 0)^T\] 对于矩阵 $\mathbf{A} =[\mathbf{a_1},\mathbf{a_2},...,\mathbf{a_n}]$ 中的列向量 $\mathbf{a_j}$ ，其中 $m+1 \leq j \leqn$，可以写为基向量的线性组合： \[\begin{equation}\mathbf{a_j} = a_{1j} \cdot \mathbf{a_1} + a_{2j} \cdot \mathbf{a_2} +... + a_{mj} \cdot \mathbf{a_m} \tag{4}\end{equation}\]

例三：考虑如下线性方程组： \[\begin{pmatrix}{\color{red} 1} & {\color{red} 0} & {\color{red} 0} &-2 & 0 \\{\color{red} 0} & {\color{red} 1} & {\color{red} 0} &5 & 1 \\{\color{red} 0} & {\color{red} 0} & {\color{red} 1} &1 & 3\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\x_3 \\x_4 \\x_5\end{pmatrix}=\begin{pmatrix}2 \\4 \\1 \\\end{pmatrix}\] 由于矩阵 $\mathbf{A}$ 中前3 个列向量组成单位矩阵，所以是最简形式。可以把 $x_1,x_2,x_3$ 为基变量，直接写出基解：$\mathbf{x} = (2, 4, 1, 0, 0)^T$。把前$3$ 个列向量作为基向量，矩阵的第$4$个列向量可以写为基向量的线性组合，如下形式： \[\begin{pmatrix}-2 \\5 \\1 \\\end{pmatrix}=-2 \cdot\begin{pmatrix}1 \\0 \\0 \\\end{pmatrix}+5 \cdot\begin{pmatrix}0 \\1 \\0 \\\end{pmatrix}+1 \cdot\begin{pmatrix}0 \\0 \\1 \\\end{pmatrix}\]

基变换

如果我们已经把线性规划化的矩阵 $\mathbf{A}$转化为了最简形式，并找到一个基可行解 $\mathbf{x}$。再给定一个非基变量 $x_j$ ，如果想要让 $x_j$ 成为基变量，应该对矩阵 $\mathbf{A}$ 做何种变换呢？

设矩阵 $\mathbf{A}$ 的秩是 $m$，由于矩阵 $\mathbf{A}$ 是最简形式，其基可行解的形式：$\mathbf{x} =(b_1,b_2,...b_m,0,0,...,0)$，即： \[\begin{equation}x_i =\left\{\begin{aligned}b_{i} & , & 1 \leq i \leq m, \quad & x_i 是基变量 \\0 & , & m+1 \leq i \leq n, \quad & x_i 是非基变量 \\\end{aligned}\right.\end{equation}\] 将矩阵 $\mathbf{A}$写成列向量的形式：$\mathbf{A} =[\mathbf{a_1},\mathbf{a_2},...,\mathbf{a_n}]$。将基可行解带入线性方程组$\mathbf{Ax=b}$ 可得： \[x_1 \mathbf{a_1} + x_2 \mathbf{a_2} + ... + x_n \mathbf{a_n} =\mathbf{b}\] 由于当$1 \leq i \leqm$时，$x_i=b_i$；当 $i > m$ 时，$x_i = 0$，所以方程简化为： \[\begin{equation}b_1 \mathbf{a_1} + b_2 \mathbf{a_2} + ... + b_m \mathbf{a_m} =\mathbf{b} \tag{5}\end{equation}\] 回顾基解的定义，当 $j >m$ 时，$\{\mathbf{a_1,a_2,...,a_m,a_j}\}$线性相关，$\mathbf{a_j}$可以写成其他向量的线性组合，参考方程 $(4)$ 即： \[-a_{1j} \mathbf{a_1} - a_{2j} \mathbf{a_2} - ... - a_{mj} \mathbf{a_m} +\mathbf{a_j} = \mathbf{0}\] 将上式两端同时乘上一个极小的正数 $\varepsilon$ 得： \[\begin{equation}-\varepsilon a_{1j} \mathbf{a_1} - \varepsilon a_{2j} \mathbf{a_2} - ...- \varepsilon a_{mj} \mathbf{a_m} + \varepsilon \mathbf{a_j}= \mathbf{0}\tag{6}\end{equation}\] $(5) + (6)$ 可得： \[\begin{equation}(b_1-\varepsilon a_{1j}) \mathbf{a_1} + (b_2-\varepsilon a_{2j})\mathbf{a_2} + ... + (b_m - \varepsilon a_{mj}) \mathbf{a_m} +\varepsilon \mathbf{a_j}= \mathbf{b} \tag{7}\end{equation}\] 对于该方程，分为以下 $2$种情况：

基变量全都是非退化的，即当$1 \leq i\leq m$ 时 $x_i >0$，那么当 $\varepsilon$从一个极小的正数开始逐渐增大时，$b_i-\varepsilon a_{ij}$可能会增加，也可以会降低，也可能保持不变。只要有任何一个降低（当 $a_{ij} > 0$ 时），当 $\varepsilon$增加的足够大时，可以找到第一个降低为零的 $b_i-\varepsilon a_{ij}$，这时其他的系数，仍然大于等于零，这样就又找到了另外一个解：
\[\mathbf{x} = (b_1-\varepsilon a_{1j},b_2-\varepsilon a_{2j}, ..., b_{i-1}-\varepsilona_{i-1,j},b_{i+1}-\varepsilon a_{i+1,j},...,b_m-\varepsilona_{mj},0,...,\varepsilon,0,...,0)\]
由于将 $\mathbf{a_j}$ 写成了 $\mathbf{a_1} \sim \mathbf{a_m}$的线性组合时，线性组合中 $\mathbf{a_i}$ 的系数 $a_{ij}$ 不为零，由定理一可知 $\mathbf{a_j}$和其他剩余的列向量必然线性无关，这样就让 $x_j= \varepsilon$ 成为了新的基变量，同时 $x_i$ 退出基变量。但是当 $1 \leq i \leq m$ 时，哪一个 $b_i - \varepsilon a_{ij}$ 最先变为 $0$ 呢？把 $\varepsilon$ 视作变量，如果 $a_{ij} > 0$ ，同时 $\displaystyle \frac{b_i}{a_{ij}}$最小，就说明分量 $b_i - \varepsilona_{ij}$ 最先变为 $0$。
给定一个特定的 $j$ 之后，如果增加$\varepsilon$ 时，没有 $b_i-\varepsilon a_{ij}$ 降低，即所有的$a_{ij}$ （第 $j$ 列）都小于等于 $0$，说明当前基解不可能把 $x_j$ 换入为基变量。
某个基变量是退化的，即存在某个 $1 \leqi \leq m$ ，使得 $x_i =0$，也就是 $b_i =0$。由于此时 $x_j =0$，如果满足 $a_{ij} \neq0$，在剔除 $\mathbf{a_i}$之后，$\mathbf{a_j}$和其他的基向量线性无关，只需要将 $x_i$ 换出，就能让 $x_j$成为新的基变量。但是经过变换之后，新的基可行解仍然是退化的。而且经过变换之后，新的基可行解和变换前的基可行解完全相同，只是基变量不同而已。这种基变换并不会让线性规划朝着目标前进，所以是没有意义的，应该避免。能不能避免退化呢？还像处理情况$1$ 一样，考虑让 $\varepsilon$ 从零开始增大，如果 $a_{ij} > 0$，由于 $b_i=0$，所以 $b_i - \varepsilon a_{ij}$的值会降低，那么只能变为负数，负数不可能成为可行解。所以在 $\varepsilon$从零开始增大时，只有当退化的基变量系数保持不变或者增加（$a_{ij} \leq0$），某个非退化的基变量系数降低，才能使 $x_j$换入为基变量，得到非退化的基可行解。在基变量退化的情况下，如果忽略了$a_{ij}$ 的符号，仍然按情况 $1$ 处理，可能出现某个 $x_i$ 为负数的情况，将 $x_j$换入后，得到的不是可行解。

如果可以使 $x_j$换入为基变量，应该如何变换呢？通过对上面的分析可以知道：如果有退化的基变量（$b_i = 0$），首先确保所有退化基对应的系数$a_{ij} \leq0$，否则就只能变换到同一个退化的基可行解，这种变换没有意义；同时对于所有非退化基（$b_i > 0$），同时满足 $a_{ij} > 0$ 的，取 $\displaystyle \frac{b_i}{a_{ij}}$最小的行，将该行对应的 $x_i$从基变量换出。如果上述情况不满足，说明无法把 $x_j$ 换入为基变量。

有的做法是允许退化，但是可能出现死循环的情况，需要特殊的策略（比如Bland 法则）来解决这个问题。

例四：已知如下线性方程组，$x_1,x_2,x_3$ 为基变量，现在要把 $x_4$ 换入为基变量，应该如何操作？ \[\begin{pmatrix}{\color{red} 1} & {\color{red} 0} & {\color{red} 0} &-2 & 0 \\{\color{red} 0} & {\color{red} 1} & {\color{red} 0} &1 & 1 \\{\color{red} 0} & {\color{red} 0} & {\color{red} 1} &2 & 1\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\x_3 \\x_4 \\x_5\end{pmatrix}=\begin{pmatrix}1 \\3 \\4 \\\end{pmatrix}\] 首先基解为：$\mathbf{x} =(1,3,4,0,0)^T$，可以看到，基变量都是正数，所以没有退化的情况。找到第$4$ 列为正数的项：$a_{2,4} = 1，a_{3,4} =2$，然后分别计算：$\displaystyle\frac{b_2}{a_{2,4}} = 3$ 和$\displaystyle\frac{b_3}{a_{3,4}} =2$，可以看到 $\displaystyle\frac{b_2}{a_{2,4}} >\frac{b_3}{a_{3,4}}$。在第 $4$ 列中，因为 $\displaystyle\frac{b_3}{a_{3,4}}$为正数，且最小，所以可以把 $x_3$换出基变量，可以保证 $\mathbf{x} =(x_1,x_2,0,x_4,0)^T$为基可行解。如何求出新的基可行解的值呢？由于新的基向量组成的矩阵不是单位矩阵，无法直接把新的基可行解写出来。我们希望把它转换为最简形式，可以这样操作，因为要把$x_3$ 换出，$x_4$ 换入，所以要以第 $3$ 行作为基准，通过高斯消元法把第 $4$ 列其他的元素变为 $0$。

第一步：将矩阵转换为增广矩阵 $[\mathbf{A|b}]$。 \[\left (\begin{array}{ccccc|c}1 & 0 & 0 & -2 & 0 & 1 \\0 & 1 & 0 & 1 & 1 & 3 \\0 & 0 & 1 & 2 & 1 & 4 \\\end{array}\right )\] 第二步：把第 $3$ 行除以$2$，以把 $a_{3,4}$ 变为 $1$，可得： \[\left (\begin{array}{ccccc|c}1 & 0 & 0 & -2 & 0 & 1 \\0 & 1 & 0 & 1 & 1 & 3 \\0 & 0 & \frac{1}{2} & 1 & \frac{1}{2} & 2 \\\end{array}\right )\] 第三步：$(1) + 2 \times(3)$ 同时 $(2) - (3)$，可得： \[\left (\begin{array}{ccccc|c}{\color{red} 1} & {\color{red} 0} & 1 & {\color{red} 0}& 1 & 5 \\{\color{red} 0} & {\color{red} 1} & -\frac{1}{2} &{\color{red} 0} & \frac{1}{2} & 1 \\{\color{red} 0} & {\color{red} 0} & \frac{1}{2} &{\color{red} 1} & \frac{1}{2} & 2 \\\end{array}\right )\] 这样第 $1,2,4$列就形成了一个新的单位矩阵，新的基可行解为：$\mathbf{x} = (5,1,0,2,0)^T$

在例四的操作，也称为 Pivot操作，翻译为中文有的为旋转，有的为转轴，其实就是高斯消元法，目的是为了形成一个新的单位矩阵，让下一步基变量的替换操作可以继续进行下去。

例五：考虑如下线性规划方程组， $x_1,x_2,x_3$为基变量，问能否把 $x_4$ 替换为基变量，获取一个新的基可行解？\[\begin{pmatrix}{\color{red} 1} & {\color{red} 0} & {\color{red} 0} & 1\\{\color{red} 0} & {\color{red} 1} & {\color{red} 0} & 1\\{\color{red} 0} & {\color{red} 0} & {\color{red} 1} & 2\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\x_3 \\x_4\end{pmatrix}=\begin{pmatrix}2 \\1 \\0 \\\end{pmatrix}\]注意到该方程最左边的三个列向量形成了一个单位矩阵，所以已经是最简形式了，令$x_4=0$，可以求得对应基解：$\mathbf{x} = (2,1,0,0)^T$。由于 $x_3$ 也为 $0$，所以该基解是退化的。由于 $a_{3,4} \neq 0$，所以可以直接让 $x_3$ 退出基变量，同时让 $x_4$加入基变量，对应的基可行解仍然是：$\mathbf{x}= (2,1,0,0)^T$ 。这只是换了基变量，并没有获得新的基可行解。

另一方面由于 $a_{3,4} >0$，通过上述对情况 $2$的讨论知道，新的基可行解，是不可能把 $x_4$ 换入作为基变量的。如果强行把 $x_4$ 换入呢？由于 $\displaystyle \frac{b_1}{a_{1,4}} =2$，$\displaystyle\frac{b_2}{a_{2,4}} = 1$，所以 $\displaystyle \frac{b_1}{a_{1,4}} >\frac{b_2}{a_{2,4}}$，所以 $\displaystyle\frac{b_2}{a_{2,4}}$最小，要把 $x_2$ 从基变量中换出。把第$2$ 行作为基准，对其他行做消元，把第$4$ 列其他元素变为 $0$。

第一步：将矩阵转换为增广矩阵 $[\mathbf{A|b}]$ \[\left (\begin{array}{cccc|c}1 & 0 & 0 & 1 & 2 \\0 & 1 & 0 & 1 & 1 \\0 & 0 & 1 & 2 & 0 \\\end{array}\right )\] 第一步：$(1)-(2)$，同时$(3)-2\times(2)$ 可得 \[\left (\begin{array}{cccc|c}1 & -1 & 0 & 0 & 1 \\0 & 1 & 0 & 1 & 1 \\0 & -2 & 1 & 0 & -2 \\\end{array}\right )\] 令 $x_2$为零，求的基解：$\mathbf{x} =(1,0,-2,1)^T$，由于 $x_3 <0$ ，所以不是基可行解。

由此可见，在处理线性规划问题时，如果遇到了退化的基可行解时，如果仍然盲目套用旋转操作，可能转换到一个非可行解，从而得到一个错误的结果。

迭代算法

在前面的介绍中，基变换、转轴操作都可以和目标函数无关，如果有了目标函数，能不能让基变换朝着离目标值更近的方向迭代，经过有限次的基变换，达到目标值？基变换需要假设我们已经获取到了一个基可行解，然后才能做新的变换。仍然有$2$ 个问题需要解决：

当前基可行解是否已经达到了最优？
如果当前基可行解不是最优的，下一步应该那一个非基变量换入？

最优判定

首先来看，如何判断当前可行解是否为最优解。

这里给定目标：$\max : c_1 \cdot x_1 + c_2\cdot x_2 + ... + c_n \cdot x_n$，将单纯形法约束化为最简形式：\[\begin{pmatrix}1 & 0 & \dots & 0 & a_{1,m+1} & a_{1,m+2}, &\dots & a_{1,n} \\0 & 1 & \dots & 0 & a_{2,m+1} & a_{2,m+2}, &\dots & a_{2,n} \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \dots & 1 & a_{m,m+1} & a_{m,m+2}, &\dots & a_{m,n}\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\\vdots \\x_n\end{pmatrix}=\begin{pmatrix}b_1 \\b_2 \\\vdots \\b_m \\\end{pmatrix}\] 写成线性方程组的形式，并移项可得： \[\begin{aligned}x_1 &= b_1 - (a_{1,m+1} \cdot x_{m+1} + a_{1,m+2} \cdot x_{m+2} +... + a_{1,n} \cdot x_{n}) \\x_2 &= b_2 - (a_{2,m+1} \cdot x_{m+1} + a_{2,m+2} \cdot x_{m+2} +... + a_{2,n} \cdot x_{n}) \\... \\x_m &= b_m - (a_{m,m+1} \cdot x_{m+1} + a_{m,m+2} \cdot x_{m+2} +... + a_{m,n} \cdot x_{n}) \\\end{aligned}\]这样就把所有的基变量用非基变量表示出来了，因此目标函数也可以只用非基变量表示。

例六：考察线性规划问题，目标 $\max：z = x_1 + 3x_2$，约束为: \[\begin{pmatrix}1 & 0 & 0 & -2 & 0 \\0 & 1 & 0 & 1 & 1 \\0 & 0 & 1 & 2 & 1\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\x_3 \\x_4 \\x_5\end{pmatrix}=\begin{pmatrix}1 \\3 \\4 \\\end{pmatrix}\] 并且：$x_i \geq 0$，其中$1 \leq i \leq 5$

由于已经是线性规划最简形式了，可以直接写出基可行解 $\mathbf{x} =(1,3,4,0,0)^T$，同时对线性方程组移项可得： \[\begin{aligned}x_1 &= 1 - (-2 \cdot x_4 + 0 \cdot x_5) \\x_2 &= 3 - (1 \cdot x_4 + 1 \cdot x_5) \\x_3 &= 4 - (2 \cdot x_4 + 1 \cdot x_5)\end{aligned}\] 将 $x_1，x_2$带入目标可得：$z=1 - (-2 \cdot x_4 + 0 \cdotx_5) + 3(3 - (1 \cdot x_4 + 1 \cdot x_5)) = 10 - x_4 -3x_5$。由于 $x_4,x_5$是是非基变量，在基可行解中，取值为 $0$，可以得到当前目标值 $z_0=10$。于此同时，在任意一个可行解中，$x_4 \geq 0, x_5 \geq 0$，都有 $z=10 - x_4 - 3x_5 \leq 10$。所以目标值$z$ 最大取值为 $10$，取值条件为当前的基解：$\mathbf{x} = (1,3,4,0,0)^T$。

上述例子给了我们判定当前基解是否为最优解的思路：首先要求当前已经是最简形式了，同时有一个基可行解。然后对于目标函数，把基变量都用非基变量表示。如果目标函数中，所有非基变量的系数都是负数，说明当前基解就是优解；否则需要选择一个新的基，继续进行基变换。

具体的证明和例六是一样的，只不过需要多一些形式化的描述，这里就不展开了。

选取基

如果最优判定失败了，说明在目标公式中一定存在某个非基变量，系数为正，那么就可以把该变量换入为基变量。

定理五：已知线性规划中，目标公式 $z=C + c_{m+1}\cdot x_{m+1} + ... + c_{n} \cdotx_{n}$ ，其中 $C$为常数项，$x_{m+1} \sim x_{n}$都是非基变量。如果存在某个非基变量 $x_{j}$ 的系数系数 $c_j > 0$ ，而且可以把 $x_{j}$ 换入为基变量。那么把 $x_{j}$换入为基变量之后，目标公式中的常数项 $C$要么不变，要么增加，取决于换出的基变量是否退化。

证明：这里仍然只考虑线性方程组已经被转化为最简形式，$x_1 \sim x_m$ 是基变量，$x_{m+1} \sim x_n$ 是非基变量。 \[\begin{pmatrix}1 & 0 & \dots & 0 & a_{1,m+1} & a_{1,m+2}, &\dots & a_{1,n} \\0 & 1 & \dots & 0 & a_{2,m+1} & a_{2,m+2}, &\dots & a_{2,n} \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \dots & 1 & a_{m,m+1} & a_{m,m+2}, &\dots & a_{m,n}\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\\vdots \\x_n\end{pmatrix}=\begin{pmatrix}b_1 \\b_2 \\\vdots \\b_m \\\end{pmatrix}\]

假设将 $x_{j}$换入为基变量的同时，$x_i$被换出为非基变量，在目标函数中，$x_j$也需要被 $x_i$替代。由于目标函数的形式为：$z=C+c_j \cdotx_{j} + P$，其中 $P=\sum\limits_{k=1}^{j-1}c_k\cdot x_{k} +\sum\limits_{k=j+1}^{n}c_k\cdot x_{k}$。由于在非基变量中，只有$x_j$变成了基变量，所以基变换之后，目标函数中的 $P$ 不会改变，只有 $c_j \cdot x_{j}$ 会被 $x_i$ 的一次项多项式替代。考察第 $i$ 个约束方程： \[1 \cdot x_i + a_{i,m+1} \cdot x_{m+1} + ... + a_{i,j} \cdot x_{j} + ...+ a_{i,n} \cdot x_{n} = b_i\] 等式两边同时除以 $a_{ij}$得： \[\frac{1}{a_{ij}} \cdot x_i + \frac{a_{i,m+1}}{a_{ij}} \cdot x_{m+1} +... + 1 \cdot x_{j} + ... + \frac{a_{i,n}}{a_{ij}} \cdot x_{n} = b_i\] 移项可得： \[\begin{aligned}x_{j} &= b_i - (\frac{1}{a_{ij}} \cdot x_i +\frac{a_{i,m+1}}{a_{ij}} \cdot x_{m+1} + ...+\frac{a_{i,j-1}}{a_{i,j-1}} \cdot x_{j-1} + \frac{a_{i,j+1}}{a_{i,j+1}}\cdot x_{j+1} + ... + \frac{a_{i,n}}{a_{ij}} \cdot x_{n}) \\ &= b_i - Q\end{aligned}\] 上述式子中 $Q$ 仍然是 $x_1 \sim x_n$ 的线性组合，而常数项只有$b_i$。把 $x_j$ 带入目标函数可得： \[\begin{aligned}z &= C + c_j \cdot x_j + P \\ &= C + c_j \cdot (b_i - Q) + P \\ &= (C + c_j \cdot b_i) - c_j \cdot Q + P\end{aligned}\] 在该式子中 $-c_j \cdot Q +P$ 为 $x_1 \sim x_n$的线性组合，常数项为 $C+c_j \cdotb_i$，由于 $c_j > 0$，对$b_i$ 分两种情况讨论：

$b_i = 0$，说明 $x_i$ 是退化的基变量，这时 $C + c_j \cdot b_i = C$，即把 $x_j$换入为基变量之后，目标函数中的常数项保持不变。前面基变换的小节已经讨论过这种情况，应该避免把退化的基变量换出，因为不会得到新的可行解。
$b_i > 0$，说明 $x_i$ 是没有退化的基变量，这时 $C + c_j \cdot b_i > C$，把 $x_j$换入为基变量之后，目标函数中的常数项增加 $c_j\cdot b_i$。

证毕！

通过上述定理可以知道，在非退化场景下，如果目标函数中 $x_j$ 的系数为正，把 $x_j$换入作为基变量之后，得到的新基可行解一定比原基可行解更加接近目标值。如果所有系数为正的非基变量，都不能换入为基变量，说明可行域中已经没有顶点使得目标值更大，该目标的解是无界的。为什么不是无解呢？因为单纯形法的初始条件是从一个基可行解出发，所以一定有解。

通过以上定理可以知道，通过一次单纯形法的基变换，目标函数的增量为：$c_j \cdotb_i$。如果遍历所有非基变量，找到所有满足条件的 $c_j \cdotb_i$，然后选取一个最大的值，把对应的 $x_j$换入为基变量，能够最大幅度的提升单纯形法迭代速度。但是会增加代码复杂度，为了简化起见，本文不会使用这个策略，如果感兴趣，可由读者自行实现。

例七：求下列线性规划的最优可行解以及对应的最优值。

目标：$\max：z = x_1 + 3x_2 -x_3$

约束： \[\begin{pmatrix}1 & 0 & 0 & 1 & 2 \\0 & 1 & 0 & 2 & -1 \\0 & 0 & 1 & 1 & 3 \\\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\x_3 \\x_4 \\x_5 \\\end{pmatrix}=\begin{pmatrix}2 \\2 \\6 \\\end{pmatrix}\] 其中：$x_i \geq 0$，$1 \leq i \leq 5$

解法一：带入法求解，该方法易于理解，但是手动运算比较多。首先可以看到，约束方程中，已经出现了一个单位矩阵，在该形式下可以直接写出一个基解：$\mathbf{x} =(2,2,6,0,0)^T$。与此同时，我们可以对约束方程做变形，把所有的基变量$x_1,x_2,x_3$ 都用非基变量 $x_4$ 和 $x_5$ 表示： \[\begin{aligned}x_1 &= 2 -x_4 -2x_5 \\x_2 &= 2 -2x_4 +x_5 \\x_3 &= 6 -x_4 -3x_5\end{aligned}\] 带入到目标函数 $z$ 可得：\[\begin{aligned}z &= x_1 + 3x_2 - x_3 \\ &= (2-x_4-2x_5) + 3 \cdot (2-2x_4+x_5) - (6 - x_4 -3x_5) \\ &= 2 - 6x_4 + 4x_5\end{aligned}\] 可以看到，在当前基可行解 $\mathbf{x} = (2,2,6,0,0)^T$的情况下，目标函数 $z$ 取值为 $2$。由于在当前基可行解中 $x_5$ 为 $0$，而目标函数中，$x_5$ 的系数为正数，如果 $x_5$增大的话，可以提高函数的取值，所以可以让 $x_5$成为新的基变量（只有基变量才不为零）。查看线性方程组的系数矩阵第 $5$ 列，只有 $a_{1,5}$ 和 $a_{3,5}$ 为正数，并且 $\displaystyle \frac{b_1}{a_{1,5}} <\frac{b_3}{a_{3,5}}$，所以应该把 $x_1$从基变量中换出。首先写出线性方程组的增广矩阵 $\mathbf{[A|b]}$： \[\left (\begin{array}{ccccc|c}1 & 0 & 0 & 1 & 2 & 2 \\0 & 1 & 0 & 2 & -1 & 2 \\0 & 0 & 1 & 1 & 3 & 6 \\\end{array}\right )\] 现在要用第 $1$ 行，第 $5$ 列，把第 $5$ 列的其他元素都消为 $0$。首先应该把 $a_{1,5}$ 变为 $1$，操作为 $\displaystyle (1) \times \frac{1}{2}$\[\left (\begin{array}{ccccc|c}\frac{1}{2} & 0 & 0 & \frac{1}{2} & 1 & 1 \\0 & 1 & 0 & 2 & -1 & 2 \\0 & 0 & 1 & 1 & 3 & 6 \\\end{array}\right )\] 然后 $(2) + (1)$ 和 $(3) - 3 \times (1)$: \[\left (\begin{array}{ccccc|c}\frac{1}{2} & 0 & 0 & \frac{1}{2} & 1 & 1 \\\frac{1}{2} & 1 & 0 & \frac{5}{2} & 0 & 3 \\-\frac{3}{2} & 0 & 1 & -\frac{1}{2} & 0 & 3 \\\end{array}\right )\] 矩阵的第 $2,3,5$列可以组成新的单位矩阵，对应基解为：$\mathbf{x} =(0,3,3,0,1)^T$。写出矩阵的第一行对应的方程： \[\frac{1}{2} \cdot x_1 + 0\cdot x_2 + 0\cdot x_3 + \frac{1}{2} \cdot x_4+ 1 \cdot x_5 = 1\] 移项可得： \[x_5 = 1 - \frac{1}{2} \cdot x_1 - \frac{1}{2} \cdot x_4\] 带入目标函数中： \[\begin{aligned}z &= 2 - 6x_4 + 4x_5 \\ &= 2 - 4x_4 + 4 \cdot (1 - \frac{1}{2} \cdot x_1 - \frac{1}{2}\cdot x_4) \\ &= 6 - 2x_1 - 6x_4\end{aligned}\] 即把基解 $\mathbf{x} =(0,3,3,0,1)^T$ 带入目标函数可取得目标值 $6$，由于 $z = 6- 2x_1 - 6x_4 \leq 6$，所以目标函数的最大值为 $6$。

解法二：高斯消元法求解，该方法以矩阵操作为主，便于用程序化实现，其本质和方法一没有区别。从方法一对线性方程组使用高斯消元，但是对目标函数使用的是带入法。实际上可以把目标函数也加入到线性方程组中，这样使用高斯消元法的时候能把目标函数做消元。\[\begin{pmatrix}1 & 0 & 0 & 1 & 2 \\0 & 1 & 0 & 2 & -1 \\0 & 0 & 1 & 1 & 3 \\1 & 3 & -1 & 0 & 0 \\\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\x_3 \\x_4 \\x_5 \\\end{pmatrix}=\begin{pmatrix}2 \\2 \\6 \\z \\\end{pmatrix}\]

把原有的线性方程组和目标函数拼接为一个大矩阵 $\mathbf{S}$： \[\left (\begin{array}{ccccc|c}1 & 0 & 0 & 1 & 2 & 2 \\0 & 1 & 0 & 2 & -1 & 2 \\0 & 0 & 1 & 1 & 3 & 6 \\\hline1 & 3 & -1 & 0 & 0 & z\end{array}\right )\] 仍然像解法一一样，找到 $3$个基向量，确定初始可行解：$\mathbf{x} =(2,2,6,0,0)^T$。然后用高斯消元法，把矩阵 $\mathbf{S}$的最后一行中，基向量对应的分量消除，依次执行操作：$(4)-(1),(4)-3\times(2),(4)+(3)$，矩阵$\mathbf{S}$ 可转化为： \[\left (\begin{array}{ccccc|c}1 & 0 & 0 & 1 & 2 & 2 \\0 & 1 & 0 & 2 & -1 & 2 \\0 & 0 & 1 & 1 & 3 & 6 \\\hline0 & 0 & 0 & -6 & 4 & z-2\end{array}\right )\] 观察矩阵 $\mathbf{S}$的最后一行，第 $5$列为正数，所以可以把 $x_5$换入为基变量；然后观察第 $5$列的正数项所在行，可得 $\displaystyle\frac{b_1}{a_{1,5}} < \frac{b_3}{a_{3,5}}$。所以应该把 $x_1$ 从基变量中换出。为了继续把矩阵 $\mathbf{S}$ 化简，需要用第 $1$ 行，把其他行的第 $5$ 列都消为 $0$。变换的方法和解法一类似，只不过矩阵的最后一行也参与变换，最终结果为：\[\left (\begin{array}{ccccc|c}\frac{1}{2} & 0 & 0 & \frac{1}{2} & 1 & 1 \\\frac{1}{2} & 1 & 0 & \frac{5}{2} & 0 & 3 \\-\frac{3}{2} & 0 & 1 & -\frac{1}{2} & 0 & 3 \\\hline-2 & 0 & 0 & -6 & 0 & z-6\end{array}\right )\] 矩阵最后一行对应的方程为$- 2x_1 -6x_4 = z - 6$，移项得：$z = 6 - 2x_1- 6x_4$。对应的基可行解：$\mathbf{x}= (0,3,3,0,1)^T$，取得的目标值：$6$

避免退化基变换单纯形算法

在基变换过程中，如果允许从一个退化的基可行解变换为另一个退化的基可行解，在单纯形法的实施过程中，有可能出现环的情况，永远无法退出。通过前文的介绍，如果单纯形法中出现了一个退化的可行解，要么当前解就是最优解；要么可以通过基变换，变换到另外一个基可行解，使得目标函数进一步靠近目标值。通过避免退化的方法，可以使每一个基变换的迭代，目标函数都更加靠近目标值。所以通过有限步的迭代，可以达到目标值，永远不会出现死循环的情况。算法步骤如下：

初始化矩阵：初始化单纯形矩阵 $\mathbf{S}$ 为如下形式： \[\left [\begin{array}{c|c}\mathbf{A} & \mathbf{b} \\\mathbf{c^T} & 0\end{array}\right]\]
初始化基可行解：找到一个初始的基可行解 $\mathbf{x}$
最优判定：判定矩阵 $\mathbf{S}$的最后一行元素，是否除了最后一个之外，其他元素都小于等于零。如果是说明当前基可行解可使目标函数达到最优，最优值为矩阵$\mathbf{S}$最后一行最后一列的相反数，算法结束；否则进入下一步
换入基选择：对于矩阵 $\mathbf{S}$ 的最后一行，找到一个 $c_j$ 为正的值，判定 $x_j$是否能成为换入的基变量。判定方法为，首先判断是否有 $b_i = 0$的情况，如果没有这种情况，进入下一步。否则说明有退化的基变量，判定对应的$a_{ij} < 0$是否成立，如果成立进入下一步。否则说明把 $x_j$换入不会得到新的基可行解。需要寻找另一个换入的基变量，在矩阵 $\mathbf{S}$ 的最后一行，找到另一个 $c_j > 0$。如果找到了，重复执行第 4步；如果没找到，说明目标函数是无界的，算法终止。
换出基选择：计算 $i= \mathop{argmin}\limits_{k}\displaystyle\frac{b_k}{a_{kj}}$，且 $\displaystyle\frac{b_k}{a_{kj}} >0$。如果能找到符合条件的 $i$，说明可以把 $x_i$从基变量中换出，进入下一步。否则说明目标函数是无界的，算法终止。
矩阵最简化：第 $i$ 行除以$a_{ij}$，即把 $a_{ij}$ 变为 $1$。然后通过高斯消元法把第 $j$列中，其他行（包括最后一行）的元素都消为零。
跳转执行第 $3$ 步

初始基可行解

在前面的讨论中，我们均是从一个初始基可行解出发，经过一系列的基变换，最终达到目标值。但是初始的基可行解应该如何确定呢？

特殊线性规划

对于某些特殊的问题，初始基可行解可以直接确定。先看一类特殊的线性规划问题。

目标：$\max：\mathbf{c^T \cdotx}$

约束：$\mathbf{Ax \leq b}$，$\mathbf{x} \geq \mathbf{0}$

前提条件：$\mathbf{b} \geq\mathbf{0}$

这类问题虽然看起来好像要比标准的线性规划问题要难，实际上经过转换之后，却是最简单的场景。对于不等式： \[a_1 \cdot x_1 + a_2 \cdot x_2 + ... + a_n \cdot x_n \leq b\] 可以添加一个松弛变量，使得上述不等式变为等式：

\[a_1 \cdot x_1 + a_2 \cdot x_2 + ... + a_n \cdot x_n + x_{n+1}= b\] 其中：$x_{n+1} \geq0$，$x_{n+1}$叫做松弛变量。

由于不等式组中有 $m$个不等式，可以添加 $m$个松弛变量，变成 $m$ 个方程，而添加的$m$个松弛变量也可以作为基变量。这样就直接找到了一个基可行解。

举个例子来说明：

例八：线性规划问题描述如下，添加松弛变量，将其转化为线性规划的标准形式。

目标：$\max：2x_1 + 3x_2 -x_3$

约束： \[\begin{aligned}x_1 + x_3 &\leq 6 \\x_2 + x_3 &\leq 4 \\2x_1 + x_2 &\leq 6 \\\end{aligned}\] 其中：$x_1 \geq 0,x_2 \geq 0,x_3\geq 0$

解：首先通过添加松弛变量，使不等式变为等式： \[\begin{aligned}x_1 + x_3 + &x_4 & & &= 6 \\x_2 + x_3 + & &x_5 & &= 4 \\2x_1 + x_2 + & & &x_6 &= 6 \\\end{aligned}\] 其中：$x_i \geq 0, 1 \leq i \leq6$。写成矩阵形式： \[\begin{pmatrix}1 & 0 & 1 & 1 & 0 & 0 \\0 & 1 & 1 & 0 & 1 & 0 \\2 & 1 & 0 & 0 & 0 & 1 \\\end{pmatrix}\cdot\begin{pmatrix}x_1 \\x_2 \\x_3 \\x_4 \\x_5 \\x_6 \\\end{pmatrix}=\begin{pmatrix}6 \\4 \\6 \\\end{pmatrix}\] 可以看到，方程组的系数矩阵中的最右侧的 $3$ 列已经形成了一个单位矩阵，所以可以把$x_4,x_5,x_6$作为基变量，得到一个基可行解：$\mathbf{x} =(0,0,0,6,4,6)^T$。然后应用单纯形算法，就可以求出最优解。

一般线性规划

对于一般线性规划问题，也可以通过类似的处理，一般有 $2$ 种方法，可以求得初始基可行解。一种是大$M$法，另一种是两阶段法。以下面的例子作为说明。

例九：已知一般线性规划问题描述如下，求初始基可行解

目标：$\max：2x_1 + 3x_2 -x_3$

约束： \[\begin{aligned}x_1 + x_2 + x_3 &= 6 \\x_1 - x_2 + 2x_3 &= 4 \\\end{aligned}\] 其中：$x_1 \geq 0,x_2 \geq 0,x_3\geq 0$

解法一：使用大 $M$ 法

所谓大 $M$，是一个非常大的正数，让它作为人工变量的系数，如果要让目标取值为最大，人工变量只能取值为$0$。将原问题转换为以下问题：

目标：$\max：2x_1 + 3x_2 - x_3 - M \cdot(x_4 + x_5)$

约束： \[\begin{aligned}&x_1 + x_2 + x_3 &+x_4 &&= 6 \\&x_1 - x_2 + 2x_3 & &+x_5 &= 4 \\\end{aligned}\] 其中：$x_1 \geq 0,x_2 \geq 0,x_3\geq 0,x_4 \geq 0,x_5 \geq 0$。

$x_4$ 和 $x_5$ 在原问题中不存在，是人工变量。由于$M$ 很大，要让目标值取得最大，$x_4,x_5$ 只能取值为 $0$，所以原问题和新问题的目标取值解是一样的。在转换后的问题中，可以直接将$x_4,x_5$作为基变量，求得初始基可行解：$\mathbf{x} =(0,0,0,6,4)^T$，然后可以直接利用单纯形法求解。

解法二：使用两阶段法。在大 $M$法中，将问题转换之后，新问题和原问题是同解的，但是多出来的大 $M$，会让强迫症感觉不爽。而所谓两阶段法是首先改造原问题，对改造后的问题使用单纯形法求最优解对应的基可行解；然后把该基可行解带回到原问题，再一次使用单纯形法求解。

第一阶段：改造问题

目标：$\max：-(x_4 + x_5)$

约束： \[\begin{aligned}&x_1 + x_2 + x_3 &+x_4 &&= 6 \\&x_1 - x_2 + 2x_3 & &+x_5 &= 4 \\\end{aligned}\] 其中：$x_1 \geq 0,x_2 \geq 0,x_3\geq 0,x_4 \geq 0,x_5 \geq 0$。

对于该问题，如果要使得目标函数最大，显然 $x_4$ 和 $x_5$ 只能取值为 $0$。所以我们要使用单纯形法求解该情况下基可行解。一阶段的初始基可行解：$\mathbf{x} =(0,0,0,6,4)^T$，通过单纯形法求解（步骤略）该问题可得在最优解的情况下，对应的基可行解为：$\mathbf{x} = (5,1,0,0,0)^T$，即 $x_1=5,x_2=1$。所以原问题的基可行解为：$\mathbf{x}=(5,1,0)^T$。

第二阶段：将 $\mathbf{x}=(5,1,0)^T$作为初始基可行解，使用单纯形法求解原问题（步骤略）。

多项式插值

2022-07-16T07:48:06.000Z

插值是一种通过已知的数据点，求新数据点的过程或方法。比如我们已经通过采样、或者实验等方式，获取到了$n+1$ 个不同的采样点 $(x_i, y_i)$，其中 $x_i$ 为输入，$y_i$ 为输出。现在遇到了一个新的输入 $x_t$，如何预测对应的输出 $y_t$呢？插值就是一种能解决此问题的方法。而多项式由于形式简单，便于计算，是最常用的插值函数。使用多项式作为插值函数，就是多项式插值。

本文将介绍多项式插值的基本原理，以及常用的插值方法，其中包括了拉格朗日插值法和牛顿插值法。对于拉格朗日插值和牛顿插值，本文不仅介绍了原理，还给出了Python 代码的实现。虽然代码基于 numpy，但是并没有使用 numpy的高级特性。如果读者想替换为标准的 Python list，也是比较容易的。

1. 多项式求值

使用多项式插值，必然涉及到多项式求值问题：已知一个 $n$ 次多项式的表达式 $f(x) = a_0 + a_1 \cdot x + a_2 \cdot x^2 + ... +a_n \cdot x^n$，再给一个特定的点 $x$，如何计算对应的 $f(x)$呢？当然可以直接按多项式的定义去求值，但是代码比较繁琐。这里使用霍纳法则，转换一下多项式的形式：

$f(x) = (((a_n \cdot x + a_{n-1})x + ... +a_2)x + a_1)x + a_0$在使用霍纳法则迭代计算多项式时，代码会比较简洁，时间复杂度为 $O(n)$。

# 霍纳法则计算多项式，a 是多项式的系数，x 是给定的点
def Polynomial(a, x):
    r = 0
    for i in range(len(a)-1, -1, -1):
        r = x * r + a[i]
    return r

2. 多项式插值基本思路

回到本文刚开始的问题：已知 $n+1$个不同的采样点 $(x_i, y_i)$，其中$x_i$ 为输入，$y_i$ 为输出。现在遇到了一个新的输入 $x_t$，如何预测对应的输出 $y_t$ 呢？

首先寻找一个多项式函数 $f(x)$，使得 $f(x)$ 恰好经过这 $n+1$ 个点。然后假定对于任意的输入 $x$，输出均为 $f(x)$。最后对于给定的输入 $x_t$，按照假定条件，输出 $y_t = f(x_t)$。

3. 多项式插值原理

定理1： 对于 $n+1$ 个不同的坐标$(x_0, y_0)$，$(x_1, y_1)$...，$(x_n, y_n)$。存在一个唯一的不超过 $n$ 次的多项式，恰好经过这 $n+1$ 个点。

证明： 使用待定系数法，设多项式为： $f(x) = a_0 + a_1 \cdot x + a_2 \cdot x^2 + ... +a_n \cdot x^n$，由于 $f(x)$经过这 $n+1$ 个点。将 $(x_i, y_i)$ 坐标带入 $f(x)$ 的表达式，可构建如下方程组 \[f(x_0) = a_0 + a_1 \cdot x_0 + a_2 \cdot x_0^2 + ... + a_n \cdot x_0^n =y_0 \\f(x_1) = a_0 + a_1 \cdot x_1 + a_2 \cdot x_1^2 + ... + a_n \cdot x_1^n =y_1 \\... \\f(x_n) = a_0 + a_1 \cdot x_n + a_2 \cdot x_n^2 + ... + a_n \cdot x_n^n =y_n\] 写成矩阵形式 $\mathbf{X a} =\mathbf{y}$，其中 $\mathbf{a} = (a_0,a_1, a_2, ..., a_n)^\mathrm{T}$，$\mathbf{y} = (y_0, y_1, y_2, ...,y_n)^\mathrm{T}$，$\mathbf{X}$ 是一个 $(n+1) \times (n+1)$ 的矩阵。

\[\begin{pmatrix}1 & x_0 & x_0^2 & \cdot & x_0^n \\1 & x_1 & x_1^2 & \cdot & x_1^n \\1 & x_2 & x_2^2 & \cdot & x_2^n \\\cdot &\cdot & \cdot & \cdot & \cdot \\1 & x_n & x_n^2 & \cdot & x_n^n\end{pmatrix}\cdot\begin{pmatrix}a_0 \\a_1 \\a_2 \\\cdot \\a_n\end{pmatrix}=\begin{pmatrix}y_0 \\y_1 \\y_2 \\\cdot \\y_n\end{pmatrix}\]

可以看出，$\mathbf{X}$是一个范德蒙矩阵，行列式不为 $0$，所以该方程组有唯一解：$\mathbf{a} = \mathbf{X}^{-1}\mathbf{y}$。所以存在一个唯一的多项式，经过这 $n+1$ 个点。

虽然可以使用高斯消元法对范德蒙矩阵矩阵求逆，进而求出多项式插值函数，但是该方法计算的复杂度比较高，时间复杂度为$O(n^3)$，而且精度不高，实际很少使用。更常用的方法是拉格朗日插值和牛顿插值。由定理1可知，不管使用什么方法，最终的插值多项式都是一样的，只是计算的复杂程度不同而已。

4. 拉格朗日插值

拉格朗日使用构造法来构造多项式插值函数。基本思想是寻找 $n+1$ 个多项式基函数，其中第 $i$ 个基函数在 $x_i$ 处取值为 $1$，在其他 $x_j$ 处 ($j\neq i$) 取值为 $0$。即第$i (0 \leq i \leq n)$ 个多项式基函数$\omega_i(x)$ 满足如下特性：

\[\omega_i(x_k) = \left\{ \begin{aligned} &1 , i = k \\ &0 , i \neq k \end{aligned}\right.\]

构造多项式函数 $f(x) =\sum\limits_{i=1}^{n}y_i \cdot {\omega_i(x)}$，那么显然函数$f(x)$ 满足插值点 $f(x_i) = y_i$。由于每个基函数 $\omega_i(x)$ 是一个关于 $x$ 的 $n$ 次多项式，所以 $f(x)$ 也一个关于 $x$ 的 $n$次多项式。关键的问题是如何寻找基函数。

对于 $i (0 \leq i \leqn)$，拉格朗日选取的第 $i$个基函数： $\displaystyle \omega_i(x) =\prod\limits_{j=0, j \neq i}^{j=n}\frac{(x-x_j)}{(x_i-x_j)}$。

可以看到，基函数 $\omega_i(x)$是一个关于 $x$ 的 $n$次多项式。下面验证一下是否满足基函数特性。将 $x_i$ 带入第 $i$ 个基函数可得：

$\displaystyle \omega_i(x_i) =\prod\limits_{j=0,j \neq i}^{j=n}\frac{(x_i-x_j)}{(x_i-x_j)}$，约分后，可得 $\omega_i(x_i) = 1$

对于$k \neq i$ 且 $0 \leq k \leq n$，将 $x_k$ 带入第 $i$ 个基函数可得： $\displaystyle \omega_i(x_k) = \prod\limits_{j=0,j\neq i}^{j=n} \frac{(x_k-x_j)}{(x_i-x_j)}$。

在该式中，分子中必然存在一个 $j$使得 $k = j$，即$x_k - x_j = 0$，那么分子的乘积也为 $0$，即 $\omega_i(x_k) =0$，所以满足基函数特性。

拉格朗日多项式插值函数表达式为：$f(x) =\sum\limits_{i=1}^{n}y_i \cdot {\omega_i(x)}$

举例

以上的介绍有些抽象，看一个例子就会清晰一些。假设有 $3$ 个点 $(1,2)$，$(3,12)$，$(4,23)$，求一个二次函数 $y = a_0 + a_1 \cdot x + a_2 \cdot x^2$经过这 $3$ 个点。首先找到 3个拉格朗日基：

$\displaystyle \omega_0(x) =\frac{x-x_1}{x_0-x_1} \cdot \frac{x-x_2}{x_0-x_2} = \frac{x-3}{1-3}\cdot \frac{x-4}{1-4} = \frac{(x-3)(x-4)}{6}$

$\displaystyle \omega_1(x) =\frac{x-x_0}{x_1-x_0} \cdot \frac{x-x_2}{x_1-x_2} = \frac{x-1}{3-1}\cdot \frac{x-4}{3-4} = -\frac{(x-1)(x-4)}{2}$

$\displaystyle \omega_2(x) =\frac{x-x_0}{x_2-x_0} \cdot \frac{x-x_1}{x_2-x_1} = \frac{x-1}{4-1}\cdot \frac{x-3}{4-3} = \frac{(x-1)(x-3)}{3}$

所以最终的表达式：

\[\begin{aligned}f(x) &= y_0 \cdot \omega_0(x) + y_1 \cdot \omega_1(x) + y_2 \cdot\omega_2(x) \\ &= 2 \cdot \frac{(x-3)(x-4)}{6} + 12 \cdot-\frac{(x-1)(x-4)}{2} + 23 \cdot \frac{(x-1)(x-3)}{3}\end{aligned}\]

容易验证，对于以上表达式：$f(1) =2$，$f(3) = 12$，$f(4) = 23$

Python 代码

直接使用拉格朗日基函数的定义，来求插值函数

import numpy as np

def Lagrange(X, Y):
    def f(x):
        r = 0
        for i in range(len(Y)):
            w = Y[i]
            for j in range(len(X)):
                if i == j:
                    continue
                w *= (x - X[j]) / (X[i] - X[j])
            r += w
        return r
    return f # 返回插值函数

测试：给定一个 $5$ 次多项式，以及$6$个插值点，可以得到拉格朗日插值函数。再给定一个新的点，测试通过原始的多项式和插值函数计算的结果是否一样。

def test_lagrange():
    # f(x) 是一个 5 次多项式，表达式如下：
    # f(x) = 1 + 5 * x + 2 * x^2 + 4 * x^3 + 6 * x^4 + 3 * x^5
    a = np.array([1, 5, 2, 4, 6, 3])
    y = Polynomial(a, 3.5)  # 直接使用多项式计算 f(3.5)
    print(y)

    # 给定 6 个插值点
    X = np.array([1, 2, 5, 7, 9, 10])
    Y = np.zeros_like(X)
    for i in range(len(X)):
        Y[i] = Polynomial(a, X[i])

    f = Lagrange(X, Y) # 返回拉格朗日插值函数
    y = f(3.5) # 使用插值函数计算
    print(y)

test_lagrange()

拉格朗日插值虽然形式简单，便于理解，但是不具备增量特特性，即在已经计算出$n$个点的插值函数后，如果再增加一个点，所有基函数都要重建。

如果不对插值多项式做化简，每次计算一个新的点时，时间复杂度为 $O(n^2)$。

5. 牛顿插值

牛顿插值法可以解决拉格朗日不具备增量计算的问题，解决方法是换了一组基函数。对于$n+1$ 个不同的点 $(x_0, y_0)$，$(x_1, y_1)$...，$(x_n, y_n)$ ，牛顿法也是构造 $n+1$ 个基函数。对于上述每个点 $(x_i, y_i)$ ，基函数需要满足如下特性：

\[ \begin{aligned} \sum\limits_{j=0}^{i}{a_j\phi_j(x_i)} &= y_i \\ \sum\limits_{j=i+1}^{n}{a_j\phi_j(x_i)} &= 0 \end{aligned}\]

如果找到了这样一组基函数，那么最终插值多项式的表达式：$\displaystyle f(x) =\sum\limits_{i=0}^{n}a_i\phi_i(x)$，根据基函数特性可得：$f(x_i) = y_i$。

如何寻找基函数呢，仍然是构造法。牛顿构造的第 $i$ 个基函数表达式如下：

\[\phi_i(x) = \left\{ \begin{aligned} &1 , i = 0 \\ &\prod\limits_{j=0}^{i-1}(x-x_j) , 1 \leq i \leq n \end{aligned}\right.\]

牛顿插值多项式中的 $a_i$是待定系数，需要满足牛顿基函数特性，并不能通过观测直接得到。为了求解$a_i$，首先将牛顿插值多项式展开：\[\begin{aligned}f(x) &= \phi_0(x) + \phi_1(x) + \phi_2(x) + ... + \phi_n(x) \\ &= a_0 + a_1(x-x_0) + a_2(x-x_0)(x-x_1) + ... +a_n(x-x_0)(x-x_1)...(x-x_{n-1})\end{aligned}\]

将 $n+1$ 个不同的点的坐标 $(x_0, y_0)$，$(x_1, y_1)$...，$(x_n, y_n)$ 带入牛顿插值表达式 $f(x)$ 可得到以下方程组：

\[\begin{array}{llll} f(x_0) &= a_0 &= y_0 \\ f(x_1) &= a_0 + a_1(x_1-x_0) &= y_1 \\ f(x_2) &= a_0 + a_1(x_2-x_0) + a_2(x_2-x_0)(x_2-x_1) &= y_2 \\ ... \\ f(x_n) &= a_0 + a_1(x_n-x_0) + a_2(x_n-x_0)(x_n-x_1) + ... +a_n(x_n-x_0)...(x_n-x_{n-1}) &= y_n\end{array}\]

上述方程组有 $n+1$ 个方程，$n+1$ 个未知量，由于这 $n+1$个点的坐标不同，而且各个方程之间线性无关，该方程组有唯一解。虽然可以使用高斯消元法来求解，但是使用带入法更加快捷。可以先通过第一个方程求解出$a_0$，然后带入到第二个方程求解 $a_1$，等等以此类推直到求解出 $a_n$。

举例

和拉格朗日插值一样，假设有 $3$个点 $(1,2)$，$(3,12)$，$(4,23)$，求一个经过这 $3$ 个点的二次函数。

牛顿插值的二次函数的形式为：$f(x) = a_0 +a_1(x-1) + a_2(x-1)(x-3)$。带入坐标之后为：

$f(1) = a_0 = 2$

$f(3) = a_0 + a_1(3-1) = 2 + a_1(3-1) = 12=> a_1 = 5$

$f(4) = a_0 + a_1(4-1) + a_2(4-1)(4-3) = 2+ 5 \times 3 + a_2 \times 3 = 23 => a_2 = 2$

这样就把全部系数都求出来了，所以插值函数：$f(x) = 2 + 5(x-1) + 2(x-1)(x-3)$

编程实现

考察一下关于 $a_i$ 的方程： \[\begin{aligned}f(x_i) &= a_0 \\ &+ a_1(x_i-x_0) \\ &+ a_2(x_i-x_0)(x_i-x_1) \\ &+ ... \\ &+ a_{i-1}(x_i-x_0)(x_i-x_1)...(x_i-x_{i-2}) \\ &+ a_i(x_i-x_0)(x_i-x_1)...(x_i-x_{i-1})\end{aligned}\]

变形可得： \[\begin{aligned}a_i &= \frac{f(x_i)-a_0}{(x_i-x_0)(x_i-x_1)...(x_i-x_{i-1})} \\ &- \frac{a_1}{(x_i-x_1)...(x_i-x_{i-1})} \\ &- ... \\ &- \frac{a_2}{(x_i-x_2)...(x_i-x_{i-1})} \\ &- \frac{a_{i-1}}{x_i-x_{i-1}}\end{aligned}\]

仿照霍纳法则，再对上述公式变形：

$a_i =\displaystyle(((\frac{f(x_i)-a_0}{x_i-x_0} - a_1) \frac{1}{x_i-x_1} -a_2) \frac{1}{x_i-x_2} - ... - a_{i-1})\frac{1}{x_i-x_{i-1}}$

这样就把系数计算出来了。对于一个未知的点 $x$，如何计算 $f(x)$ 呢？仍然是仿霍纳法则

\[\begin{aligned}f(x) &= a_0 + a_1(x-x_0) + a_2(x-x_0)(x-x_1) + ... +a_n(x-x_0)(x-x_1)...(x-x_{n-1}) \\ & = ((a_n(x-x_{n-1}) + a_{n-1})(x-x_{n-2}) + ... + a_1)(x-x_0) + a_0\end{aligned}\]

Python 代码

import numpy as np

def Newton(X, Y):
    a = np.zeros_like(X)
    a = Y.copy() # 初始化 a[i] = Y[i]
    # 计算系数 a[i]
    for i in range(1, len(a)):
        for j in range(0, i):
            a[i] = (a[i] - a[j]) / (X[i] - X[j])

    # 已知系数 a[i]， 返回插值多项式 f(x)
    def f(x):
        r = a[len(a) - 1]
        for i in range(len(a) - 2, -1, -1):
            r = r * (x - X[i]) + a[i]
        return r
    return f

测试：给定一个 $5$ 次多项式，以及$6$个插值点，可以得到牛顿插值函数。再给定一个新的点，测试通过原始的多项式和插值函数计算的结果是否一样。

def test_newton():
    # f(x) 是一个 5 次多项式，表达式如下：
    # f(x) = 1 + 5 * x + 2 * x^2 + 4 * x^3 + 6 * x^4 + 3 * x^5
    a = np.array([1, 5, 2, 4, 6, 3])
    y = Polynomial(a, 3.5)  # 直接使用多项式计算 f(3.5)
    print(y)

    # 给定 6 个插值点
    X = np.array([1, 2, 5, 7, 9, 10])
    Y = np.zeros_like(X)
    for i in range(len(X)):
        Y[i] = Polynomial(a, X[i])

    f = Newton(X, Y) # 返回牛顿插值函数
    y = f(3.5) # 使用插值函数计算
    print(y)

test_newton()

牛顿插值法有一个初始化阶段，时间复杂度为 $O(n^2)$，初始化完成之后，在计算新的点对应的值时，时间复杂度为$O(n)$。而且牛顿基函数具备增量计算特性：如果已知前$n$ 个基函数，再增加 1 个插值点时，前$n$个基函数都不变，只需增加一个新的基函数即可。

差商

虽然通过以上算法可以计算出牛顿插值基的系数，但是对于系数的物理意义并没有解释，实际上第$i$ 个插值基函数的系数，是第 $i$阶差商。差商的定义是递归的，其定义如下：

零阶差商：$F[x_i] = f(x_i)$

一阶差商：$\displaystyle F[x_i,x_j] =\frac{F[x_i] - F[x_j]}{x_i-x_j}$

二阶差商：$\displaystyle F[x_i,x_k,x_j] =\frac{F[x_i,x_k] - F[x_k,x_j]}{x_i-x_j}$

...

$k$ 阶差商：$\displaystyle F[x_i,x_{i+1},...,x_{i+k}] =\frac{F[x_i,x_{i+1}, ..., x_{k-1}] - F[x_{i+1},x_{i+2}, ...,x_{i+k}]}{x_i-x_{i+k}}$

为了得到插值函数 $f(x)$和差商的关系，可以按阶从低到高考察差商函数。

考察一阶差商函数：$\displaystyle F[x, x_0]= \frac{F[x] - F[x_0]}{x-x_0}$，变形可得： \[F[x] = F[x_0] + (F[x] - F[x_0])(x-x_0)\]

由于零阶差商： $F[x] =f(x)$，替换之后可得： \[f(x) = F[x_0] + (F[x] - F[x_0])(x-x_0)\]

再考察二阶差商函数：

\[\begin{aligned}F[x, x_0, x_1] &= \frac{F[x,x_0] - F[x_0,x_1]}{x-x_1} &= \frac{\displaystyle\frac{F[x]-F[x_0]}{x-x_0} -F[x_0,x_1]}{x - x_1}\end{aligned}\]

等式左右两边同时乘以 $(x-x_0)(x-x_1)$ 之后可得：

\[F[x, x_0, x_1](x-x_0)(x-x_1) = F[x]-F[x_0] - F[x_0,x_1](x-x_0)\] 移项并用 $f(x)$ 替换 $F[x]$ 得：

\[f(x) = F[x_0] + F[x_0,x_1](x-x_0) + F[x, x_0, x_1](x-x_0)(x-x_1)\]

...

一步一步替换之后，最终可得： \[\begin{aligned}f(x) &= F[x_0] \\ &+ F[x_0,x_1](x-x_0) \\ &+ F[x_0, x_1, x_2](x-x_0)(x-x_1) \\ &+ ... \\ &+ F[x_0, x_1, ..., x_{n}](x-x_0)(x-x_1)...(x-x_{n-1}) \\ &+ F[x, x_1, ..., x_{n-1}, x_{n}](x-x_1)...(x-x_{n-1})(x-x_n)\end{aligned}\] 以上是推导过程，更严格的证明可以使用数学归纳法。

把 $x_0$ 带入以上表达式可得

\[f(x_0) = F[x_0] + F[x, x_1, ...,x_{n-1}, x_{n}](x_0-x_1)...(x_0-x_{n-1})(x_0-x_n)\]

由于零阶差商：$F[x_0] =f(x_0)$，所以 $F[x, x_1, ...,x_{n-1}, x_{n}] = 0$。最终 $f(x)$ 的表达式如下：

\[\begin{aligned}f(x) &= F[x_0] \\ &+ F[x_0,x_1](x-x_0) \\ &+ F[x_0, x_1, x_2](x-x_0)(x-x_1) \\ &+ ... \\ &+ F[x_0, x_1, ..., x_{n}](x-x_0)(x-x_1)...(x-x_{n-1})\end{aligned}\]

通过以上推导可以发现，牛顿插值法的系数 $a_k$，其实就是 $k$ 阶差商 $F[x_0, x_1, ..., x_k]$。

Python 代码

首先计算 $0$阶差商，然后通过递推公式，依次计算 $1$ 阶，$2$ 阶，$3$ 阶， ...， $n$阶差商。差商计算出来之后，仍然使用霍纳法则计算多项式的值。

def NewtonDivDiff(X, Y):
    d = np.zeros([len(Y), len(Y)])
    # 计算 0 阶差商，这里表示为 d[i][i]
    for i in range(0, len(Y)):
        d[i][i] = Y[i]

    # k 为当前差商的阶数，先计算 1 阶，然后 2 阶，依次类推
    for k in range(1, len(Y)):
        for i in range(0, len(Y) - k):
            d[i][i+k] = (d[i][i+k-1] - d[i+1][i+k]) / (X[i] - X[i+k])

    # 已知系数 a[i]， 计算多项式 f(x)
    def f(x):
        r = d[0][len(Y) - 1]
        for i in range(len(Y) - 2, -1, -1):
            r = r * (x - X[i]) + d[0][i]
        return r
    return f

可以看到，直接使用差商的定义和前面求解的方式代码是相似的，二者的时间复杂度是一样的，都是$O(n)$。直接求解时，代码更加简洁，空间复杂度为$O(n)$，而使用差商定义时，需要用一个二维的数组，空间复杂度为$O(n^2)$，要高一些。但是使用差商的定义，物理意义更加明确一些。

总结

本文介绍了一般的多项式插值、拉格朗日插值以及牛顿插值，不仅介绍了原理，还给出了Python 代码的实现，可以供读者研究使用。虽然通过定理 1可以知道，多项式插值最终的表达式是一样的，但是使用不同的插值方法其算法复杂程度是不一样的。一般多项式插值的算法复杂度最高，拉格朗日插值算法复杂度稍低，牛顿插值算法复杂度最低。$$

Poj 2663 Tri Tiling

2020-04-18T19:51:56.000Z

题目大意：

问用 $1*2$ 的多米诺骨牌覆盖 $3*n$的矩形区域，总共有多少种不同的覆盖方式？下图是矩形大小为 $3*12$ 的一个有效覆盖。

输入

有若干组输入，每组输入为一个整数 $n,(0<= n <= 30)$ 。最后一个输入为 -1 ，表示输入结束。

输出

对于每组输入，输出一个整数，表示总共可能的覆盖个数。

样例输入

样例输出

1
2
3

3
153
2131

题目分析

如果矩形区域为 $2*n$，很容易找到递推公式 \[F[n] =\begin{cases}1, & \text{if n = 0 or n = 1} \\[2ex]F[n-1] + F[n-2], & \text{if n > 1}\end{cases}\] 现在矩形区域为 $3*n$，递归关系似乎不太容易推导，但是只要坚持下去，还是可以找到递推关系的。假设总的覆盖情况有 $A[n]$种，我们先找第一层底递推关系。这里出现了一种新的情况 $B[n]$，我们还无法表示，需要继续往下推导，直到找到递归式为止。

这样我们就找到了2组递推关系： \[\begin{cases}A[n] = 2*B[n-1] + A[n-2] \\[2ex]B[n] = A[n-1] + B[n-2]\end{cases}\] 然后，只要找到初始情况 $A[n]$ 和 $B[n]$ 的值，就可以递推求解了。代码如下：

#include 

#define MAX_SIZE 32

int main() {
    int n = 0;
    int a[MAX_SIZE] = {1, 0, 3};
    int b[MAX_SIZE] = {0, 1, 0};

    for (int i = 3; i < MAX_SIZE; i++) {
        a[i] = 2*b[i-1] + a[i-2];
        b[i] = a[i-1] + b[i-2];
    }
    while (scanf("%d", &n) > 0) {
        if (n < 0) {
            break;
        }
        printf("%d\n", a[n]);
    }
    return 0;
}

题目网址：http://poj.org/problem?id=2663

编写 MySQL 插件

2018-08-20T10:36:02.000Z

众所周知，MySQL是支持插件式存储引擎的，意思是MySQL源码中开放了存储引擎相关API，只要插件实现相关的API，就能安装到MySQL中，并作为存储引擎开始工作了。其实MySQL支持多种类型的插件，比如UDF，Daemon，认证，半同步，存储引擎。其中UDF和Daemon插件都非常简单，UDF只是实现了一个在MySQL的SQL接口里可以调用的函数；而Daemon插件只要按照MySQLPlugin的声明方式，声明plugin的描述以及入口函数，从这个plugin入口函数开始，你可以编写任意的代码，比如创建一个后台线程，甚至直接调用MySQLserver的源码，访问数据表的数据。

本文主要描述在MySQL中编写Daemonplugin的方法，本文创建一个为monitor的后台plugin，后台每隔若干秒将thread_count等打印到日志中。具体代码如下：

声明MySQL插件的描述以及入口出口函数

struct st_mysql_daemon monitor_info = { MYSQL_DAEMON_INTERFACE_VERSION};
 
mysql_declare_plugin(monitor_plugin)
{
    MYSQL_DAEMON_PLUGIN,
    &monitor_info,
    "monitoring",
    "wylazy",
    "monitoring mysql thread",
    PLUGIN_LICENSE_BSD,
    monitoring_plugin_init,
    monitoring_plugin_deinit,
    0x0100, //1.0
    NULL,
    vars_system_var,
    NULL
}
mysql_declare_plugin_end;
 
/**
 * 具体的含义如下：
 *
 * struct st_mysql_plugin {
 *   int type;                  // 插件类型, 比如MYSQL_DAEMON_PLUGIN,MYSQL_STORAGE_ENGINE_PLUGIN
 *   void * info;
 *   const char * name;         // INSTALL PLUGIN用到的插件名字
 *   const char * author;       // 插件的作者
 *   const char * descr;        // 插件的描述
 *   int license;               // PLUGIN_LICENSE_GPL, PLUGIN_LICENSE_BSD
 *   int (* init)(void *);      // 插件的入口函数
 *   int (* deinit)(void *);    // 插件的退出函数
 *   unsigned int version;      // 低8个bit存minor version，其他的为major version
 *   struct st_mysql_show_var * status_vars; // 通过SHOW STATUS显示的状态信息
 *   struct st_mysql_sys_var ** system_vars; // 通过SHOW VARIABLES显示的变量信息
 *   void * __reserved;         // 在MySQL 5.1里未用到
 * }
 *
 */

其中在结构体st_mysql_plugin中，成员name是插件的名称，(* init)(void)是插件的入口函数，( deinit)(void *)是插件的退出函数。

1	install plugin monitoring so name xxxxx.so

当通过mysql命令行执行如上命令的时候，MySQL的执行过程大概为：通过插件的名称'monitoring'找到相应的插件，然后执行对应的init()函数。在uninstallplugin的时候执行deinit()函数。

因为我们的plugin想在后台执行，所以需要在init中创建一个后台执行的线程。具体代码如下：

//后台线程
pthread_handler_t monitoring(void * p) {
    char buffer[MONITOR_BUFFER];
    char time_str[20];
 
    while (1) {
        struct timeval tv;
        tv.tv_sec = waiting_seconds;
        tv.tv_usec = 0;
         
        //每隔若干秒，打印一次日志
        if (select(1, NULL, NULL, NULL, &tv) == 0) {
            get_date(time_str, GETDATE_DATE_TIME, 0);
            sprintf(buffer, "%s: %u of %lu clients connected, %lu connections made\n", 
                    time_str, thread_count, max_connections, thread_id);
            write(monitoring_file, buffer, strlen(buffer));
        } else {
            fprintf(stderr, "select return error");
            break;
        }
    }
}
 
/**
* plugin的入口
* 返回0：安装插件成功
* 返回非0：安装插件失败。mysqld内部会调用deinit()方法做清理
*/
static int monitoring_plugin_init(void *p) {
    pthread_attr_t attr;
    char monitoring_filename[FN_REFLEN];
    char buffer[MONITOR_BUFFER];
    char time_str[20];
 
    //打开日志文件
    fn_format(monitoring_filename, "monitor", "", ".log", MY_REPLACE_EXT | MY_UNPACK_FILENAME);
    unlink(monitoring_filename);
    if ((monitoring_file = open(monitoring_filename, O_CREAT|O_RDWR, 0644)) < 0) {
        fprintf(stderr, "plugin 'monitoring' could not create file %s", monitoring_filename);
        return 1;
    }
 
    get_date(time_str, GETDATE_DATE_TIME, 0);
    sprintf(buffer, "Monitoring started at %s\n", time_str);
    write(monitoring_file, buffer, strlen(buffer));
 
    //创建后台线程
    if (pthread_create(&monitoring_thread, NULL, monitoring, NULL) != 0) {
        fprintf(stderr, "Plugin monitoring could not create monitoring thread\n");
        return 1;
    }
    return 0;
}
 
//plugin的出口
static int monitoring_plugin_deinit(void * p) {
    char buffer[MONITOR_BUFFER], time_str[20];
     
    //结束后台线程
    pthread_cancel(monitoring_thread);
    pthread_join(monitoring_thread, NULL);
 
    get_date(time_str, GETDATE_DATE_TIME, 0);
    sprintf(buffer, "Monitoring stopped at %s\n", time_str);
    write(monitoring_file, buffer, strlen(buffer));
 
    //关闭日志文件
    close(monitoring_file);
    return 0;
}

在plugin启动的时候，我们在mysql的数据目录下创建了一个日志文件monitor.log，同时创建了一个后台线程打印日志，在卸载plugin的时候，停止后台线程，并关闭日志文件。

为了可以动态的控制打印日志的时间间隔，我们还在plugin中添加了一个动态的变量waiting_seconds，控制后台线程打印日志的时间间隔。

int waiting_seconds = 0;
 
//将变量与waiting_seconds 关联
static MYSQL_SYSVAR_INT(mo_waiting_seconds, waiting_seconds, PLUGIN_VAR_RQCMDARG, 
                       "waiting time before print log", NULL, NULL
                       , 5  //默认值
                       , 0  //最小值
                       , 600 //最大值
                       , 0);
                        
//将mo_waiting_seconds 添加到系统中                      
struct st_mysql_sys_var * vars_system_var[] =
{
    MYSQL_SYSVAR(mo_waiting_seconds)
    , NULL
};

按照如上的方式，即可在mysql客户端中通过如下命令动态改变打印日志的时间间隔：

1	set global monitoring_mo_waiting_seconds = 8;

编译plugin的时候还需要依赖MySQL，既可以通过依赖MySQL源代码的方式编译，又可以通过依赖mysql库的方式编译。通过这两种方式编译所支持的功能是不同的，如果直接依赖mysql源码，就可以包含mysql在sql目录下的头文件，使用THD等服务器的数据类型，甚至是访问mysqld的全局变量，调用mysqld的函数等。而依赖mysql库编译的时候，功能就相对弱一些。这里为了方便起见，选择通过依赖mysql库的方式编译，Makefile的内容如下：

CC = gcc
MYSQL_PATH = $(HOME)/programs/mysql
MYSQL_CONFIG = $(MYSQL_PATH)/bin/mysql_config
 
INCLUDES = ${shell $(MYSQL_CONFIG) --include}
# LIBS = ${shell $(MYSQL_CONFIG) --libs}
 
CPPFLAGS := -g $(CPPFLAGS) $(INCLUDES) -fPIC -DMYSQL_DYNAMIC_PLUGIN
 
SO_BASE=monitor
 
all: $(SO_BASE).so
 
$(SO_BASE).so: $(SO_BASE).o
        $(CC) -o $@ -shared $<
 
install: all
        cp $(SO_BASE).so $(MYSQL_PATH)/lib/mysql/plugin/
 
clean:
        rm -f *.o *.gch *.so

MySQL 复制中对 Load Data的处理（译）

2018-08-20T10:32:56.000Z

当MySQL执行LOAD DATAINFILE语句的时候，写binlog和其他语句有很大不同。一个LOAD DATAINFILE语句在binlog中可能变成了一个或者，若干个Event。这些Event记录了LoadData语句的附加信息，以及如何处理数据文件。

由于历史原因，一个LOAD DATA语句，可能对应4组不同的Event

1）在MySQL 3.23中，只有一个Event：Load_log_event（type codeLOAD_EVENT=6）,Load_log_event只记录了文件名，没有记录文件本身。当Slave遇到Load_log_event时，Slave会再和Master建立一个连接，让Master把文件发送过来。这有一个缺点，就是binlog不是自包含的。如果在Master上文件已经被删除了，或者Slave连不上Master，文件就会传输失败。

2）在MySQL 4.0.0中，文件本身也会记录到binlog中。一个LOAD DATAINFILE语句会对应多个Event，Create_file_log_event (type codeCREATE_FILE_EVENT = 8), Append_block_log_event (type codeAPPEND_BLOCK_EVENT = 9), Execute_load_log_event (type codeEXEC_LOAD_EVENT = 10), and Delete_file_log_event (type codeDELETE_FILE_EVENT = 11)，Event序列如下：

Create_file_log_event：传输1次

Append_block_log_event：传输0次，或者多次

Execute_load_log_event：传输1次（成功时）

Delete_file_log_event：传输1次（失败时）

Create_file_log_event也包含了LOAD DATAINFILE选项，这其实是一个设计上的缺陷。因为只有当遇到Execute_load_log_event时才能真正执行LOADDATA语句。所以当Slave收到Create_file_log_event时，会把它写入临时文件，只有当遇到Execute_load_log_event时才从这个临时文件构造完整的LOADDATA INFILE语句。

LOADDATA语句在LOAD一个大文件的时候，会把一个大文件分块传，每个块一个Append_block_log_event。块大小不超过2^17= 131072Bytes。

Create_file_log_event告诉Slave创建一个临时文件，并把文件的第一个块也写入临时文件（Create_file_log_event携带第一个文件块）。接下来会有若干Append_block_log_event，告诉Slave把它们追加写到这个临时文件。Execute_load_log_event告诉Slave把临时文件加载到数据表里面，或则是Delete_file_log_event告诉Slave不要加载临时文件，并把临时文件删除。当LOADDATA语句在Master上执行失败时，Master会记录一条Delete_file_log_event。

3）MySQL 4.0.0新引入了NEW_LOAD_EVENT类型，typecode = 12。

NEW_LOAD_EVENT和以前的LOAD_EVENT差不多，不过支持了更长的分隔符。原始的LOAD_DATA_EVENT只用了一个字节表示分隔符（FIELDSTERMINATEDBY）。后来在某个版本里，binlog格式支持了多字节作为分隔符，所以EVENT_TYPE也加入了支持。

4）MySQL 5.0.3里面又新添加了两个EVENT_TYPE。

Begin_load_query_log_event（typecode = 17）

Execute_load_query_log_event （typecode = 18）

一个LOAD DATA语句的Event序列可能如下：

Begin_load_query_log_event：传输1次

Append_block_log_event：传输0次，或者多次

Execute_load_log_event：传输1次（成功时）

Delete_file_log_event：传输1次（失败时）

在这个新序列中，Begin_load_query_log_event和Append_block_log_event几乎是相同的，Execute_load_log_event包含了LOADDATA语句的文本。（而在4.0里面，LOADDATA语句被记录在Create_file_log_event里面）。

这样就不在需要一个临时文件存放LOAD DATAINFILE的参数了，但是还是要有一个临时文件存放要被LOAD的数据。

示例部分请参照原文

原文地址：http://dev.mysql.com/doc/internals/en/load-data-infile-events.html

MySQL 复制协议

2018-08-20T10:14:38.000Z

概述

这里只介绍MySQL 的异步复制协议（MySQL5.5增加了半同步复制功能，感兴趣的同学可以自己研究）。

MySQL的主从复制工作模式大致为，主库将执行的语句写入Binlog，由Dump线程将Binlog发送到从库的IO线程，IO线程将日志保存为Relay-Log，再由从库的SQL线程重放执行。本文主要研究主库Dump线程将Binlog发送到从库IO线程所使用的协议。

通信流程

首先从库向主库发起TCP连接，当连接建立完成后，主库向从库发送第一条数据包（InitialHandshakePacket），包含协议版本，服务器的版本，flag，以及认证相关信息。然后从库将用户名和加密的密码等认证信息发送给服务器。这一步的认证过程和普通MySQL客户端登录到MySQL服务器没什么区别。

然后从库向主库发送若干SELECT语句，获取服务器的时间戳，以及服务器版本等信息。

接着从库向主库发送一条COM_BINLOG_DUMP命令，开始复制过程。

当主库收到DUMP命令后，将Binlog中的Event一个接一个的发送到从库。

MySQL 一般数据包

每个MySQL数据包都是由的Header和Payload组成（包括Initial HandshakePacket在内的所有数据包）。Header由4个字节组成，3个字节的长度标识（FixedLengthIntegerhttp://dev.mysql.com/doc/internals/en/integer.html#packet-Protocol::FixedLengthInteger），1个字节的序号。Playoad长度由Header部分指定。

握手包

当从库与主库建立TCP连接后，主库向从库发送第一个数据包，包含了服务器的版本，以及服务器的能力，格式如下：

DUMP命令

当从库连接到主库以后，从库向主库发送一条DUMP命令，开始复制过程。DUMP命令的结构如下图所示，第一字节的命令标识为DUMP命令的标识12。随后，主库会将Binlog的Event一个接一个的发送给从库，第一个为RotateEvent，这个Event包含了下一个Event对应的binlog的文件名称。第二个Event为FormatDescriptionEvent，这个Event包含了所有Event的描述信息。MySQL协议里，在每个Event之前，都会有一个字节的00字段，这个字节在MySQL协议里叫做OK-Byte。参考：http://dev.mysql.com/doc/internals/en/com-binlog-dump.html

Event头字段

主库向从库发送的Event数据包也由Event头和Event消息体组成。从MySQL4.0开始，Event头的长度固定为19字节。Event头的结构如下图所示：

Rotate Event消息

Rotate Event比较简单，只包含一个Post Header和下一个Binlog的文件名称

Format Description Event消息

FDE消息包含2个字节的Binlog版本，在MySQL5.0以后，Binlog版本是4；50字节的MySQL服务器版本，如果版本长度不足50，则后面补零；MySQL的Binlog支持26中Event，每种Event还可能有字节的Header，在FDE消息的最后，包含了各种Event对应的EventHeader长度，每种Event Header长度对应一个字节。

Query Event消息

QueryEvent消息如上图所示，其中从“slave_proxy_id”到“2字节的状态变量长度”之间为QueryEvent的Header，共占13字节（对应FDE消息中的描述）。剩余部分为Payload，其中状态变量和Schema的长度由Header所指定。然后是一个字节的“00”，最后是SQL查询语句。

其他Event

请参考：http://dev.mysql.com/doc/internals/en/binlog-event.html

举例分析

场景为，主库在数据库db上的InnoDB数据表t上执行SQL 语句insertintot(val)values(‘a’)，其中在表t上带有自增主键。然后从库连接主库，开始复制过程。DUMP请求 从库向主库发起DUMP命令前4个字节是MySQL数据包的头：

第1~3个字节：1b 00 00 为本数据包payload部分的长度27

第4个字节：00为包的序号

剩下的27个字节（从第5字节到第31字节）是DUMP命令部分：

第5个字节：12为COM_BINLOG_DUMP命令的标识

第6~9个字节：6a 00 00 00 为Binlog开始的位置

第10~11个字节：00 00 为两个字节的Flags

第12~15个字节：02 00 00 00 为从库的Server-id

第16~31个字节：Binlog的文件名

主库回复Binlog

主库收到DUMP命令后，向从库发送Event信息：如上图，MySQL主库回复了6个部分的数据包，分别是6个Event：

Rotate Event

Format Description Event

Query Event: BEGIN

Intvar Event: #因为表t上带有自增主键，所以通过额外的IntvalEvent来保证主从在自增主键上的一致性

Query Event: insert into t(val) values(‘a’)

Xid Event: COMMIT

Event标识对照表

参考：http://dev.mysql.com/doc/internals/en/binlog-event-type.html

Hex	Event Name
0x00	UNKNOWN_EVENT
0x01	START_EVENT_V3
0x02	QUERY_EVENT
0x03	STOP_EVENT
0x04	ROTATE_EVENT
0x05	INTVAR_EVENT
0x06	LOAD_EVENT
0x07	SLAVE_EVENT
0x08	CREATE_FILE_EVENT
0x09	APPEND_BLOCK_EVENT
0x0a	EXEC_LOAD_EVENT
0x0b	DELETE_FILE_EVENT
0x0c	NEW_LOAD_EVENT
0x0d	RAND_EVENT
0x0e	USER_VAR_EVENT
0x0f	FORMAT_DESCRIPTION_EVENT
0x10	XID_EVENT
0x11	BEGIN_LOAD_QUERY_EVENT
0x12	EXECUTE_LOAD_QUERY_EVENT
0x13	TABLE_MAP_EVENT
0x14	WRITE_ROWS_EVENTv0
0x15	UPDATE_ROWS_EVENTv0
0x16	DELETE_ROWS_EVENTv0
0x17	WRITE_ROWS_EVENTv1
0x18	UPDATE_ROWS_EVENTv1
0x19	DELETE_ROWS_EVENTv1
0x1a	INCIDENT_EVENT
0x1b	HEARTBEAT_EVENT
0x1c	IGNORABLE_EVENT
0x1d	ROWS_QUERY_EVENT
0x1e	WRITE_ROWS_EVENTv2
0x1f	UPDATE_ROWS_EVENTv2
0x20	DELETE_ROWS_EVENTv2
0x21	GTID_EVENT
0x22	ANONYMOUS_GTID_EVENT
0x23	PREVIOUS_GTIDS_EVENT

MySQL 5.6 中Binlog Group Commit 实现

2018-08-20T10:03:21.000Z

背景

在MySQL5.1中，如果配置项sync_binlog=1，并且innodb_flush_log_at_trx_commit=1，那么MySQL的TPS将会下降到几十每秒，完全不可接受。这是因为InnoDB提交事务时，不仅需要将REDO刷盘，还需要将Binlog刷盘，每个事务都需要2次sync操作。机械磁盘的IOPS也就为几百的水平，所以InnoDB的性能极差。

这个问题，在MySQL 5.6中得到了比较好的解决。在了解Binlog GroupCommit之前，需要先了解MySQLBinlog和InnoDB的两阶段提交。MySQL为了保证主库和从库的数据一致性，就必须保证Binlog和InnoDB的一致性，即如果一个事务写入了Binlog，InnoDB中就必须提交该事务；相反，如果一个事务没有写入Binlog，InnoDB就不能提交该事务。做法是：

InnoDB先执行Prepare，将Redo日志写磁盘。然后再将Binlog写磁盘，最后InnoDB再执行Commit，将事务标记为提交。这样，可以保证Binlog和InnoDB的一致性。具体原因，可以分三种情况考虑：

果MySQL在InnoDBPrepare阶段Crash。MySQL在启动时做崩溃恢复，InnoDB会回滚这些事务，同时由于事务也没有写到binlog，InnoDB和Binlog一致。
如果MySQL在Binlog写磁盘阶段Crash。MySQL在启动时做崩溃恢复，在恢复时会扫描未成功提交的事务，和当时未成功关闭的binlog文件，如果事务已经Prepare了，并且也已经在Binlog中了，InnoDB会提交该事务；相反，如果事务已经在Prepare中了，但是不在Binlog中，InnoDB会回滚该事务。结果就是InnoDB和Binlog一致。
如果MySQL在InnoDB执行Commit阶段Crash，和情况2类似，由于事务已经成功Prepare，并且存在Binlog文件中，InnoDB在崩溃恢复时，仍然会提交该事务，确保Binlog和InnoDB一致。

MySQL在实现时，将mysql_bin_log作为2阶段提交的协调者，可以参考MySQL的代码：sql/handler.cc:ha_commit_trans。内部分别调用tc_log->prepare()和tc_log->commit()实现2阶段提交，这里的tc_log就是MySQL源码中的全局对象mysql_bin_log。伪代码如下：

ha_commit_trans()
  --> tc_log->prepare()
        --> ha_prepare_low()
              for () {
                ht->prepare() //存储引擎 hton->prepare()
              }
  --> tc_log->commit()
        --> MYSQL_BINLOG::ordered_commit()//做Group Commit
              --> MYSQL_BINLOG::process_commit_stage_queue() //Group Commit的Commit阶段，会调用InnoDB提交
                    --> ha_commit_low()
                          for () {
                            ht->commit(); //存储引擎 hton->commit()
                          }

两阶段提交的参与者分别为：binlog_hton和innobase_hton，它们实现了MySQL的存储引擎接口。如果你再深入调研一下，就会发现binlog_hton在2阶段提交时，啥也没干。所有binlog操作都是由协调者mysql_bin_log干的，包括GroupCommit，也都是在mysql_bin_log中实现的。下面我们就来分析一下，mysql_bin_log是如何做到GroupCommit的，也就是上面的函数ordered_commit()。

实现

和Level DB的Group Commit类似，MySQL的GroupCommit也是维护了一个队列，第一个进入队列的线程就是Leader，负责写binlog。其他的线程是Flower，Flower不需要操作，只需要等待完成的通知即可。但是如果只用一个队列的话，在GroupCommit进行中的时候，后来的线程就得等待，还可以进一步优化，MySQL把这个过程分裂成了3个阶段：FLUSH_STAGE，SYNC_STAGE和COMMIT_STAGE。它们像流水线一样工作，每个阶段都会涉及一批事务，它们组成一个Group。可以这样理解，事务刚提交时，处于FLUSH阶段，同时处于FLUSH阶段的事务为一个队列，形成一个Group，只有队列的头，Leader在干活，FLUSH完成以后，Leader进入SYNC阶段（所有的Flower也都进入SYNC阶段）。这时，新提交的事务可以进入FLUSH阶段，它们又会产生一个新的Leader，如此不断的推进。每个阶段都需要一个队列，所以MySQL在GroupCommit时，需要3个队列。如下图所示，队列通过thd->next_to_commit连接：

MySQL把队列命名为Mutex_queue，这是一个C++的类，定义如下：

class Mutex_queue {
    THD *m_first; //队列的头指针
    THD **m_last; //队列尾指针的地址。如果队列为空，相当于&m_first，否则，相当于&last->next_to_commit
    mysql_mutex_t m_lock;
};

在GroupCommit时，事务的状态首先转为FLUSH_STAGE，然后为SYNC_STAGE，最后为COMMIT_STAGE。在状态转变时，都会调用如下函数Stage_manager::enroll_for：

bool Stage_manager::enroll_for(StageID stage, THD *thd, mysql_mutex_t *stage_mutex) {
 
  // 只有队列的第一个元素为Leader，其他情况均为false
  bool leader= m_queue[stage].append(thd);
 
  // The stage mutex can be NULL if we are enrolling for the first stage.
  if (stage_mutex)
    mysql_mutex_unlock(stage_mutex);
 
  /**
   * 如果不是Leader的话，只需等待Leader完成操作的通知
   * Leader完成以后，会设置thd->transaction.flags.pending = false
   */
  if (!leader) {
    mysql_mutex_lock(&m_lock_done);
 
    while (thd->transaction.flags.pending)
      mysql_cond_wait(&m_cond_done, &m_lock_done);
 
    mysql_mutex_unlock(&m_lock_done);
  }
 
  return leader;
}

从上面的代码可以看出，Flower线程什么也不干，所有的事情都要靠Leader去做。上述代码有一个细节需要注意，先把自己添加到队列中，然后再释放锁stage_mutex，这个在后面会有解释。下面逐个分析一下，在每个阶段Leader线程所做的事情。

FLUSH阶段

因为InnoDB在事务执行过程中，要保证事务的原子性。对于INSERT/UPDATE/DELETE操作，会先将Binlog写事务日志（binlog_cache_mngr），事务提交时，也就是在FLUSH阶段，再把事务日志复制到binlog文件中，然后通知Dump线程去发送binlog，由于要写Binlog文件，这个过程需要锁定LOCK_log锁。这也就是FLUSH阶段要做的事情，可参考函数：MYSQL_BIN_LOG::process_flush_stage_queue。

在这个阶段，Leader线程遍历遍历FLUSH_STAGE链表，依次取出thd对应的事务日志，并写到binlog的IOCACHE中，然后flushIOCACHE。代码如下：

int MYSQL_BIN_LOG::ordered_commit(THD *thd, bool all, bool skip_commit)
{
   //...
    
  /*
    Stage #1: flushing transactions to binary log
 
    While flushing, we allow new threads to enter and will process
    them in due time. Once the queue was empty, we cannot reap
    anything more since it is possible that a thread entered and
    appointed itself leader for the flush phase.
  */
  if (change_stage(thd, Stage_manager::FLUSH_STAGE, thd, NULL, &LOCK_log))
  {
    DBUG_PRINT("return", ("Thread ID: %lu, commit_error: %d",
                          thd->thread_id, thd->commit_error));
    DBUG_RETURN(finish_commit(thd));
  }
 
  THD *wait_queue= NULL;
  flush_error= process_flush_stage_queue(&total_bytes, &do_rotate, &wait_queue);
 
  my_off_t flush_end_pos= 0;
  if (flush_error == 0 && total_bytes > 0)
    flush_error= flush_cache_to_file(&flush_end_pos);
     
  /*
    If the flush finished successfully, we can call the after_flush
    hook. Being invoked here, we have the guarantee that the hook is
    executed before the before/after_send_hooks on the dump thread
    preventing race conditions among these plug-ins.
  */
  if (flush_error == 0)
  {
    const char *file_name_ptr= log_file_name + dirname_length(log_file_name);
    DBUG_ASSERT(flush_end_pos != 0);
    if (RUN_HOOK(binlog_storage, after_flush,
                 (thd, file_name_ptr, flush_end_pos)))
    {
      sql_print_error("Failed to run 'after_flush' hooks");
      flush_error= ER_ERROR_ON_WRITE;
    }
 
    signal_update();
    DBUG_EXECUTE_IF("crash_commit_after_log", DBUG_SUICIDE(););
  }
}

在这个过程中有一个问题需要考虑，就是：一方面，Leader线程从链表中取出thd，将日志写binlogIOCACHE，另一方面，新提交的事务仍然会往FLUSH_STAGE链表中添加thd。如果MySQL的并发事务比较多，Leader线程写binlog的速度，小于新事务的提交速度，可能会造成事务停留在FLUSH阶段的时间过长。所以MySQL通过配置项binlog_max_flush_queue_time来控制这个时间，如果Leader线程在取THD时，发现超时了，Leader线程就将队列整个端走，再做处理。这样，当前已经处于FLUSH阶段的事务还用现在的Leader，而新提交的事务，会用新的Leader。因为LOCK_log锁的存在，所有新的Leader只能等当前的FLUSH执行完成才能开始执行。具体代码如下：

int MYSQL_BIN_LOG::process_flush_stage_queue(my_off_t *total_bytes_var,
                                         bool *rotate_var,
                                         THD **out_queue_var)
  bool has_more= true;
  THD *first_seen= NULL;
  while ((max_udelay == 0 || my_micro_time() < start_utime + max_udelay) && has_more)
  {
    std::pair<bool,THD*> current= stage_manager.pop_front(Stage_manager::FLUSH_STAGE);
    std::pair<int,my_off_t> result= flush_thread_caches(current.second);
    has_more= current.first;
    total_bytes+= result.second;
    if (flush_error == 1)
      flush_error= result.first;
    if (first_seen == NULL)
      first_seen= current.second;
  }
    /*
    Either the queue is empty, or we ran out of time. If we ran out of
    time, we have to fetch the entire queue (and flush it) since
    otherwise the next batch will not have a leader.
   */
  if (has_more)
  {
    THD *queue= stage_manager.fetch_queue_for(Stage_manager::FLUSH_STAGE);
    for (THD *head= queue ; head ; head = head->next_to_commit)
    {
      std::pair<int,my_off_t> result= flush_thread_caches(head);
      total_bytes+= result.second;
      if (flush_error == 1)
        flush_error= result.first;
    }
    if (first_seen == NULL)
      first_seen= queue;
  }
}

写完binlogIOCACHE后，还要将IOCACHE写文件，最后通知Dump线程读取binlog，FLUSH阶段完成。

SYN C阶段

SYNC阶段的任务比较简单,但是却非常耗时，就是将binlog文件sync到磁盘。这个操作由配置项sync_binlog= N来控制每隔N个binlog只sync一次。如果sync_binlog=1的话，MySQL在SYNC阶段不释放锁LOCK_log，而Dump线程为了读取binlog，必须先申请锁LOCK_log，所以可以保证主库先将binlogsync到磁盘，然后Dump线程才能读取Binlog，确保即使在主库操作系统Crash情况下，仍然保证主库和从库数据一致。其他情况会释放LOCK_log锁，这时Dump线程可以读取并发送binlog，同时新提交的事务也可以进入FLUSH阶段。所以SYNC阶段需要考虑有多个FLUSH阶段的Leader同时进入SYNC阶段的情况。MySQL将这些Leader合并为一个新的Leader，做法是：FLUSH阶段的Leader线程进入SYNC阶段前，需要将自己加入到SYNC_STAGE队列中，第一个进入SYNC_STAGE队列的线程为SYNC阶段的Leader，后进入的为Flower。由Leader完成后续操作，Flower线程只需等待通知即可。回忆前面的函数enroll_for()，在状态转变时，Leader先把自己添加到SYNC队列中，然后才释放锁stage_mutex，这里就是LOCK_log，其他事务才可以进入FLUSH阶段，这可以保证，第一个进入FLUSH阶段的Leader，在SYNC阶段仍然是Leader，同样，在COMMIT阶段还是Leader。这对于保证Binlog和InnoDB提交顺序一致非常重要。 SYNC阶段的代码如下：

int MYSQL_BIN_LOG::ordered_commit(THD *thd, bool all, bool skip_commit)
{

   // ...

  /*
    Stage #2: Syncing binary log file to disk
  */
  bool need_LOCK_log= (get_sync_period() == 1); //只有sync_binlog=1，才不释放LOCK_log锁

  /*
    LOCK_log is not released when sync_binlog is 1. It guarantees that the
    events are not be replicated by dump threads before they are synced to disk.
  */
  //不管怎样，都要申请锁LOCK_sync
  if (change_stage(thd, Stage_manager::SYNC_STAGE, wait_queue,
                   need_LOCK_log ? NULL : &LOCK_log, &LOCK_sync))
  {
    DBUG_PRINT("return", ("Thread ID: %lu, commit_error: %d",
                          thd->thread_id, thd->commit_error));
    DBUG_RETURN(finish_commit(thd));
  }
  THD *final_queue= stage_manager.fetch_queue_for(Stage_manager::SYNC_STAGE);
  if (flush_error == 0 && total_bytes > 0)
  {
    DEBUG_SYNC(thd, "before_sync_binlog_file");
    std::pair<bool, bool> result= sync_binlog_file(false);
    flush_error= result.first;
  }

  if (need_LOCK_log)
    mysql_mutex_unlock(&LOCK_log);

  //...
}

COMMIT 阶段

经过前面2个阶段，Binlog已经顺利sync到磁盘了，COMMIT阶段的任务就是让InnoDB存储引擎完成Commit。COMMIT阶段的逻辑通过MySQL的配置项binlog_order_commits控制。如果配置项为1，MySQL要保证InnoDB的提交顺序和Binlog的写入顺序一致，这个特性在InnoDB热备中使用。下面只分析binlog_order_commits=1的情况。

MySQL释放锁LOCK_sync，申请锁LOCK_commit。由于释放锁LOCK_sync，所以需要考虑多个线程同时完成SYNC阶段的情况，处理逻辑和SYNC阶段类似，将当前SYNC阶段的Leader合并，关于Leader的产生和SYNC阶段类似。Leader产生以后，遍历THD，完成事务提交，等所有事务都提交完成以后，再遍历thd，设置thd->transaction.flags.pending=false，最后广播通知Flower线程提交完成，自此，GroupCommit完成。

代码如下：

int MYSQL_BIN_LOG::ordered_commit(THD *thd, bool all, bool skip_commit)
{
   //...
    
  /*
    Stage #3: Commit all transactions in order.
 
    This stage is skipped if we do not need to order the commits and
    each thread have to execute the handlerton commit instead.
 
    Howver, since we are keeping the lock from the previous stage, we
    need to unlock it if we skip the stage.
   */
  if (opt_binlog_order_commits)
  {
    if (change_stage(thd, Stage_manager::COMMIT_STAGE,
                     final_queue, &LOCK_sync, &LOCK_commit))
    {
      DBUG_PRINT("return", ("Thread ID: %lu, commit_error: %d",
                            thd->thread_id, thd->commit_error));
      DBUG_RETURN(finish_commit(thd));
    }
    THD *commit_queue= stage_manager.fetch_queue_for(Stage_manager::COMMIT_STAGE);
    DBUG_EXECUTE_IF("semi_sync_3-way_deadlock",
                    DEBUG_SYNC(thd, "before_process_commit_stage_queue"););
    process_commit_stage_queue(thd, commit_queue);
    mysql_mutex_unlock(&LOCK_commit);
    /*
      Process after_commit after LOCK_commit is released for avoiding
      3-way deadlock among user thread, rotate thread and dump thread.
    */
    process_after_commit_stage_queue(thd, commit_queue);
    final_queue= commit_queue;
  }
  else
    mysql_mutex_unlock(&LOCK_sync);
 
 /* Commit done so signal all waiting threads */
  stage_manager.signal_done(final_queue);    
  
 //...
}

Leader产生以后，Leader线程通过next_to_commit遍历thd，对每个thd完成事务提交ha_commit_low(),代码如下：

void
MYSQL_BIN_LOG::process_commit_stage_queue(THD *thd, THD *first)
{
  for (THD *head= first ; head ; head = head->next_to_commit)
  {
    if (head->commit_error == THD::CE_NONE)
    {
      excursion.try_to_attach_to(head);
      bool all= head->transaction.flags.real_commit;
      if (head->transaction.flags.commit_low)
      {
        /* head is parked to have exited append() */
        DBUG_ASSERT(head->transaction.flags.ready_preempt);
        /*
          storage engine commit
        */
        if (ha_commit_low(head, all, false))
          head->commit_error= THD::CE_COMMIT_ERROR;
      }
       
    }
        /*
      Decrement the prepared XID counter after storage engine commit.
      We also need decrement the prepared XID when encountering a
      flush error or session attach error for avoiding 3-way deadlock
      among user thread, rotate thread and dump thread.
    */
    if (head->transaction.flags.xid_written)
      dec_prep_xids(head);
  }
}
 
class Stage_manager {
public:
  //遍历THD，标记提交完成，并广播通知
  void signal_done(THD *queue) {
    mysql_mutex_lock(&m_lock_done);
    for (THD *thd= queue ; thd ; thd = thd->next_to_commit)
      thd->transaction.flags.pending= false;
    mysql_mutex_unlock(&m_lock_done);
    mysql_cond_broadcast(&m_cond_done);
  }
}

LevelDB 的 GroupCommit 实现

2018-08-20T09:55:42.000Z

LevelDB是BigTable中对SSTable的实现，是一个高性能的单机版Key-Value存储库。LevelDB在一个进程中，允许多个线程同时读写一个SSTable。本文主要关注多个线程同时对LevelDB的写操作，LevelDB只支持2中写操作，即Put和Delete。由于LevelDB支持WAL，也就是说每次写操作都会记录日志。多个线程同时执行时，LevelDB内部通过同步确保写操作串行执行，那么是不是每次操作的日志都要单独占用一次IO呢。在LevelDB中不会，LevelDB通过GroupCommit将并发线程中的日志通过一次写完成。

LevelDB对GroupCommit的支持是通过数据结构WriteBatch（db/write_batch.h）实现的。WriteBatch是C++中的一个class，在其的结构中封装了一个std::string类型的数据成员rep_，LevelDB的所有操作都先保存到rep_中，然后才会执行相应的操作。WriteBatch相当于是对操作的暂存，是后续真正执行写操作的参数，简化的结构为

class WriteBatch {
  private:
    std::string rep_;  // See comment in write_batch.cc for the format of rep_
}

其中rep_的格式如下，SeqNumber是操作的序号，只增不减。Count是当前WriteBatch中Record的个数。而Record，对于Put操作而言，Record域的Type值是1，而且同时有Key和Value域；对于Delete操作而言，Record域的Type值是0，而且只有Key域，没有Value域。其中SeqNumber，Count，KeyLength和DataLength都是按照小端模式填充的。

其中一次写操作的代码如下

// Default implementations of convenience methods that subclasses of DB
// can call if they wish
Status DB::Put(const WriteOptions& opt, const Slice& key, const Slice& value) {
  WriteBatch batch; //构造WriteBatch对象，初始情况下SeqNumber和Count域都是0
  batch.Put(key, value); //把操作、key和value填充到batch.rpl_中
  return Write(opt, &batch); //执行操作
}
 
Status DB::Delete(const WriteOptions& opt, const Slice& key) {
  WriteBatch batch;  //构造WriteBatch对象，初始情况下SeqNumber和Count域都是0
  batch.Delete(key); //把操作和key填充到batch.rpl_中
  return Write(opt, &batch); //执行操作
}

Batch的实现如下：

void WriteBatch::Put(const Slice& key, const Slice& value) {
  WriteBatchInternal::SetCount(this, WriteBatchInternal::Count(this) + 1);  //将Count域增加1
  rep_.push_back(static_cast<char>(kTypeValue)); //填充操作的Type，kTypeValue的值恒为1
  PutLengthPrefixedSlice(&rep_, key); //填充Key（包括KeyLength和KeyData）
  PutLengthPrefixedSlice(&rep_, value); //填充Value（包括ValueLength和ValueData）
}

void WriteBatch::Delete(const Slice& key) {
  WriteBatchInternal::SetCount(this, WriteBatchInternal::Count(this) + 1); //将Count域增加1
  rep_.push_back(static_cast<char>(kTypeDeletion));//填充操作的Type，kTypeDeletion的值恒为0
  PutLengthPrefixedSlice(&rep_, key); //填充Key（包括KeyLength和KeyData）
}

拿Put("key-0000000001","This is a testvalue")操作举例，填充完成以后，batch内容如下：

前8个字节为SeqNumber，因为在调用Write()以前，还没有生成SeqNumber，所以它的值为全0，接下来的4个字节是Count域，后面分别为Key域和Value域。在本例中，KeyData的长度为14，ValueData的长度为20。

可以看到，Put和Delete操作都是先构造一个WriteBatch对象，然后按照WriteBatch的格式填充好相应的内容，然后调用Write()执行操作。LevelDB的GroupCommit就是在这个Write()中实现的。

下面到了最核心的Write()函数：

Status DBImpl::Write(const WriteOptions& options, WriteBatch* my_batch) {
  Writer w(&mutex_);
  w.batch = my_batch; //将操作放到w中
  w.sync = options.sync;
  w.done = false;
 
  MutexLock l(&mutex_); //互斥
   
  //将操作放到writes_中，writes_的类型为std::dequeue
  writers_.push_back(&w); 
   
  //由于在后面，mutex_可能提前释放，在多线程环境下，有可能有多个writer同时进入队列，就会形成GroupCommit
  while (!w.done && &w != writers_.front()) { 
    w.cv.Wait();
  }
  if (w.done) { //有可能被其他的线程在GroupCommit时执行完成
    return w.status;
  }
 
  // May temporarily unlock and wait.
  Status status = MakeRoomForWrite(my_batch == NULL); //有可能调用Compaction
  uint64_t last_sequence = versions_->LastSequence(); //生成SeqNumber
  Writer* last_writer = &w;
  if (status.ok() && my_batch != NULL) {  // NULL batch is for compactions
   
    //将writes_中所有等待的batch全部提取出来，放到一个batch中，就是这里的updates
    WriteBatch* updates = BuildBatchGroup(&last_writer); 
     
    WriteBatchInternal::SetSequence(updates, last_sequence + 1); //设置SeqNumber
    last_sequence += WriteBatchInternal::Count(updates);
 
    // Add to log and apply to memtable.  We can release the lock
    // during this phase since &w is currently responsible for logging
    // and protects against concurrent loggers and concurrent writes
    // into mem_.
    {
      mutex_.Unlock(); //提前释放mutex
       
      //将日志写文件，GroupCommit时，并发的Put和Delete可能只需要一次日志写操作
      status = log_->AddRecord(WriteBatchInternal::Contents(updates)); 
       
      bool sync_error = false;
      if (status.ok() && options.sync) {
        status = logfile_->Sync(); 
        if (!status.ok()) {
          sync_error = true;
        }
      }
      if (status.ok()) {
        status = WriteBatchInternal::InsertInto(updates, mem_); //将操作更新到memtable中
      }
      mutex_.Lock();
      if (sync_error) {
        // The state of the log file is indeterminate: the log record we
        // just added may or may not show up when the DB is re-opened.
        // So we force the DB into a mode where all future writes fail.
        RecordBackgroundError(status);
      }
    }
    if (updates == tmp_batch_) tmp_batch_->Clear();
 
    versions_->SetLastSequence(last_sequence); //更新SeqNumber
  }
 
  //将本次批量操作的writer都标记为done
  while (true) {
    Writer* ready = writers_.front();
    writers_.pop_front();
    if (ready != &w) {
      ready->status = status;
      ready->done = true;
      ready->cv.Signal();
    }
    if (ready == last_writer) break;
  }
 
  // Notify new head of write queue
  if (!writers_.empty()) {
    writers_.front()->cv.Signal();
  }
 
  return status;
}

Write()的逻辑如上代码注释，可以简单理解为并发执行时，每个线程都先将Put/Delete操作都放到一个dequeue中，如下图：那个最先把操作放到dequeue的线程（这里为Thread1），把dequeue中的所有操作合并为一个大的WriteBatch，并将这个WriteBatch写入日志，然后更新memtable，执行完成后把本次batch的任务标记为done，唤醒其他线程，其他线程被唤醒后发现任务已经为done了，就不用再执行了。