随机过程
数学常识
概率论
条件概率
条件概率是指在已知某一事件发生的条件下,另一个事件发生的概率。形式化定义为:
全概率公式
全概率公式用于计算一个事件的概率,该事件可以通过多个互斥事件的并集来表示。形式化定义为:
其中,
贝叶斯公式
贝叶斯公式用于更新事件的概率,基于新的信息。形式化定义为:
概率分布和概率密度
离散随机变量
离散随机变量的概率分布函数(Probability Mass Function, PMF)定义为:
连续随机变量
连续随机变量的概率密度函数(Probability Density Function, PDF)定义为:
这个定义是需要熟悉的,有些时候往往会通过算一个极限来求出 PDF。
这在实际计算中经常用到。
累积分布函数
累积分布函数(Cumulative Distribution Function, CDF)定义为:
联合分布
对于多个随机变量的联合分布,定义为:
对于连续随机变量的联合分布,定义为:
概率密度函数为:
如果
概率密度上也有
当然联合分布也有
随机变量函数的分布
对于随机变量
比如
然后我们可以通过联合分布来计算:
数字特征
期望
期望(Expectation)是随机变量的加权平均值,定义为:
对于高纬度随机变量,可以使用多重积分:
性质
- 线性性质:对于常数
和 ,有 。(对任意随机变量 和常数 成立) - 独立性:如果
和 独立,则 。
全期望公式
对于随机变量
内层的
方差
方差(Variance)是随机变量与其期望之间的偏离程度,定义为:
协方差
协方差(Covariance)是两个随机变量之间的线性关系,定义为:
其实方差是协方差的特例,即
他们与期望有着密切的关系:
记忆:协方差=乘积的期望 - 期望的乘积
协方差矩阵
对于多维随机变量
这在高维高斯过程中非常重要。
自相关函数
随机过程的自相关函数定义为
协方差函数
随机过程的协方差函数定义为
平稳性
宽平稳
定义:
且
即自相关函数只与时间差
也就是说,要证明是宽平稳的,只需要证明自相关函数只与时间差
严平稳
定义:
即联合分布函数不随时间平移而改变。
母函数
定义:
令
的函数为概率母函数(Probability Generating Function)。
也有别名加生成函数和形式级数。
性质
已知随机变量
则有以下性质:
- 归一性
- 期望公式
- 方差公式
概率母函数的性质:计算两个离散随机变量和的分布
概率母函数除了描述单个随机变量的分布外,还有一个非常有用的性质 —— 可用于计算两个独立离散随机变量之和的分布。
定理:
设
则它们之和
也就是说:独立随机变量的和的概率母函数,等于各自概率母函数的乘积。
特征函数
定义
特征函数(Characteristic Function)是随机变量分布的一个重要工具,定义为:
其中,
其实就是对随机变量
性质
- 特征函数与概率分布一一对应
- 若 $X1, X_2 … X_n
$
\phi{X1 + X_2 + … + X_n}(\omega) = \phi{X1}(\omega) \cdot \phi{X2}(\omega) \cdots \phi{X_n}(\omega)
\Gamma(z) = \int_0^{\infty} t^{z-1} e^{-t} \, dt \quad \text{Re}(z) > 0
\Gamma(n) = (n - 1)!
\Gamma(1) = 0! = 1, \quad \Gamma(2) = 1! = 1, \quad \Gamma(3) = 2! = 2
\Gamma\left(\frac{1}{2}\right) = \sqrt{\pi}
\Gamma\left(\frac{1}{2}\right) = \int_0^{\infty} x^{-1/2} e^{-x} \, dx = \sqrt{\pi}
B(x, y) = \int_0^1 t^{x-1}(1 - t)^{y - 1} \, dt
B(x, y) = \frac{\Gamma(x)\Gamma(y)}{\Gamma(x + y)}
\Gamma(z) \approx \sqrt{2\pi} \, z^{z - \frac{1}{2}} e^{-z}
\int_{-\infty}^{+\infty} e^{-x^2} \, dx = \sqrt{\pi}
\int_{-\infty}^{+\infty} e^{-a x^2} \, dx = \sqrt{\frac{\pi}{a}}, \quad a > 0
\int_{-\infty}^{+\infty} x^k e^{-x^2} \, dx = 0, \quad k \text{ 为奇数}
\int_{-\infty}^{+\infty} x^{2n} e^{-x^2} \, dx = \frac{(2n-1)!!}{2^n} \sqrt{\pi}, \quad n \in \mathbb{N}
\left(\sum{k=1}^n a_k\right)^2 = \sum{k=1}^n ak^2 + 2 \sum{1 \leq k < l \leq n} a_k a_l.
A v = \lambda v
\text{det}(\lambda I - A) = 0
(A - \lambda_i I)v = 0
A = P D P^{-1}
A = A^T
A = Q D Q^T
P(X{n+1} = i{n+1} | Xn = i_n, X{n-1} = i{n-1}, \ldots, X_0 = i_0) = P(X{n+1} = i_{n+1} | X_n = i_n)
P(X{k+n} = j | X_k = i) = P{ij}^{(n)}
P{ij} = P(X{k+1} = j | X_k = i)
P{ij}^{(n + m)} = \sum{k} P{ik}^{(n)} P{kj}^{(m)}
P^{(n + m)} = P^{(n)} P^{(m)}
P^{(n)} = P^n
P = \begin{pmatrix}
p{00} & p{01} & \cdots & p{0n} \
p{10} & p{11} & \cdots & p{1n} \
\vdots & \vdots & \ddots & \vdots \
p{n0} & p{n1} & \cdots & p_{nn}
\end{pmatrix}
X{n+1} = f(X_n, Z{n+1})
di = \gcd{n : P{ii}^{(n)} > 0}
f{ij}^{(n)} = P(X_n = j, X{n-1} \neq j, \ldots, X_1 \neq j | X_0 = i)
f{ii}=\sum{n=1}^{\infty} f_{ij}^{(n)} = 1
\sum{n=0}^{+\infty} p{ii}^{(n)}=\frac{1}{1-f_{ii}}
\sum{n=1}^{\infty} p{ii}^{(n)} = \infty
\sum{n=1}^{\infty} p{ii}^{(n)} < \infty
T_i = \min{n \geq 1 : X_n = i | X_0 = i}
\mui = E[T_i] = \sum{n=1}^{\infty} n f_{ii}^{(n)}
\lim{n \to \infty} p{ii}^{(n)} = 0
\lim{n \to \infty} p{ii}^{(n)} = \frac{f_{ii}}{\mu_i}
\lim_{n \to \infty} P(X_n = i) = p_i
P(Xn=j)) = \sum{i} p_{ij}^{(n)} P(X_0=i)
\pi = \pi P
P(N(t)=k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}, \quad k = 0, 1, 2, \dots
\lambda = \lim_{t \to 0} \frac{N(t)}{t}
E[N(t)] = Var[N(t)] = \lambda t
M(t) = E[e^{tN(t)}] = e^{\lambda t(e^t - 1)}
P(N(t1) = k_1, N(t_2) = k_2, \ldots, N(t_n) = k_n) = \prod{i=1}^n P(N(ti) - N(t{i-1}) = ki - k{i-1})
P(N(t) = m | N(s) = k) = \frac{\lambda^{m-k} (t-s)^{m-k} e^{-\lambda(t-s)}}{(m-k)!}
f_{S_n}(t) = \lambda e^{-\lambda t} \frac{(\lambda t)^{n-1}}{(n-1)!}, \quad t \geq 0
f{S_n}=\lim{\Delta t \to 0} \frac{P(t \le Sn \le t + \Delta t)}{\Delta t}= \lim{\Delta t \to 0}\frac{P(N(t)=n - 1)P(N(t+\Delta t) - N(t) = 1)}{\Delta t} = e^{-\lambda t} \frac{(\lambda t)^{n-1}}{(n-1)!}\lambda
f_{S_1 \ldots S_n}(t_1, t_2, \ldots, t_n) = \lambda^ne^{-\lambda t_n}
f_{S_1, S_2, \ldots, S_n | N(t) = n}(t_1, t_2, \ldots, t_n) = \frac{n!}{t^n}, \quad 0 \leq t_1 < t_2 < \cdots < t_n \leq t
f_{S_n}(t) = \lambda e^{-\lambda t}, \quad t \geq 0
P(N_1(t) + N_2(t) = k) = \frac{(\lambda_1 t + \lambda_2 t)^k e^{-(\lambda_1 + \lambda_2)t}}{k!}, \quad k = 0, 1, 2, \ldots
E[X_{(k)}] = \frac{k}{n+1}
f{X{(1)}, X{(2)}, \ldots, X{(n)}}(x_1, x_2, \ldots, x_n) = n! f_X(x_1) f_X(x_2) \cdots f_X(x_n)
(S1, S_2, \ldots, S_n) \overset{d}{=} (U{(1)}, U{(2)}, \ldots, U{(n)})
E[\sum_{k=1}^n g(S_k)|N(t)=n] = nEg(U)
\sum_{i=1}^{N(t)} (t - S_i)
E(\sum{i=1}^{N(t)} (t - S_i))= E{N(t)}(E(\sum_{i=1}^{N(t)} (t - S_i)|N(t)))
E(\sum_{i=1}^{N(t)} (t - S_i)|N(t)=n) = n E_U(t - U)= n(t - \frac{t}{2}) = \frac{nt}{2}
E(\sum{i=1}^{N(t)} (t - S_i)) = E{N(t)}(\frac{N(t)t}{2}) = \frac{t}{2} E(N(t)) = \frac{t}{2} \lambda \lambda t = \frac{\lambda t^2}{2}
\lambda(t) = \lim_{\Delta t \to 0} \frac{N(t + \Delta t) - N(t)}{\Delta t}
P(N(t) = k) = \frac{[\int_0^t \lambda(s) ds]^k }{k!}e^{-\int_0^t \lambda(s) ds}, \quad k = 0, 1, 2, \ldots
P(N(t2)-N(t_1)=k)=\frac{[\int{t1}^{t_2} \lambda(s) ds]^k }{k!}e^{-\int{t_1}^{t_2} \lambda(s) ds}
\int_{t_1}^{t_2}\lambda(t)dt
Y(t) = \sum_{i=1}^{N(t)} Y_i
\phiY(t) = exp\left(\lambda t [\phi{Y_1}(u) - 1] \right)
P(N(t) = k)=\int0^\infty P(N(t) = k | \Lambda = \lambda) f\Lambda(\lambda) d\lambda =\int0^\infty \frac{[\lambda t]^k e^{-\lambda t}}{k!} f\Lambda(\lambda) d\lambda
P(N(t) = n) = F{S_n}(t)-F{S_{n+1}}(t)
Fn(t) = \int_0^t f_T(s) \cdot F{n-1}(t-s) \, ds
\mathcal{L}{F_{S_n}(t)} = \mathcal{L}{f_T(t)}^n
P(X(t+s) = j | X(t) = i, X(t+s_1) = i_1, \ldots, X(t+s_k) = i_k) = P(X(t+s) = j | X(t) = i)
P(X(t+s) = j | X(s) = i) = P(X(t) = j | X(0) = i)
P_{ij}(t) = P(X(t) = j | X(0) = i)
P(t) = \begin{pmatrix}
P{00}(t) & P{01}(t) & P{02}(t) & \cdots \
P{10}(t) & P{11}(t) & P{12}(t) & \cdots \
P{20}(t) & P{21}(t) & P_{22}(t) & \cdots \
\vdots & \vdots & \vdots & \ddots
\end{pmatrix}
\sum{j} P{ij}(t) = 1, \quad \forall i
P(t+s) = P(t)P(s)
其中
这意味着当时间趋近于零时,转移概率矩阵趋近于单位矩阵,即在极短的时间内,状态不会发生变化。
Q矩阵
如果满足标准条件,那么可以定义极限
其中
补充
后面我们经常会计算
- 如果
,则 $q{ii} = \lim{t \to 0} \frac{P_{ii}(t) - 1}{t}$ - 如果
,则 $q{ij} = \lim{t \to 0} \frac{P_{ij}(t)}{t}$
保守性
对于标准有限状态连续时间马尔科夫链,
这表示在任意时刻,系统必须处于某个状态。
停留时间定理
设连续时间马尔科夫链满足标准性和保守性条件,
的分布是参数为 $q{ii} P(\tau > t) = e^{-q{ii} t}$。 - 条件分布
= $\frac{q{ij}}{q{ii}} i j$ 的概率与速率矩阵的元素有关。 与 在给定 的条件下是独立的。
嵌入链
从连马中只抽出跳转了和跳去哪了的信息,形成一个离散时间马尔科夫链,称为嵌入链
它的转移概率为
Kolmogorov方程
Kolmogorov方程描述了连续时间马尔科夫链的状态转移概率矩阵
前向Kolmogorov方程
后向Kolmogorov方程
转移概率的收敛级数形式
如果
这个级数形式可以用于计算转移概率矩阵,尤其在
极限行为
平稳分布
平稳分布是指当时间趋近于无穷大时,马尔科夫链的状态分布趋于一个固定的分布。设
这表示在平稳分布下,状态的分布不随时间变化。
同样也可以用速率矩阵
这表示在平稳分布下,状态的转移率矩阵
定理
对于不可约的连续时间马尔科夫链
如果
如果无解,则不存在平稳分布。
应用
纯生过程
纯生过程是一种特殊的连续时间马尔科夫链,其中状态空间为非负整数,且状态只能增加或保持不变。其在
根据定义可以算出
可验证
只有平凡解,即
因此纯生过程没有平稳分布。
生灭过程
生灭过程是一种连续时间马尔科夫链,其状态空间为非负整数
设生灭过程的出生率为
其在
其中
根据定义,
矩阵形式为:
平稳分布
设平稳分布为
对于
对于
这可以简化为细致平衡条件:
递推可得:
由归一化条件
当且仅当级数 $\sum{n=1}^{\infty} \prod{k=0}^{n-1} \frac{\lambdak}{\mu{k+1}}$ 收敛时,存在平稳分布。
高斯过程
定义
设随机过程
服从
单元高斯分布
设随机变量
其中
多元高斯分布
设随机变量
其中
特征函数
多元高斯过程的特征函数为:
当结论记下来就好
性质
线性性
设
这意味着对一个多元高斯分布它的线性组合以及它的任何一个子向量均服从高斯分布
独立性
设
有
如果
例子
设
解
设
其中
则
要使得
这意味着
因此
布朗运动
定义
标准布朗运动(Brownian motion)是一个特殊的高斯过程,满足以下条件
,即初始位置为零。 - 平稳增量,即
- 对任意
, 服从正态分布
性质
- 期望
- 方差
- 协方差
这里尤其需要注意协方差的计算,有一个常用的技巧
因为
然后我们可以利用技巧得到
这就让我们可以用独立增量的性质来计算协方差。
- 布朗运动几乎处处连续,但是几乎处处不可微。