误差函数 Erf(x) 与正态分布

目录

\( \) \( \) \( \) \( \) \( \) \( \)

误差函数

误差函数 \( \text{Erf} \; (x) \) 定义为积分 [4] \[ \displaystyle \text{Erf} \; (x) = \dfrac{2}{\sqrt{\pi}} \int_0^{x} \; e^{-t^2} \; dt \] 可以使用不同编程语言轻松编写程序来计算 \( \text{Erf} \; (x) \)。
下方展示了使用 Google 表格生成的 \( \text{Erf} (x) \) 在区间 \( x \in [-3 \; , \; 3] \) 内的值表及其图表(可能需要向下滚动)。

从定义和图表可以看出,\( \text{Erf} \; (x) \) 是一个奇函数,因此
\( \qquad \text{Erf} \; (-x) = -\text{Erf} \; (x) \)



正态分布累计函数

随机变量 \( X \) 的正态密度函数,其均值为 \( \mu \),标准差为 \( \sigma \),表示为 [1] [2] [3] [4]
\[ f_{X}(x) = \dfrac{1}{\sigma \sqrt{2 \; \pi }} \; e^{-\frac{1}{2} \left(\dfrac{x -\mu}{\sigma} \right)^2 } \qquad (I) \]
其图表如下所示。

正态分布图表

\( f_{X}(x) \) 的累计分布函数表示为
\[ F_{X}(x,\mu,\sigma) = \int_{-\infty}^{x} f_{X}(t) dt \]
当 \( f_{X}(t) \) 被 \( (I) \) 中定义的 \( f_{X} \) 替换时,我们得到 \[ \displaystyle F_{X}(x,\mu,\sigma) = \dfrac{1}{\sigma \sqrt{2 \; \pi }} \int_{-\infty}^{x} \; e^{-\frac{1}{2} \left(\dfrac{t -\mu}{\sigma} \right)^2 } dt \qquad (II) \]
\( F_{X}(x,\mu,\sigma) \) 用于计算概率,如下所示:
\( \qquad P( X \lt x) = F_{X}(x,\mu,\sigma) \)
\( \qquad P( b \le X \le a) = F_{X}(a) - F_{X}(b) \)




\( F_{X}(x,\mu,\sigma) \) 和 \( \text{Erf} \; (x) \) 之间的关系

现在我们将推导上面定义的正态分布的累计分布函数与 \[ F_{X}(x,\mu,\sigma) = \dfrac{1}{\sigma \sqrt{2 \; \pi }} \int_{-\infty}^{x} \; e^{-\frac{1}{2} \left(\dfrac{t -\mu}{\sigma} \right)^2 } dt \qquad (III) \] 和误差函数定义为 \[ \displaystyle \text{Erf} \; (x) = \dfrac{2}{\sqrt{\pi}} \int_0^{x} \; e^{-t^2} \; dt \qquad (IV) \]

令 \( z = \dfrac{t-\mu}{\sigma \sqrt 2} \),因此 \( \dfrac{dz}{dt} = \dfrac{1}{\sigma \sqrt 2} \) 或 \( dz = \dfrac{1}{\sigma \sqrt 2} dt \)
将上述代入 \( (III) \) 并写为 \[ \displaystyle F_{X}(x,\mu,\sigma) = \dfrac{1}{ \sqrt{\pi} } \int_{-\infty}^{\dfrac{x-\mu}{\sigma \sqrt 2}} \; e^{-z^2 } dz \]
将积分区间分开,写成如下形式: \[ \displaystyle F_{X}(x,\mu,\sigma) = \dfrac{1}{ \sqrt{\pi} } \left( \int_{-\infty}^{0} \; e^{-z^2 } dz + \int_{0}^{\dfrac{x-\mu}{\sigma \sqrt 2}} \; e^{-z^2 } dz \right) \qquad (V) \]

现在使用高斯积分,其表达式为 \[ \int_{-\infty}^{+\infty} e^{-x^2} dx = \sqrt {\pi}\] 由于 \( e^{-x^2} \) 是偶函数,我们有 \[ \int_{-\infty}^{0} e^{-x^2} dx = \int_{0}^{\infty} e^{-x^2} dx \] 使用高斯积分可写为 \[ \int_{-\infty}^{0} e^{-x^2} dx = \int_{0}^{\infty} e^{-x^2} dx = \dfrac{\sqrt {\pi}}{2}\] 代入 \( \qquad (V) \) 并写为 \[ \displaystyle F_{X}(x,\mu,\sigma) = \dfrac{1}{ \sqrt{\pi} } \left( \dfrac{\sqrt {\pi}}{2} + \int_{0}^{\dfrac{x-\mu}{\sigma \sqrt 2}} \; e^{-z^2 } dz \right) \qquad (V) \] 使用 \( (IV) \) ,我们写成 \( \displaystyle \int_0^{\left(\dfrac{x - \mu}{\sigma\sqrt 2}\right)} \; e^{-t^2} \; dt = \dfrac{\sqrt{\pi}}{2} \text{Erf} \; \left(\dfrac{x - \mu}{\sigma\sqrt 2}\right) \),将其代入 \( (V) \) 中得到

\[ \displaystyle F_{X}(x,\mu,\sigma) = \dfrac{1}{ \sqrt{\pi} } \left( \dfrac{\sqrt {\pi}}{2} + \dfrac{\sqrt{\pi}}{2} \text{Erf} \; \left(\dfrac{x - \mu}{\sigma\sqrt 2}\right) \right) \qquad (V) \] 简化并写出 \( F_{X}(x,\mu,\sigma) \) 和 \( \text{Erf} \; (x) \) 之间的关系如下: \[ \boxed {\displaystyle F_{X}(x,\mu,\sigma) = \dfrac{1}{2 } \left( 1 + \text{Erf} \; \left(\dfrac{x - \mu}{\sigma\sqrt 2}\right) \right)} \] 因此,正态分布的累计函数 \( F_{X}(x,\mu,\sigma) \) 可以通过误差函数 \( \text{Erf} (x) \) 进行计算。


更多参考资料和链接