一、基本概念

重点掌握第一章,关于求解不考,离散连续都不考,编码定理放在编码讲


无论无噪信道还是有噪信道,只要信息传输率 小于信道容量 ,总可以找到一种编码方法,使得编码后的信息传输率 可以任意接近信道容量 ,即 ,且信道产生的错误译码概率任意小。

反之,如果 在任何信道上都不可能实现错误译码概率任意小的无失真的传输,或者说,要实现错误译码概率任意小,在任何信道上传输都必然产生失真。

传送每秒 25 帧的图像就能满足人类通过视觉感知信息的要求,而不必占用更大的信息传输率。人类的听觉对大多数人只能听到几千赫兹到十几千赫兹,对于经过专业训练的音乐家,一般也不过听到 的声音。

因此,实际应用要求在保证一定质量前提下,在信宿近似地再现信源输出的信息,或者说在保真度准则下允许信源输出存在一定的失真。

本章需要解决的问题:对于给定的信源,即给定信源熵 ,在允许失真的失真条件下,信源熵所能压缩的极限,即信息率失真函数 理论是多少?

信息率失真理论是研究信源熵的压缩问题,采用研究信道的方法,即在数学上讲信源熵压缩看成通过一个信道,寻找在保真度准则下的最小的平均互信息。在这里,我们把压缩算法看成是抽象信道。

信息率失真理论是信号量化,模数转换、频带压缩和数据压缩的理论基础,在图像处理、数字通信等领域得到广泛应用。

1. 失真函数

1.1 定义

设离散信源

经信道传输后的输出序列为

用一个非负的函数 表示信源发出符号 ,接收端收到的符号为 的失真度的定量描述。称此函数为「失真函数」。失真函数的具体数值和函数关系是人为定义的,是根据需要选取的对于失真度的定量描述。将所有的 排列起来,用矩阵表示为

称此矩阵为「失真矩阵」。假定离散矢量信源 长符号矢量序列为

其中第 个符号 的取值为 ,经过离散无记忆信道 传输后,接受端收到的 长符号矢量序列为

其中第 个符号 的取值为 ,失真函数定义为

矢量失真函数矩阵共有 个元素

例题

例1

设信源符号序列为 ,接收端收到符号序列为 规定失真函数为

求失真矩阵

例 2

此时的失真矩阵为

特点:当 时, 取值一样,表示没有误差,失真度为 时,失真一样,为常数 。当 时,失真函数称为汉明失真函数。

例 3

平方误差失真函数

特点:一般用于表示由幅度变化引起的失真,幅度失真越大,引起的错误越严重。

例 4

假定离散矢量信源 ,输出矢量序列为 ,其中 的取值为 ,经信道传输后的输出为 ,其中 的取值 ,定义失真函数 ,求矢量失真矩阵

解:

由矢量失真函数的定义得

由此可以得到

2. 平均失真度

假定离散信源为

经信道传输后的输出序列为 ,失真矩阵为

2.1 定义

由于 都是随机变量,所以失真函数 也是随机变量,称失真函数的数学期望为「平均失真」,记为

平均失真 是对给定信源分布 在给定转移概率分布为 的信道中传输时的失真的总体量度。若信道输出和经过信道传输到接收短的 长符号序列为

其中第 个位置上的符号取值分别为

则平均失真度为

其中 是第 个位置上符号的平均失真。如果矢量信源是离散无记忆 次扩展信源,且矢量信道是离散无记忆 次扩展信道,则每个位置上符号的平均失真 相等,且等于矢量平均失真

3. 信息率失真函数

3.1 失真许可信道

若预先规定的限定失真度为 ,则称信源压缩后的平均失真度 不大于 的准则为保真度准则,即保真度准则满足 。将满足保真度准则的所有信道称为「失真度 许可信道」,也称 允许的试验信道,记为

对于离散无记忆信道,相应有

3.2 信息率失真函数

允许信道 中可以寻找一个信道 ,使给定的信源经过此信道传输时,其信道传输率 达到最小,定义为「信息率失真函数,也称为率失真函数,即

注意, 并不是在函数表达式中出现,而是在定义域中出现。对于离散无记忆信道,率失真函数可写成

其中

  • 是信源符号概率分布,
  • 是转移概率分布,
  • 是接收端收到符号概率分布,

信息率失真函数的意义:对于给定的信源,在满足保真度准则 的前提下,信息率失真函数 信息率允许压缩到的最小值

4. 信息率失真函数的性质

4.1 定义域

由于平均失真度 是失真函数 的数学期望,且 ,所以平均失真度 是非负的,即 ,故其下界

,表示信源不允许任何失真存在。当信源要求无失真地传输,则信息传输率至少等于信源输出的信息量,即信息熵,即

能否达到下限零,与单个符号的失真函数有关。 的求法应该是这样:对于每一个 找对应的 ,使 最小。再对信源求概率平均,即数学期望,即

显然,当失真矩阵每一行都有零元素时,可达到零。当失真矩阵每一行都没有零元素时,可用坐标变换使其每一行都有零元素。故一般可认为

是在约束条件下 的最小值,所以 ,是非负函数,其最小值应为零。取满足 的所有 中的最小的,定义为 定义域中的上限 是满足 的所有平均失真度 中的最小值。因此可以下结论:

那么应该如何求出 呢?令 是使 的全体转移概率集合,所以

由于 的充要条件是 统计独立,即对于所有的 ,满足

所以有

由于信源概率分布 和失真函数 已经给定,因此求 相当于寻找 使上式右端最小。如果选取 最小时的分布 ,而对其它的 选取 ,则有

二元信源

给出失真度矩阵

的定义域和值域

解:

中每一行都有零元素,故 ,且 。接下来求解 ,根据公式

我们先分别算出 对应的

由此得到

此时

失真矩阵每行都有零元素,得

最重要的部分已经讲完了

4.2 下凸性

是关于 的下凸函数。

假定 时两个失真度, 是满足保真度准则 前提下使得 达到极小的信道,即

可以证明 是满足保真度准则 的信道,进一步可以证明

这表明 的下凸函数

4.3 递减性

在区间 上是严格递减函数。

的连续函数,由 的定义可知 是连续函数。若 ,则满足保真度 的试验信道集合 ,在一个较大范围内求极小值一定不大于在其中一个小范围内求极小值,即

显然是非增函数。可以证明上述不等式中的等号不成立,所以 是严格递减函数

4.4 一般曲线

由上面的性质,我们可以得到离散信源率失真函数 的一般曲线。当限定失真度 时,率失真函数 时信息压缩所允许的最低限度。若信息率压缩至 ,则失真度 必大于

5. 限失真信源编码定理

不详细说,直接给出一个实际性

设一离散平稳无记忆信源的输出随机变量序列为 ,若该信源的信息率失真函数是 ,并选定有限的失真函数。对于任意允许平均失真度 ,和任意小的 ,当信息率

只要信源序列长度 足够长,一定存在一种编码方式 ,使译码后的平均失真度 。反之,若 ,则无论用什么编码方式,必有

即:译码平均失真大于允许失真。称此定理为「限失真信源编码定理」或「香农第三定理」。证明略。该定理可推广到连续平稳无记忆信源的情况。

6. 对信息编码定理的统一理解

定长信源无失真编码定理:

变长信源无失真编码定理(香农第一定理):

保真度准则下的信源编码定理(香农第三定理):

从编码信息率的角度,当 时,则信源编码无失真失真可控


以下不考

二、离散信源的信息率失真函数

这部分不要求,笔记就不做了

对于离散信源来说,求信息率失真函数 与求信道容量 类似,是一个在有约束条件下求平均互信息极值的问题,只是约束条件不同。 是求平均互信息的条件极大值 而 是求平均互信息的条件极小值。

一致信源的概率分布 和失真函数 ,就可以确定信源的信息率失真函数 ,它是在约束条件,即保真度准则下,求极小值问题。

一般情况下难于求得闭式解,常采用参量表示法,或采用迭代算法求解。

1. 参量表示法

设离散信源的输入序列为

输出序列为

字符传输的失真函数为 ,采用如下简记

信息率失真函数 的计算为在约束条件下

的极小值问题。应用拉格朗日乘法,引入乘子 ,将上述条件极值问题化为无条件极值问题。令

的曲线要求掌握。

对于一个信源来说,不均匀的时候时容易压缩的。

2. 二元及等概离散信源的信息率失真函数

2.1 二元离散信源

2.2 等概离散信源

上式中第一项是等概率信源的熵,即无失真传送信源所必须的信息率,后两项则是由于容忍一定失真可以压缩的信息率。
对于同一失真度D,n越大,R(D)越大,压缩率(可能性)越小;反之,
对于同一失真度D,n越小,R(D)越小,压缩率(可能性)越大。
当n=2,α=1时,R(D)=H(p)-H(D)=lnn -H(D)
如果信源的符号数目为n,那么在满足保真度准则下,符号数越多,信源的可压缩性越小;反之,符号数越少,信源的可压缩性越大。

只需要记住这两个结论,不需要掌握计算

不同 值对应的等概离散信源信息率失真函数图像可以表示为

3. 信息率失真函数的性质

4. 保真度准则下的信源编码定理

三、连续信源的信息率失真函数

一般情况下,信息在传输过程中必然会存在一定的噪声和干扰,使得信源的消息在传输过程中存在一定的误差和失真。对于连续信源,在传输过程中总会有波形失真,连续信源的信息率失真理论就是在一定意义上定量分析信号的失真程度。

本节主要讨论连续信源的信息率失真函数,连续信源的率失真理论与离散信源情况基本相同。

1. 连续信源信息率失真函数的参量表达式

1.1 平均失真度

定义: 设连续信源(随机变量),其概率密度,设另一变量 ,且之间失真函数是某一非负的二元函数,则平均失真度定义为

式中 为信道特征,在 确定的时候满足

1.2 信息率失真函数

设所有试验信道的集合为 ,在满足一定失真度 时,连续信源的信息率失真函数为

式中 表示下界,试验集合为 。分析:连续信源的信息率失真函数具有离散信源的信息率失真函数的性质。由于 的求解是一个求极值问题。

2. 高斯信源的信息率失真函数

设高斯信源 的均值为 ,方差为 ,定义失真函数为平均误差失真。求上述条件下 实际上

有两种方法可求(略):

  • 应用拉格朗日算子,与离散的算法类似。
  • 用反向信道。

其结果是

所有的连续信源都有这种特性。,否则会出现无穷大,即只有无穷大的信道容量才能保证无失真地传输,这实际上是不可能的。也就是对于连续信源来说,在传递信息中必然产生失真。这与离散的情况是不同的。此性质从下面的 函数曲线中也能看得出来。

3. 信息率失真函数与信息价值

直接不讲了

4. 信道容量与信息率失真函数的比较

4.1 信道容量

平均互信息的上凸性。固定信道,求解 的分布

信道容量 一旦求出以后,就只与信道转移概率分布(密度)有关,反映信道特性,与信源特性无关;

研究信道容量是为了解决通信的可靠性问题,是信息传输的理论基础,通过信道编码增加信息的冗余度来实现。

4.2 信息率失真函数

平均互信息的下凸性。固定信源概率分布,求解信道的情况。

信息率失真函数一旦求出后,就只与信源概率分布(密度)有关,反映信源特性,与信道特性无关。

信息率失真函数则是为了解决通信的有效性问题,是信源压缩的理论基础,通过信源编码减少信息的冗余度来实现。