信道时信息传输的媒介或通道。比如电缆、光纤、无线电波等物理通道或媒介,从空间上把信息从一地传送到另一地。也可以是磁盘、光盘等存储媒介,是一种时间上的传输通道。
实际的信道可繁可简,如滤波器的输入输出、国际通信信道。信息论中研究的信道,其输入输出位置取决于研究者的兴趣。通信中的物理信道,如无线、光纤、电缆、水等,其传输的信号特性不同,技术手段不同;
信息论不研究这些信道特性和技术,而是对其抽象,建立起与各种通信相适应的信道模型。信息论研究的是信道的输入和输出之间的关系,信道的具体构成可以看成是一个黑匣子。由此,信道可以看成是一个变换器,它将输入事件
信道的数学模型可以表示为
框图可表示为
表示了在输入为
根据输入输出事件的时间特性和集合的特点可以分为
根据信道输入和输出的个数可以分为
根据信道接入的不同可以分为
按照统计特性可以分为
按照记忆特性可以分为
设有两个离散的符号消息集合
信源发出符号信息通过信道传递给信宿,如下图
信源
这里的
这里
当信宿接到集合
那么,该如何定义信道提供的信息量呢?
在收到信息前,接受者掌握的信息是直接根据先验概率中的
我们可以认为,由于
来表示信息产生的不确定度减少。或写成
值得一提的是,这里的定义选择的是「“收到信息前”减去“收到信息后”」来对信息量进行定义,收信者所获得的信息量随先验概率的增加而减少,随后验概率的增加而增加。
对于两个离散的随机事件
互信息量的单位与自信息量的单位一样取决于对数的底。当对数底为 2 时,互信息量的单位为比特 bit。
事件
当事件
此性质的意义是:当两个事件统计独立时,其相互信息量为零,这也就是说不能从观测一个事件中获得有关另一个事件的任何信息。
在给定观测数据
当后验概率
当后验概率小于先验概率时,互信息量为负值。
互信息量为负是不利的。造成不利的原因是由于信道干扰引起的。由于干扰,使估计变得更加困难,即,不确定性增加了。
任何两个事件之间的互信息量不可能大于其中的任一事件的自信息量
这说明自信息量
同理有
某月二月份天气的构成的信源为
某一天有人告诉你:“今天不是晴天”。问从这句话里,我们得到多少信息量?
解:令
此信息对于
联合集
联合集
这里,我们把
因此有
信息的获取,是事件出现的不断叠加。上式表明,一对事件
某人
下午
到最后一通电话,我们就获取完了所有信息。事件
因为
因为其他两个条件概率
前面已经算出
表明,事件
互信息量
「输入
互信息量
这种测度应该是从整体的角度出发,在平均意义上度量每通过一个符号流经信道的平均信息量。作为一个测度,它不能是随机量,而是一个确定的量。为了解决这个问题,我们定义平均互信息量。
互信息量
称 $ I(X;Y) $ 是 $ Y $ 对 $ X $ 的平均互信息量,简称「平均互信息」,也称平均交互信息量或交互熵。平均互信息
其中
当
也叫做对称性。该性质表示从集
当且仅当
利用不等式
等号成立的条件是,对于
当互信息量
类似的,我们得到三个重要结论。从信源角度来说,我们有
即:平均互信息量等于
从信宿角度来说,我们有
即:平均互信息量等于
代入
这是从「系统的上方」来思考问题。系统还未开启时,
这个性质比较重点
该性质是研究信道容量的理论基础
该性质是研究率失真函数的理论基础
单符号离散信道的输入和输出都是单个随机变量,其数学模型如下图:
信道的输入随机变量取值于符号集
信道的传递概率为
信道矩阵为
且满足
即矩阵中每一行之和为
二元对称信道的
信道的转移概率图为下图所示,求平均互信息量
求平均互信息量
解:
这个信道表示正确率为
得到一步转移概率矩阵
由
从而推出
从而有
其中,
从而
平均互信息量如下图
考虑二元信道
正确概率为
信道矩阵可以表示为
解:
从而有
从而得到
因此
当信源为等概分布时,
平均互信息
其单位为「比特/符号」或「奈特/符号」。而相应的概率分布
信道容量
信道中平均每个符号所能传送的信息量。称为「信息传输率」,记为
如果平均传输一个符号为
某一个固定信道的最大的信息传输速率定义为「信道容量」,用字母
下面介绍几种特殊离散信道的信道容量
离散无噪信道的输出
称
损失熵等于信源
称
噪声熵等于输出信源
损失熵来自于
一个输入对应多个互不相交的输出的离散信道称为「无损信道」。
当
每列只有一个非零元素,可以推出其后验概率矩阵,非零即一。信道的后向概率
故损失熵为
在这类信道中,因为信源发生符号
其信道容量为
无噪信道的一个输出对应各个互不相交的输入,可以理解成压缩。
当
前向概率为
因此噪声熵
于是,可以求出确定信道的平均互信息为
其信道容量为
达到此类信道的信道容量的概率分布是使信道输出分布为等概分布的输入分布。
无损无噪信道的输入和输出是一一对应关系,如右图所示。
当
信号的前向概率
信道的噪声熵和损失熵均为零。故无损确定信道的平均互信息为
它表示信道输出端接收到符号
信道矩阵具有很强对称性的特殊信号称为「对称信道」。
最重要的
若一个离散无记忆信道的信道矩阵中,每一行都是其它行的同一组元素的不同排列,则称此类信道为「离散输入对称信道」。此时称矩阵的行是可排列的,如
若一个离散无记忆信道的信道矩阵中,每一列都是其它列的同一组元素的不同排列,则称此类信道为「离散输出对称信道」。此时称矩阵的列是可排列的,如
若一个离散无记忆信道的信道矩阵中,按照信道的输出集
例如信道矩阵
当划分的子集只有一个时,信道是关于输入和输出对称的,这类信道称为「离散对称信道」。此时矩阵具有可排列性:矩阵的行和列都是可排列的。
例如信道矩阵
定理 :若一个离散对称信道具有
其中,
引理:对于对称信道,只有当信道输入分布为等概分布时,输出分布才能为等概分布。
根据引理,对称信道的最佳输入分布为等概分布。
如果一个
其中,
公式不用记,只要记输入等概,每个子集等概这个条件即可。(但是为什么都用这个公式在算啊,搞得我很慌……)
设某离散对称信道的信道矩阵为
该信道的信道容量为
此例表明,在该对称信道中,每个符号平均能够传输的最大信息量为
信道矩阵
求其信道容量
解:分为两个子系统
设输入等概,即
若信道输入符号和输出符号个数相同,且信道矩阵为
式中
均匀信道的信道容量为
证明:
其中,
二元对称信道的平均互信息为
如图所示
平均互信息
因而二元对称信道的信道容量
信道容量
当
只要求掌握到最后的「再根据式」
一般的离散无记忆信道达到信道容量的输入概率分布应满足的条件应该是怎么样的?
根据信道容量的定义,在信道固定的条件下,对所有可能的输入概率分布
平均互信息
故可以用拉格朗日乘子法来计算这个条件极值。首先引进一个新的函数
其中
可求得一般信道容量
因为
可写为
求偏导得
其中
对该式两边乘以
也就是说
即为平均互信息的最大值。
令
设有一般离散信道,它有
时,
称为「条件互信息」。此定理非常重要,它表示信道输出端接收到符号集
该定理只给出了达到信道容量时,最佳输入概率分布应满足的条件,并没有给出输入符号的最佳概率分布值,因而也没有给出信道容量的数值。
该定理还隐含着,达到信道容量的最佳分布并不一定是唯一的。在一些特殊情况下,常常可以利用这一定理找出所求的输入概率分布和信道容量。
令
根据信道矩阵可求出
从而求出信道容量
再根据
可求出对应的输入概率分布
一般离散无记忆信道的数学模型基本上与输入和输出为单符号的简单离散无记忆信道的模型相同。不同的是其输入和输出不是单个随机变量
其概率空间为
离散无记忆信道的
根据信道的无记忆特性,有
其中:
且满足
这意味着
分析二元无记忆对称信道的二次扩展信道。
二元无记忆对称信道的输入和输出随机变量
共有
共有
同样,还可以求出其他
从而求得二元对称信道的二次扩展信道的矩阵为
因此二次对称信道的二次扩展信道如下图所示
根据平均互信息的定义,可以求出
其中
不关心
若信道的输入和输出分别是
或者
则存在
式中,
不关心
若信道的输入和输出分别是
或者
则存在
式中,
根据定理一和定理二可知,当信源和信道都是无记忆的。此时,
这相当于
如果信道的输入随机序列
并且具有同一种概率分布,信道输出随机序列
并具有同一概率分布。则
于是得
式中
此式表明,当信源是无记忆时,对于无记忆的
其中,
由于输入随机序列
信道 I 和信道 II 都是离散无记忆信道
类似于上网多跳。信道二需要从系统的角度来看。
信道一
信道二
信道一的传递概率为
信道二的传递概率为
显然,信道二的传递概率一般与前面的符号
级联信道中的平均互信息满足以下关系
等号成立的充要条件,对所有
该定理中,等号成立的条件是
如果输出随机变量
若随机变量
该定理表明,通过串联信道的传输只会丢失信息,不会增加信息,至多保持原来的信息量
如果信道满足
如果第二个信道是个一一对应的无损信道,这个条件显然满足。如果信道二是个数据处理系统,则表明通过数据处理后,一般只会增加信息的损失,虽多保持原来获得的信息,不可能比原来获得的信息有所增加。
数据处理定理说明,在任何信息传输系统中,最后获得的信息至多是信源所提供的信息
如果一旦在某一过程中丢失一些信息,以后的系统不管如何处理,如果不触及到丢失信息过程的输入端,就不能恢复一丢失的信息。
这就是信息不增性原理,它与热熵不减原理正好对应。它深刻反映了信息的物理意义。
设有二个离散二元对称信道,其串联信道如下图所示。
设第一个二元对称信道的输入符号的概率空间,以及两个二元对称信道的信道矩阵为
若设
于是根据平均互信息的定义,可以算出
如果在两个二元对称信道串联之后再增加一个级联环节,可得
依此类推,
对于
这意味着,二元对称信道经串联后,只会增加信息的损失。当串联的级数越多,损失的信息越大
信源发出的消息符号一般要通过信道来传输。对于某一信道其信道容量是一定的。只有当输入符号的概率分布
在无损信道中,信道容量
信源编码就是将信源输出的消息变换成新信源的消息来传输,而使新信源的熵接近最大熵;
新信源的消息通过信道的消息传输率接近最大值,信道剩余度接近于零,信道得到充分利用。
这就是香农无失真信源编码理论,它使信源和信道达到匹配,传输的信息量达到最大,提高了信息传输的有效性。
信道容量:指信道对信源一切可能的概率分布而言能够传送的最大熵速率。
连续信道,分为时间离散和时间连续两大类型。
跟离散是一样的
设有两个连续随机变量
为
设有两个连续随机变量
为
设有两个连续随机变量
称为
连续随机变量平均互信息的主要性质如下:
当且仅当连续随机变量
信道容量
由于输入和干扰是相互独立的,对于一维随机变量,其信道模型可以表示为
连续信道的输入和输出为随机过程
根据采样定理将随机信号离散化,对于时间离散信道的输入和输出序列可以表示为
若信道转移概率密度满足
则称信道为「无记忆连续信道」。与离散信道情况类似,存在关系
设随机变量
证明:
因此有
简单加性噪声信道的互信息量由输出熵和噪声熵决定。
若输入信源
由于实际中信号和噪声的功率是有限的,所以研究时间离散连续信道的容量是在功率受限的条件下进行的
若输入信源均值为
此时,噪声熵和
则信道容量为
非高斯型加性噪声信道容量的计算相当复杂,下面定理给出了其上、下限。假设输入信源的平均功率小于
其中
结论:当噪声功率给定后,高斯型干扰是最坏的干扰,此时其信道容量
时间连续信道可以用随机过程描述,加性噪声信道模型一般表示为
式中
则有
设高斯噪声的平均功率为
对于加性噪声信道,由概率论可知
由于信道时无记忆信道,那么
因此时间连续的信道容量为
若信道为高斯信道,则时间连续的高斯信道为
达到该信道容量则要求
对窄带加性高斯信道,假设信道带宽为
单位时间信道容量为
当噪声功率谱密度为
称上式为「香农公式」(Shannon)
当
香农公式把信道的统计参量(信道容量)和实际物理量(带宽
由此可见,对一定的信息传输率来说,带宽
例:若要保持信道的信息传输率
当
信噪比
当
信号功率为
可见,带宽减少
考试时往往用 dB 来表示
在二进制数字通信系统中,编码器的编码过程分为两步:
由于信源编码在构造上并未考虑抗干扰,如果把信源编码器的输出直接接入信道,由于信道中存在噪声干扰,将引起误码,降低通信可靠性。
因此提出了以提高通信可靠性为主要目的「信道编码」,它是对信源编码器输出的最佳码再进行一次编码,以提高其抗干扰能力的一种编码形式。
信道的特征是由信道传递概率
信道编码的编码对象是信源编码器输出的数字序列
信道编码,就是按一定的规则给数字序列
在接收端,信道译码器利用这种预知的编码规则来译码,或者检错(检验接收到的数字序列
信道编码的基本思想是就是根据相关性来检测和纠正传输过程中产生的差错。
通信的可靠性问题,即消息通过信道传输时如何选择编码方案以减少差错。
在有噪信道中传输信息是会发生错误的,错误概率和信道统计特性、编译码过程以及译码规则有关。
信道编码研究的对象是编码信道。
如上图所示,它是由信道编码器、信道译码器和实际信道一起形成的一个新的信道。
编码信道是研究信道纠错编码和译码的一种模型。它可以是:
考虑一个二元对称信道,单符号错误传递概率是
如果规定在信道输出端接收到符号
可见,错误概率既与信道统计特性有关,也与译码规则有关。
假定数字通信系统的编码信道是无记忆二进制对称信道:
二进制信道是指码字和接收向量均由二元序列表示的信道,即
二进制信道可用转移概率
满足以下对称特性的无记忆二进制信道称为无记忆二进制对称信道,简称 BSC:
只要噪声是白噪声,大多数二进制传输信道的模型可等效为一个 BSC,其信道模型如下图所示。
可将 BSC 的输入输出关系等效为代数关系:
设信道输入符号集
显然,对于有
设有一离散无记忆信道,其信道矩阵为
则以下
由于
若译码规则为
反之,如果发送端发的是
经过译码后,平均到一个符号所产生的错误的大小,也就是译码平均错误概率为
译码平均错误概率还可以写成
可以看作是
平均正确概率可以写成
若输入为等概率分布,则
上式意味着,在输入为等概率分布的条件下,译码错误概率可用信道矩阵中元素的求和来求。这种求和是除去信道矩阵中每列中对应于
选择译码规则总的原则应是使译码平均错误概率
为非负项之和,欲使译码平均错误概率最小,那么应使每一项
选择译码函数
则称为「最大后验概率译码准则」。最大后验概率译码准则是选择这样一种译码函数,对于每个输出符号
设信道矩阵
解:
由
由
则可以确定最佳译码规则为
在最佳译码规则下的译码平均错误概率为
从最大后验概率译码规则可以很容易推出极大似然译码规则。根据贝叶斯定律,有
则最大后验概率准则可表示为
当输入为等概分布,
选择译码函数
则称为「最大似然译码准则」。当输入符号为等概分布时,应用极大似然译码准则是很方便的,即将
已知信道矩阵
当输入为等概率分布时,译码规则
在输入为等概率分布时,最大似然译码准则是最优的。
知道有就行,不需要记住。
译码时发生错误是由信道中噪声引起,因此平均错误概率与信道疑义度
这个不等式称为「费诺不等式」。
虽然
第二部分是当判决是错误的,其错误概率为
第一部分是接收到
前面讨论了平均错误概率与译码规则的关系。选择最佳译码规则只能使错误概率有限地减小,无法使其任意地小。要想进一步减小错误概率,必须优选信道编码方法。
现在讨论不同的编码方法对译码平均错误概率和信息传输率的影响。
本节举例说明在采用简单重复编码时重复次数对译码平均错误概率和信息传输率的影响。
设有二元对称信道,其信道矩阵为
未编码时:
选择最佳译码规则为
在输入为等概率分布时,译码平均错误概率为
采用简单重复编码,规定信源符号为
其中,
设输入符号为等概分布,采用最大似然译码准则,得译码函数为
在输入为等概分布时,相应的译码平均错误概率为
在简单重复编码时,采用“择多译码”的译码规则等效于最大似然译码准则。择多译码是根据接收序列中“
采用简单重复编码方法,如果增大重复次数
重复次数对信息传输率和错误概率的影响如下
能否找到一种编码方法,使平均错误概率充分小,而信息传输率
本节讨论消息符号个数
在一个二元信道的
设
以下假设输入为等概率分布
当
有不同的选取方法,代表不同的编码方法,其平均错误概率是不同的。
取法 1 :
取法 2 :
输入信息符号个数
输入信息符号个数
从以上讨论看出:
增大简单重复编码次数
设
采用以下编码方法将输入符号编码成为 5 位码:
编码方法为
其中,
采用最大似然译码准则,当
信息传输率为
前述
信息传输率为
与
若有一离散无记忆平稳信源,其容量为
信道编码定理是一个理想编码的存在性定理。
信道容量是一个临界值,信息传输率不超过这个值,信道就可几乎无失真地把信息传过去,否则就会产生失真。
定义:设
其中,
举例:设
定义:在二元码
举例:设有
对于码
显然,最小码距
码本中最小码距
如果码本中最小码距
因此,在选择编码规则时,应使码字之间的距离
定义:选择译码函数
称为最小距离译码准则。采用这一准则时,只要将接收序列
最大似然译码准则为:选择译码规则
当
只要记住前两个充要条件就可以了
对于
这组码可以纠正
这组码可以检测出
这组码可以纠正