2024年10月等长编码和哈夫曼编码(哈夫曼编码码长怎么算)

 更新时间:2024-10-12

  ⑴等长编码和哈夫曼编码(哈夫曼编码码长怎么算

  ⑵哈夫曼编码码长怎么算

  ⑶假设用于通信的电文由字符集{a,b,c,d,e,f,g,h}中的字母构成,这个字母在电文中出现的概率分别为{.,.,.,.,.,.,.,.}.()为这个字母设计哈夫曼编码。()若用这三位二进制数(…)对这个字母进行等长编码,则哈夫曼编码的平均码长是等长编码的百分之几?它使电文总长平均压缩多少?解:()哈夫曼编码根据上图可得编码表:a:b:c:d:e:f:g:h:()用三位二进行数进行的等长编码平均长度为,而根据哈夫曼树编码的平均码长为:*.+*.+*.+*.+*.+*.+*.+*.=../=.=%其平均码长是等长码的%。所以平均压缩率为%。记得刚学哈夫曼树的时候还做过一道简单的题,好象是关于分数统计输入的,找不到题目了.参考资料:求采纳

  ⑷哈夫曼编码码长怎么算

  ⑸假设用于通信的电文由字符集{a,b,c,d,e,f,g,h}中的字母构成,这个字母在电文中出现的概率分别为{.,.,.,.,.,.,.,.}.

  ⑹哈夫曼编码根据上面可得编码表:?a:?b:?c:?d:?e:?f:?g:?h:

  ⑺用三位二进行数进行的等长编码平均长度为,而根据哈夫曼树编码的平均码长为:*.+*.+*.+*.+*.+*.+*.+*.=.?./=.=%其平均码长是等长码的%,所以平均压缩率为%。

  ⑻哈夫曼编码码长怎么算?.新浪博客

  ⑼在什么情况下,等长编码是最优前的编码

  ⑽在(平均码长为.情况下,等长编码是最优前的编码.常见的等长编码就是前缀码。所谓最优前缀码是指,平均码长或文件总长最小的前缀编码称为最优的前缀码(这里的平均码长相当于码长的期望值。变长编码可能使解码产生二义性,而前缀码的出现很好地解决了这个问题。而平均码长相当于二叉树的加权路径长度,从这个意义上说,由哈夫曼树生成的编码一定是最优前缀码,故通常不加区分的将哈夫曼编码也称作最优前缀码。需要注意的是,由于哈夫曼树建立过程的不唯一性可知,生成的哈夫曼编码也是不唯一的.

  ⑾哈夫曼编码哈夫曼树可用于构造最短的不等长编码方案,具体做法如下:设需要编码的字符集合为{d,d,…,d?n},它们在字符串中出现的频率为{w,w,…,wn},以d,d,…,d?n作为叶子结点,w,w,…,wn?作为叶子结点的权值,构造一颗哈夫曼编码树,规定哈夫曼编码树的左分支代表,右分支代表,则从根结点到每个叶子结点所经过的路径组成的和的序列便为该叶子结点对应字符的编码,称为哈夫曼编码(HuffmanCode).在哈夫曼编码树中,数的带权路径长度的含义是各个字符的码长与其出现次数的乘积之和,所以采用哈夫曼树构造的编码是一种能使字符串的编码总长度最短的不等长编码.由于哈夫曼编码树的每个字符结点都是叶子结点,它们不可呢在根结点到其他字符结点的路径上,所以一个字符的哈夫曼编码不可能是另一个字符的哈夫曼编码的前缀,从而保证了解码的唯一性.

  ⑿哈夫曼树左小右大是指什么

  ⒀哈弗曼(Huffman树,也称最优树,是一类带全路径长度最短的树,在实际中有广泛的应用,也是二叉树的一个具体应用。在哈夫曼树的定义中,涉及到了路径、路径长度、权等概念,下面先给出概念的定义。一、概念与定义路径:从树的一个结点到另一个结点的分支构成这两个结点之间的路径,对于哈夫曼树特指从根节点到某节点的路径。路径长度:路径上的分支数目叫做路径长度。树的路径长度:从树根到每一结点的路径长度之和。权:赋予某一个事物的一个量,是对事物的某个或某些属性数值化描述。在数据结构中,包括结点和边两大类,所以对应有结点权和边权。其具体代表的意义有具体情况而定。结点的带权路径长度:从树根到结点之间的路径长度与结点上权的乘积。树的带权路径长度:树中所有叶子结点的带权路径长度之和(WPL--weightedpathlength)。它的权值分别为,从根到各叶子结点的路径长度分别为。则其带权路径长度WPL通常记作:WPL的计算如下所示:对于图a:WPL=*(+++)=;对于图b:WPL=*+*+(+)*=;对于图c:WPL=*+*+(+)*=;由图可以看出,权值越大的结点离根节点越近。二、哈夫曼树构造算法哈弗曼树的构造步骤:、根据给定的n个权值(w,w,w,....wn,构造n棵只有根结点的二叉树,令起权值为wj;、在森林中选取两棵根结点权值最小的树作为左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和、在森林中删除这两棵树,同时将新得到的二叉树加入森林中;、重复上述两个步骤,最后构成的树即为哈弗曼树。下图显示了构造一棵哈弗曼树的两种方法:常见的构造比较简单,这里我选择了两种比较特殊的数据进行了构造:哈弗曼树并行生长的原则:如果新形成的二叉树的根节点的值大于或等于森林中的另外两个只有根结点树的值,那么接下来的两棵树将并行生长。并不是线性的直接向上生长。构造方法一:构造方法二:最后显示了哈夫曼树的编码,编码的原则左小右大。三、哈夫曼树在编码中的应用哈夫曼树最常应用的地方就是对报文进行编码传输通信。在数据的交流中,我们对数据是有要求的:(解码结果与发送方发送的电文完全一样。也就是说发送方传输的二进制编码,到接收方解码后必须具有唯一性;(为了传输的效率和网络的通信及时占用资源少,发送的二进制编码尽可能地短。下面介绍两种编码方式:.等长编码这种编码方式的特点是每个字符的编码长度相同,编码长度就是每个编码被翻译的二进制位数。假设字符集只含有个字符A,B,C,D,用二进制两位表示的编码分别为,,,。若现在有一段电文为:ABADA,则应发送二进制序列:,总长度为位。当接收方接收到这段电文后,将按两位一段进行译码。这种编码的特点是译码简单且具有唯一性,但是存在的问题是编码长度并不是最短的,不满足上面的(的要求,因为在大数据量的情况下,我们必须的考虑效率问题,那么如何得到最短的编码呢?使用哈夫曼树就可以解决这个问题。这里先介绍一个前缀吗的概念。前缀码:如果在一个系统中,任意一个编码都不是其他任何编码的前缀(最左子串,则称此编码系统中的编码是前缀码。例如:(A:、B:、C:、D:就是前缀码。但是(A:、B:、C:、D:就不是前缀码。是的前缀,是的前缀。如果不定长的编码不是前缀码,则在译码时会产生二义性。例如是A呢?还是BD呢?所以对于不定长编码一定要是前缀码。.不等长编码不等长编码可以叫最优的前缀码。在传送报文时,为了使其二进制位数尽可能地少,可以将每个字符的编码设计为不等长的,使用频度较高的字符分配一个相对比较短的编码,使用频度较低的字符分配一个比较长的编码。如何得到最优的前缀编码呢?我们就可以利用上述的哈夫曼树来设计,同常成这种编码为哈夫曼编码,它不仅减少电文的总长,还必须考虑编码的唯一性。四、哈夫曼树中的唯一和不唯一唯一:哈夫曼树的WPL一定是最小的,唯一,最优是不变的。不唯一:编码不唯一(表现出来就是形态不唯一。比如说左小右大,或者是左大右小,树枝左右顺序是可以交换的,也就是说所得的哈夫曼编码则可能不同

  ⒁计算机系统结构中等长编码是怎么回事,请高手解惑

  ⒂全国年月高等教育自学考试计算机系统结构试题课程代码:一、单项选择题(本大题共小题,每小题分,共分在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内.错选、多选或未选均无分..对计算机系统结构透明的是(A.VLSI技术B.虚拟存储器C.字符行运算指令D.是否使用通道型I/O处理机.下面说法中不正确的是(A.软件设计费用比软件重复生产费用高B.硬件的设计费用比软件的设计费用低C.硬件的生产费用比软件的生产费用高D.硬件功能只需实现一次,而软件功能可能要多次重复实现.堆栈型机器比通用寄存器型机器优越的是(A.能更好地支持向量的运算B.能优化存储器的空间利用率C.支持先进先出类解题算法的求解D.支持由逆波兰表达式将高级语言多元赋值语句直接编译生成堆栈指令程序.尾数下溢处理平均误差可调整到零的方法是(A.截断法B.舍入法C.恒置““法D.ROM查表法.中断响应由高到低的优先次序宜用(A.程序性→I/O→访管B.外部→访管→程序性C.访管→程序性→机器故障D.访管→程序性→重新启动.不属于堆栈型替换算法的是(A.先进先出法B.近期最久未用过法C.近期最少使用法D.页面失效频率法.块冲突概率最高的Cache地址映象方式是(A.直接B.组相联C.段相联D.全相联.指令间“一次重叠“是指(A.“取指k+“与“分析k“重叠B.“分析k+“与“执行k“重叠C.“分析k“与“执行k+“重叠D.“执行k“与“取指k+“重叠.个处理器用单级网络互连,将号连到号处理器,可用(A.CubeB.PM+C.PM+D.Shuffle.多端口存储器适合于连接(A.松耦合多处理机B.紧耦合多处理机C.机数很多的多处理机D.机数可变的多处理机二、填空题(本大题共小题,每小题分,共分请在每小题的空格中填上正确答案.错填、不填均无分..系列机软件兼容必须做到向______________兼容,尽可能争取向______________兼容..仿真和模拟的主要区别在于解释用的语言.仿真是用微程序解释,其解释程序在______________中,而模拟是用______________解释,其解释程序在主存中..浮点数阶码位数影响数的可表示______________大小,尾数位数影响数的可表示______________大小..集中式总线控制根据优先次序的不同可以有____________、定时查询和______________三种不同方式..程序的局部性包括______________上的局部性和______________上的局部性..为提高页式虚拟存储器内部地址变换的速度,可将其内部映象表又分成由____________表和______________表组成的一个二级表层次..异步流水线会出现顺序流动流水线不可能发生的““相关和““相关..解决重叠方式相关处理的两种基本方法有““和设置“相关专用通路“.后者是以______________为代价,使重叠效率不下降..N个结点的混洗交换网络中,最远的两个入、出端的二进制编号是______________和______________,其最大距离为n-..弗林(MichaelJ·Flynn提出按指令流和数据流的多倍性对计算机系统分类,把计算机系统分成SISD、SIMD、______________和______________四大类.三、简答题(本大题共小题,每小题分,共分.计算机系统“由中间开始“设计,其“中间“指的是什么地方?这样设计的优点是什么?.浮点数尾数基值减少时,对机器数的表示会产生哪些影响?.在页式虚拟存储器中,什么是页面失效?什么是页面争用?什么时候两者同时发生?什么时候两者不同时发生?.流水机器的中断处理有哪两种方法?各有什么优缺点?.多处理机的并行性表现在哪些方面?开发多处理机的并行性有哪些途径?四、简单应用题(本大题共小题,每小题分,共分.有台外设,各设备要求传送信息的工作速率分别如下表所示.现设计的通道,在数据传送期,每选择一次设备需μs,每传送一个字节数据也需要μs.(若用作字节多路通道,通道工作的极限流量是多少?(作字节多路通道用时,希望同时不少于台设备挂在此通道上,最好多挂一些,且高速设备尽量多挂一些,请问应选哪些设备挂在此通道上?为什么?设备标识ABCDEFGH工作速率(kB/s.若系统要求主存实际频宽至少为MB/s,采用模m多体交叉存取,但实际频宽只能达到最大频宽的.倍.(现设主存每个分体的存取周期为μs,宽度为个字节,则主存模数m(取的整数幂应取多少才能满足要求?(若主存每个分体的存储周期为μs,宽度为个字节,则主存模数m(取的整数幂应取多少才能满足需求?五、综合应用题(本大题共小题,每小题分,共分.文电由A—J及空格字符组成,其字符出现频度依次为.,.,.,.,.,.,.,.,.,.,..(各字符用等长二进制码编码,传送个字符时,共需传送多少个二进制码码位?(构造Huffman树,写出各字符的二进制码码位数;(按Huffman编码,计算字符的二进位平均码长;(按Huffman码传送个字符时,与定长码编码传送相比,可减少传送的二进制码码位数是多少?.有一个段的单功能非线性流水线,预约表如下表所示.(写出延迟禁止表、冲突向量,并画出冲突向量状态转移图;(写出其流水线的最佳调度方案及此时的最大吞吐率.(注:t,t,t,t,t,t之间相隔Δt时间全国年月自学考试计算机系统结构试题课程代码:一、单项选择题(本大题共小题,每小题分,共分)在下列每小题的四个备选答案中选出一个正确答案,并将其字母标号填入题干的括号内。错选、多选或未选均无分。.系统程序员不透明的应当是(A.Cache存储器B.虚拟存储器C.指令缓冲寄存器D.系列机各档不同的数据通路宽度.“从中间开始”设计的“中间”目前多数在(A.传统机器语言机器级与操作系统机器级之间B.传统机器语言机器级与微程序机器级之间C.微程序机器级与汇编语言机器级之间D.操作系统机器级与汇编语言机器级之间.计算机中优化使用的操作码编码方法是(A.哈夫曼编码B.ASCII码C.BCD码D.扩展操作码.指令执行结果出现异常引起的中断是(A.输入/输出中断B.机器校验中断C.程序性中断D.外部中断.以下不属于堆栈型替换算法的是(A.近期最少使用算法B.近期最久未用过算法C.先进先出算法D.页面失效频率算法.以下与虚拟存储器的等效访问速度无关的是(A.页地址流B.页面调度策略C.主存的容量D.辅存的容量.以下说法不正确的是(A.线性流水线是单功能流水线B.动态流水线是多功能流水线C.静态流水线是多功能流水线D.动态流水线只能是单功能流水线.流水处理机对全局性相关的处理不包括(A.猜测法B.提前形成条件码C.加快短循环程序的执行D.设置相关专用通路.拓扑结构用多级立方体网络,二功能交换单元,级控制方式,这种网络称为(A.Omega网络B.交换网络C.间接二进制n方体网络D.数据变换网络.能实现作业、任务级并行的异构型多处理机属(A.SIMDB.MISDC.MIMDD.SISD二、填空题(本大题共小题,每小题分,共分)请在每小题的空格中填上正确答案。错填、不填均无分。.多机系统的耦合度可以分为最低耦合、___________耦合和___________耦合。.开发计算机系统结构并行性的主要技术途径有时间重叠、___________和___________。.自定义数据表示包括___________数据表示和___________两类。.系统效率是否提高是引入数据表示的一条重要原则,它表现在是否减少了实现的___________和所需的___________。.在满足通道设计流量不低于设备工作时的最大流量时,为使微观上不丢失设备信息,可以加设___________或动态提高响应的___________来弥补。.Cache存储器若采用全相联映象规则,则主存中___________块都可映象装入到Cache中___________块的位置上。.流水线消除速度瓶颈的方法有瓶颈子过程___________和瓶颈子过程___________两种。.流水有部件级、处理机级、系统级等不同等级,多个处理机之间的流水属于___________级流水,也称___________流水。.不同的多级互连网络,在所用的___________、拓扑结构和___________上各有不同。.多处理机的互连形式一般有总线形式、环形互连形式、___________形式、多端口存储器形式和___________形式等几种。三、简答题(本大题共小题,每小题分,共分).简述多处理机要解决的主要技术问题(至少写出个)。.总线控制方式有哪三种?各需要增加几根用于总线控制的控制线?并说明每种方式优先级的灵活性。.实现软件移植的途径有哪些?各受什么限制?.什么是全排列网络?实现全排列网络有哪两种方法?.解决计算机主存与CPU的速度差对机器性能的影响,可采用哪

  ⒃哈夫曼编码的基本思想是什么

  ⒄设某信源产生有五种符号u、u、u、u和u,对应概率P=.,P=.,P=P=.,P=.。

  ⒅首先,将符号按照概率由大到小排队,如图所示。编码时,从最小概率的两个符号开始,可选其中一个支路为,另一支路为。这里,我们选上支路为,下支路为。再将已编码的两支路的概率合并,并重新排队。多次重复使用上述方法直至合并概率归一时为止。

  ⒆从图(a和(b可以看出,两者虽平均码长相等,但同一符号可以有不同的码长,即编码方法并不唯一,其原因是两支路概率合并后重新排队时,可能出现几个支路概率相等,造成排队方法不唯一。

  ⒇一般,若将新合并后的支路排到等概率的最上支路,将有利于缩短码长方差,且编出的码更接近于等长码。这里图(a的编码比(b好。

  ⒈哈夫曼编码(HuffmanCoding),又称霍夫曼编码。

  ⒉年,哈夫曼和他在MIT信息论的同学需要选择是完成学期报告还是期末考试。导师RobertM.Fano给他们的学期报告的题目是,寻找最有效的二进制编码。

  ⒊由于无法证明哪个已有编码是最有效的,哈夫曼放弃对已有编码的研究,转向新的探索,最终发现了基于有序频率二叉树编码的想法,并很快证明了这个方法是最有效的。

  ⒋由于这个算法,学生终于青出于蓝,超过了他那曾经和信息论创立者香农共同研究过类似编码的导师。哈夫曼使用自底向上的方法构建二叉树,避免了次优算法Shannon-Fano编码的最大弊端──自顶向下构建树。

  ⒌年,DavidA.Huffman在麻省理工攻读博士时发表了《一种构建极小多余编码的方法》(AMethodfortheConstructionofMinimum-RedundancyCodes一文,它一般就叫做Huffman编码。

  ⒍参考资料来源:百度百科-哈夫曼编码

  ⒎每次合并二个最小的概率。一开始:c(.).f(.)最小,合并成一个。cf(.).并且,左边先编,右边编。再继续合并下去。,,,指,,的个数。

  ⒏哈夫曼编码码长怎么算

  ⒐设某信源产生有五种符号u、u、u、u和u,对应概率P=.,P=.,P=P=.,P=.。

  ⒑霍夫曼编码是变长编码,思路:对概率大的编的码字短,概率小的编的码字长,这样一来所编的总码长就小,这样编码效率就高。上面那样求是不对的,除非你这个码字是等概率的,各占/。应该用对应的概率*其对应得码长,再求和。

  ⒒除采用定时清洗以消除误差扩散和采用缓冲存储以解决速率匹配以外,主要问题是解决小符号集合的统计匹配,例如黑(、白(传真信源的统计匹配,采用和不同长度游程组成扩大的符号集合信源。游程,指相同码元的长度(如二进码中连续的一串或一串的长度或个数。

  ⒓按照ITT标准,需要统计×种游程(长度,这样,实现时的存储量太大。事实上长游程的概率很小,故ITT还规定:若l表示游程长度,则l=q+r。

  ⒔哈夫曼编码为什么是变长编码的一种方式

  ⒕假设用于通信的电文由字符集{a,b,c,d,e,f,g,h}中的字母构成,这个字母在电文中出现的概率分别为{.,.,.,.,.,.,.,.}。

  ⒖哈夫曼编码根据上面可得编码表:?a:?b:?c:?d:?e:?f:?g:?h:

  ⒗用三位二进行数进行的等长编码平均长度为,而根据哈夫曼树编码的平均码长为:*.+*.+*.+*.+*.+*.+*.+*.=.?./=.=%其平均码长是等长码的%,所以平均压缩率为%。

  ⒘因为定长编码已经用相同的位数这个条件保证了任一个字符的编码都不会成为其它编码的前缀,所以这种情况只会出现在变长编码当中,要想避免这种情况,

  ⒙就必须用一个条件来制约定长编码,这个条件就是要想成为压缩编码,变长编码就必须是前缀编码,所谓的前缀编码就是任何一个字符的编码都不能是另一个字符编码的前缀。

  ⒚实际应用中,除采用定时清洗以消除误差扩散和采用缓冲存储以解决速率匹配以外,主要问题是解决小符号集合的统计匹配,

  ⒛例如黑(、白(传真信源的统计匹配,采用和不同长度游程组成扩大的符号集合信源。游程,指相同码元的长度(如二进码中连续的一串或一串的长度或个数。按照ITT标准,需要统计×种游程(长度,

  这样,实现时的存储量太大。事实上长游程的概率很小,故ITT还规定:若l表示游程长度,则l=q+r。其中q称主码,r为基码。编码时,不小于的游程长度由主码和基码组成。而当l为的整数倍时,只用主码的代码,已不存在基码的代码。

  参考资料来源:百度百科-哈夫曼编码

您可能感兴趣的文章:

相关文章