Mini wiki
字母频率
编辑
字母频率,指的是各个
字母
在文本材料中出现的
频率
。常被应用于
密码学
,尤其是可破解古典密码的
频率分析
。在英语中最常见的字母是e。而在
活版印刷
时代,人们已根据经验在
Linotype排字机
上将字母按常用与否排列成etaoin shrdlu cmfwyp vbgkjq xz 。还有,
摩斯电码
中越常用的字母,其编码符号就越短;而发出各字母的用时由快到慢顺序是e it san hurdm wgvlfbk opjxcz yq。
数据压缩
技术中也有相似的方法,如
霍夫曼编码
就是按来源符号出现的机率大小去编码。
1