书城小说破译
992100000020

第20章 天才的密码少女 (2)

余劭昀左手接过书翻开来看,黄逸夫赞道:“我们的小王同志果然比‘家里’的专家还厉害,这次立了大功,一定要好好嘉奖。”说着坐到一边去抄写传单标语。王玲道:“谢谢黄组长。”

李大虎却没有这二位领导有耐心,不停地追问王玲有关“飞雪行动”的内容,甚至与她吵了起来。余劭昀一边劝说,一边注视着李大虎的双手。时间一分一分地过去,李大虎渐渐被王玲说服,仍没有任何行动。

余劭昀的直觉让他转向黄逸夫望去,陡然见他举枪转身站起来。余劭昀心中大惊,若向他开枪,王玲也会被黄逸夫打死。余劭昀情急生智,抢先一步,左臂勾住王玲的脖子,右手持枪指着她太阳穴,正好黄逸夫的枪也对准了王玲。而惊惧之下的李大虎却误认为黄逸夫是在阻止余劭昀行凶,也拔枪对准了余劭昀。

余劭昀道:“你们两个谁也别动,不然我就杀了她。”王玲冰雪聪明,心念电转,明白了余劭昀是为了救她而改变了约好的计划,情况变化了她也随即配合着骂道:“余劭昀,你到底是什么人?你想干什么?”余劭昀冷冷地道:“我是军统的特工,你们没想到吧,你快告诉我‘飞雪行动’的内容是什么?”

王玲配合道:“黄组长,大虎,你们快向他开枪,千万别管我。”余劭昀向李、黄二人道:“你们快把枪放下。”李大虎咬着牙极不情愿地放下了枪。

黄逸夫枪口一转,对准了李大虎,道:“余特派员,没想到原来你也是党国的精英,我是中统的人,看来我们得……”余劭昀冷笑道:“你以为你玩这种雕虫小技就能骗得了我吗?”黄逸夫道:“我现在也很难向你解释清楚,我们还是先把王玲带走再说。到了我们那儿,我们的人自会有办法让她开口说出‘飞雪行动’的内容。”

余劭昀道:“要我相信你也可以,你先开枪打死李大虎。”王玲心中一惊,却听黄逸夫道:“枪声一响,上面的人就会下来,我们就出不去了。”王玲心中佩服余劭昀的以进为退的高明,更佩服他对对手心理把握得那么准。李大虎听黄逸夫说不敢开枪,便出拳向他击去,黄逸夫略一侧身,左手上翻,抓住他手腕,运劲一扭,将他摔倒在地,又一脚踩在他胸口上,这几下兔起鹘落,而且右手枪口始终对着他。

余劭昀道:“那你用刀子杀了他,我们把王玲打昏,说她突发急病,我们就以送她去医院为理由将她带走。不过话得先说清楚,这件事功劳可得归我们军统。”黄逸夫道:“好,一切都依你。”正要伸左手从身上拔匕首,却被李大虎拉住了左手,只得将枪放在桌上,用右手从腰间拔出一把军用匕首,正准备弯下腰杀李大虎。却见余劭昀放开了王玲,举枪对准了黄逸夫的头部,喊道:“旋风五号!”这一变故让黄逸夫猝不及防,大惊失色。

王玲轻松地道:“没想到我略施小技,你的狐狸尾巴就露出来了。”黄逸夫冷笑道:“原来这只是一个圈套,想不到我一个资深的老牌特工竟然栽在一个小丫头手上。”

上面的郭德福、李小虎突然听到下面一声枪响,都持枪冲了下来,只见黄逸夫头部中弹,倒在地上……

王玲看着倒在地上的黄逸夫,想起了被他害死的父母来,不由得默默出神,流下泪来,觉得现在终于可以告慰父母的在天之灵了。过了一会儿,她才叹了口气,“现在我可以告诉大家‘飞雪行动’的内容了。”余劭昀激动地问道:“你真的已经破译出密码了?”王玲欢喜地递给他一叠稿纸,“你们自己看吧。”郭德福、李大虎、李小虎几人也都凑了上去。稿件虽然已经是经她详细整理过的了,但是外人看起来仍然是觉得特别深奥。

王玲在经过大量的数据对比后,放弃了最初企图通过日文打开突破口的方法,将密电的内容确定为英语内容。英文是世界通用文字,日本使领馆遍设全球,收发电报自然以使用英文字母为便,所以日本的很多电报都是以英文发送的。

她的破译方法是这样的:破译的第一步就是利用语言的频率特征。在各种字母语言中,各个字母的使用次数是不一样的,有的偏高,有的偏低。美国密码学家佛里德曼在调查了大量英文资料后,得出了英文字母的普遍使用频率表1:

字 母 频 率 字 母 频 率 字 母 频 率

A 0.0856 J 0.0013 S 0.0607

B 0.0139 K 0.0042 T 0.1045

C 0.0279 L 0.0339 U 0.0249

D 0.0378 M 0.0249 V 0.0092

E 0.1304 N 0.0707 W 0.0149

F 0.0298 O 0.0797 X 0.0017

G 0.0199 P 0.0199 Y 0.0199

H 0.0528 Q 0.0012 Z 0.0008

I 0.0627 R 0.0677

虽然也有特别的例外,比如1969年法国作家乔治?佩雷克写了一本二百页的小说《逃亡》,其中没有一个含有字母E的单词。而且翻译成英文后,居然也没有一个字母E。这的确算是一个奇迹。由于英文字母中最常见的字母完全没有出现,如果用这本书作为密码底本进行单字母替换加密,破译将会受到很大的阻碍。但是就普遍而言,写出的英语文章各字母的使用频率还是基本上能够与表1里的统计数据相符合的。从中可以看出,英文中E的普遍使用频数最高,相当于在一万个字母中,平均出现一千三百零四次,而Z的使用频数最低,相当于在一万个字母中平均出现八次。另外,从单词的使用频率看,定冠词the的使用频率最高,其次是专有名词和it等代词,还有in和on等前置词的使用频率也很高。从字母在单词中的分布来看,也有一些规律,字母y总使用频数的百分之九十都集中在单词的结尾,而w的百分之九十都集中在单词的开头,p和c在单词的开头多,在结尾少,r在单词的中间出现较多,j和q在缩略语以外的单词结尾不会出现,英文中仅有两个单词是由单字母组成的,就是a和i。此外还有很多类似的频率特征。

密码学家们还对日、俄、德、意、系、葡等语言的字母频数和使用频率进行过统计,也得出了类似的使用频率特征,制作出了相应的普遍使用频率表。

下面就是王玲统计出的这份密文中各个字母的频数:

表2

字母 A B C D E F G H I J K L M

频数 55 58 2 41 22 13 87 4 71 70 11 85 8

字母 N O P Q R S T U V W X Y Z

频数 50 14 12 0 12 23 1 27 40 80 8 96 3

这份密文共有八百九十三个字母,因此很容易算出各个字母的使用频率。然后再进行明密比较。

但是,并不是说将密文字母简单地用与其频率相近的英文字母代替就可以的,因为在一般情况下,这些密文字母在密文中的使用频率是不会离开它们所代表的明文字母的频率太远的。从表1中可以看出,明文字母E,T,A,O,N,R,I,S,H可称为高频字母群,D,L,F,C,U,M可称为中频字母群,G,Y,P,W,B,V可称为低频字母群,K,X,J,Q,Z则是罕见字母群。而且从中频字母群到高频字母群,一般都有个明显的频率跳跃,高频字母群中频率最低的字母H为0.0528,中频字母群中频率最高的字母D 只有0.0378。这种不同频率字母群之间的突变,在密文字母的频率统计中应该有对应的表现。将密文字母按频数从多到少排列,高频字母群与中频字母群的分界线看来应该在N和D之间:中频字母群与低频字母群的分界线大概是E和O之间,虽然中频字母群应该是六个,而现在只有五个。低频字母群与罕见字母群的分界线大概在M和H之间,虽然低频字母群应该是六个,而现在是七个,于是就得出一个结论:中频字母群里少的一个字母很可能就是低频字母中多的这一个。

表3

Y G L W I J B A N D V U S

96 87 85 80 71 70 58 55 50 41 40 27 23

E O F P R K X M H Z C T Q

22 14 13 12 12 11 8 8 4 3 2 1 0

特别是字母Y,很可能是代表最常用的字母E,密文高频字母群中最低的字母N可能是代表明文字母h。密文中剩下的 H,Z,C,T(密文中没有出现字母Q) 几个字母很可能就是代表明文中罕见字母群k,x,j, q, z,但是具体哪一个代表哪一个还不知道。

现在再利用第二个突破口——语言的连接特征。在英语中,字母Q后面除了连接省略号外,几乎百分之百地连接着字母U,这就是连接特征中的后连接方式。另外,有些字母,它们分别在前面几乎总是连接那么少数几个字母:X前面连接的普遍是I和E,极个别的情况下是O和A。还有一种间断连接方式,在E和E之间R的出现频率最高。

较高频密文字母连接次数分类统计表:

表4

Y96 G87 L85 W80 I71 J70 B58 A55 N50 D41 V40

1Y1 7Y3 1Y7 7Y9 0Y2 4Y10 3Y10 10Y7 23Y1 8Y9 4Y14

3G7 0G0 8G2 15G9 3G9 5G17 7G8 10G12 6G0 2G1 3G7

7L1 2L8 1L1 13L6 3L2 11L20 1L6 4L10 16L1 3L10 4L4

9W7 9W15 6W13 2W2 4W9 5W0 12W5 3W0 0W21 8W1 6W3

2I0 9I3 2I3 9I4 1I1 9I15 6I3 2I3 2I1 2I8 10I2

10J4 17J5 20J11 0J5 15J9 3J3 1J7 0J1 0J0 0J0 0J7

11B3 8B7 6B1 5B12 3B6 7B1 6B6 2B0 0B10 4B0 1B1

7A10 12A10 10A4 0A3 3A2 1A0 0A2 15A15 0A0 0A0 0A2

1N23 0N6 1N16 21N 1N2 0N0 10N 0N0 0N0 1N0 10N2

9D8 1D2 10D3 1D8 8D2 0D0 0D4 0D0 0D1 1D1 1D1

14V4 7V3 4V4 3V6 2V10 7V0 1V1 2V0 2V10 1V1 1V1

4U2 5U6 3U5 0U6 11U3 1U0 2U1 0U2 0U0 1U1 0U0

5S4 0S6 2S2 1S0 7S1 0S0 1S0 0S1 0S0 3S0 0S0

8E7 2E2 3E3 0E4 0E0 9E1 1E2 1E1 0E0 1E0 0E0

1O6 2O0 0O0 3O0 1O0 0O0 2O0 2O1 0O0 0O2 0O0

1F0 0F0 2F1 0F2 5F1 0F6 1F2 0F2 2F0 0F4 1F0

0P3 3P0 1P2 0P0 0P0 8P0 0P0 0P0 0P6 0P0 0P0

0R0 1R2 1R1 0R2 0R4 1R0 0R1 1R0 0R0 5R1 0R1

1K8 3K0 3K0 0K0 1K1 1K0 0K0 0K0 0K0 0K0 0K0

1X2 1X2 1X1 0X1 1X4 0X0 4X0 3X3 0X0 0X1 0X0

2M0 1M4 0M2 0M0 01M 0M0 0M0 1M0 0M1 0M0 0M1

0H1 1H0 0H1 0H0 0H1 0H0 0H1 1H0 0H0 0H0 1H0

0Z2 0Z0 0Z0 0Z0 1Z1 0Z0 0Z0 0Z0 0Z0 0Z0 0Z0

0C0 0C2 0C0 0C0 0C0 0C0 0C0 0C0 0C0 0C0 0C0

0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0 0T0

在第一列中(Y96)中,G前面是数字3,表示字母Y在字母G前面出现三次,即字母对YG在密文中出现三次。G后面是数字4,表示字母对GY在密文中出现四次。

从表中数据可以看出,密文字母Y不但频数最大,而且与许多不同的字母连接,已经可以确定Y就是代表的明文字母e。

明文中频率特别高的是e,t,a三个字母,是密文中频率特别高的Y,G,L,W四个字母。假设这三个明文高频字母的代替字母就在这四个当中,已知Y代表e,那么t和a就在G,L,T当中。在高频字母中,元音字母经常出现在大多数字母的前后,而辅音字母则会避开大多数字母。就如字母E可以与任何一个字母组合,而字母J却很少会出现在字母B,D,G,J,K,M,Q,V的两边。从表4中可以看出G,L,T这三个字母的连接特征来,W与其他字母的连接特别少,因此可以得出字母W就是代表辅音字母t。则G和L中的一个则代表a。再加上前面得出的N可能代表的是h,就可以知道WNY代表的是单词the。

另外,明文中的三个高频原音字母a,i,o在连接上的特征是:它们与其他字母的连接总数相对较大,但是自己相互间却总是避免相连。观察统计表4,由于字母Y和W已经被推断出来,于是选择具备这些特征的排列在最前面的G,L,I三个字母来假定为a,i,o。但具体是哪一个代表哪一个还不知道。于是又根据明文中io的频率比较高,而oi,ia,ai,oa,ao的频率则很低的现象来确定。统计表4给出了密文中相应字母对出现的频数,GL2次,LG8次,GI9次,IG3次,LI2次,IL3次,因此可以假定出现九次的GI=io,于是L=a。

明文辅音字母中最具特征的是字母n,因为它的前连接字母有五分之四是元音字母,字母连接统计表4表中,在密文字母J的前面,较多地连接有字母Y,G,I,L,七十三次中占有六十二次,于是得出J表n。