“不给力啊,老湿!”:RSA加密与破解

  • 时间:
  • 浏览:0

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!

加密和解密是自古前会技术了。一个劲 都看侦探电影的桥段,勇敢又机智的主角,拿着一长串毫无意义的数字苦恼,忽然灵光一闪,翻出一本厚书,将第一一还还有一个 数字对应页码数,第一还还有一个数字对应行数,第一一还还有一个 数字对应那一行的某个词。数字变成了一串非常有意义一段话:

Eat the beancurd with the peanut. Taste like the ham.

主角喜极而泣……

你这个 加密依据是将不到 的并都不 信息按照某个规律打乱。并都不 打乱的依据就叫做密钥(cipher code)。发出信息的人根据密钥来给信息加密,而接收信息的人利用相同的密钥,来给信息解密。就好像一一还还有一个 带锁的盒子。发送信息的人将信息放在盒子里,用钥匙锁上。而接受信息的人则用相同的钥匙打开。加密和解密用的是同一一还还有一个 密钥,你这个 加密称为对称加密(symmetric encryption)。

可能性一对一一段话,不到 两人可不还可不能能交换一一还还有一个 密钥。一对多一段话,比如总部和多个特工的通信,依有日可不还可不能能 使用同一套密钥。但你这个 情况报告下,对手偷到一一还还有一个 密钥一段话,就知道所有交流的信息了。二战中盟军的情报战成果,其他都来自于破获你这个 对称加密的密钥。

二战中德军的传奇加密机:Enigma

为了更安全,总部可不还可不能能给每个特工都设计一一还还有一个 不同的密钥。可能性是FBI不到 庞大的机构,恐怕好难维护不到 多的密钥。在现代社会,每此人 的信用卡信息都可不还可不能能加密。一一设计密钥一段话,银行怕是要跪了。

对称加密的薄弱之趋于稳定于给了这样 来越多人的钥匙。可能性只给特工锁,而总部保有钥匙,那就容易了。特工将信息用锁锁到盒子里,谁也打不开,除非到总部用唯一的一把钥匙打开。其他 不到 一段话,特工每次出门前会带上其他锁,太容易被识破身份了。总部老大想了想,干脆就把造锁的技术公开了。特工,可能性任何其它人,可不还可不能能 就地取材,按照图纸造锁,但无法根据图纸发明者家 钥匙。钥匙不到总部的那一把。

中间的关键是锁和钥匙工艺不同。知道了锁,未必能知道钥匙。不到 ,银行可不还可不能能 将“造锁”的依据提前大选给所有用户。每个用户可不还可不能能 用锁来加密此人 的信用卡信息。即使被别人窃听到,其他 用担心:不到银行才有钥匙呢!不到 并都不 加密算法叫做非对称加密(asymmetric encryption)。非对称加密的经典算法是RSA算法。它来自于数论与计算机计数的奇妙结合。

为了了解RSA加密,请听一一还还有一个 卧底的自白:

RSA加密

我是潜伏在龙凤大酒楼的卧底。想让下面信息以加密的依据发送到总部:

A CHEF HIDE A BED

厨子藏起来了一张床!这是不到 的重要,可不还可不能能立即通知总部。千万重要的是,不到让反革命的厨子知道。

第一步是转码,也其他 将英文转打上去某个对应的数字。你这个 对应很容易建立,比如:

A B C D E F G H I
1 2 3 4 5 6 7 8 9

将中间的信息转码,获得下面的数字序列:



A CHEF HIDE A BED 1 3856 8945 1 254

这串数字完正不到 那先 秘密可言。厨子发现了这串数字要是 ,很容易根据数字顺序,对应字母表猜出来。

为了和狡猾的厨子斗智斗勇,亲戚亲戚亲们可不还可不能能对这串数字进一步加密。使用总部发给亲戚亲戚亲们的锁,一一还还有一个 数字:3和10。亲戚亲戚亲们分为两步防止。

第一步是求乘方。第一一还还有一个 数字是3,也其他 说,总部指示亲戚亲戚亲们,求中间数字串的3次方:

原字符串: 1   3   8   5   6   8   9   4   5   1   2   5   4

三次乘方: 1  27 512 125 216 512 729  64 125   1   8 125  64

第二步是求余数。第一还还有一个上锁的数字是10,将中间每个三次乘方除以10,获得其余数:

余数: 1 7 2 5 6 2 9 4 5 1 8 5 4

将这串数字发回总部。中途被厨子偷都看,但一时不到了解其中的意思。可能性还是像刚才一样对应字母表一段话,信息是:

AGBEFBIDEAHED

这串字母完正不含有正常的单词。

信息到了总部。总部日后刚开始用神奇的钥匙来解读。你这个 钥匙是3。(偷偷告诉你的,别告诉厨子。)

(这里钥匙不小心和要是 锁中的一一还还有一个 数字相同。这其他 巧合。)

解锁过程也是两步。第一步求钥匙次的乘方,即3次方。第二步求它们除以10(锁之一)的余数。

加密信息:1   7   2   5   6   2   9   4   5   1   8   5   4

三次乘方:1 343   8 125 216   8 729  64 125   1 512 125  64 (这里用的是钥匙的“3”)

除十得余:1   3   8   5   6   8   9   4   5   1   2   5   4

正是亲戚亲戚亲们发送的信息。对应字母表,总部可不还可不能能 立即知道不到 的信息。

特工练习

再次强调,为了演示方便,选者了简单的锁和钥匙。锁和钥匙其他 凑巧相同。为此,亲戚亲戚亲们做一一还还有一个 小练习。

练习:总部新提前大选出来的锁是2987(次乘方)和3937(为除数)。

1) 作为特工,用中间的算法为信息加密(你可能性可不还可不能能其他编程来计算,尝试用Python的数学计算功能?)。

猜到钥匙是那先 了呢?前会中间一一还还有一个 数字中的任何一一还还有一个 ,其他 143!

2) 作为值班人员,验证143是钥匙,可不还可不能能 解密信息。

为了简便,你可不还可不能能 只检验一一还还有一个 简单的信息,比如“IE”。

下面是我根据你这个 练习写的一一还还有一个 Python小多线程 。这里的转码用的是ASCII编码标准,而前会中间的A对应1,B对应2。

# By Vamei

#==== Agent ========
# coding covert: string to number
# By ASCII convention
def convert(original):
    return map(ord, original)

# the input is a list of integers
def encrypt(input_list):
    f = lambda x: (x**2987)%3937
    return map(f, input_list)

#==== Headquarter =====
# the input is the result of the encrypt function
def decrypt(encrypted_list):
    f = lambda x: (x**143)%3937
    return map(f, encrypted_list)

# convert numbers back to a string
def inv_convert(decrypt_list):
    f = lambda x: str(unichr(x))
    result = map(f, decrypt_list)
    return "".join(result)

# Test
message = "Go to hell!"
secret = encrypt(convert(message))
print(secret)
public = inv_convert(decrypt(secret))
print(public)

费马与欧拉

发觉此人 被愚弄了,厨子很生气,后果很严重。厨子发奋都看书,知道了你这个 加密依据叫RSA,是三为发明者家 人 R. Rivest, A. Shamir和L. Adelman名字首字母合起来的。RSA算法是1977年发明者家 的。全称是RSA Public Key System。你这个 "Public Key"是公共密钥,也其他 亲戚亲戚亲们中间说的锁。再读下去,厨子大窘。你这个 1977年的,现代计算机加密的RSA算法,青春恋爱物语源于17世纪。

1. 费马小定律

RSA的原理借助了数论中的“欧拉定理”(Euler's theorem)。17世纪的费马首先给出一一还还有一个 该定理的特殊形式,即“费马小定理”:

p是一一还还有一个 正的质数,a是任意一一还还有一个 不到被p整除的整数。不到 ,[$a^{p-1} - 1$]能被p整除。

亲戚亲戚亲们未必可不还可不能能这样 来越多入了解费马小定理,可能性等下就会都看你这个 定理的“升级版”。但你这个 定理依然很美妙,它优美的得到乘方和整除的并都不 特殊关系。使用一一还还有一个 例子来说明它。比如[$p = 7,a = 3$]。不到 费马小定律表示,[$3^{ 7 - 1} - 1$]可不还可不能能 被7整除。

事实上,中间的数字计算得到[$3^6 - 1 = 728$],它着实可不还可不能能 被7整除。

练习:尝试一一还还有一个 其它的例子,比如[$p = 5, a = 4$],验证费马小定律是是否是成立。

*** 数学小贴士:

1) 除 (divide),商余数:一一还还有一个 整数相除,有一一还还有一个 为整数的商,和一一还还有一个 余数。比如[$10/3 = 3, \,余1$]。亲戚亲戚亲们用一一还还有一个 特别的依据记录你这个 叙述:

$$10 \equiv 1 (mod\, 3)$$

才可不还可不能能 写成另并都不 依据:

$$[10]_3 = [1]_3$$

你这个 表述依据与“10除以3,得3余1”不到 的依据并不到 那先 区别。但采用标准的数学依据更容易和别人交流。

可能性亲戚亲戚亲们知道:

$$[a]_n = [b]_n$$

不到 趋于稳定某个整数t,且:

$$a = nt + b$$

2) 整除 (divisible):当一一还还有一个 整数a除以不到 整数b,余数为0时,不到 亲戚亲戚亲们说a可不还可不能能 被b整除。比如说,4可不还可不能能 被2整除。即

$$[4]_2 = [0]_2$$

3) 质数 (prime number):一一还还有一个 质数是不到被[$ \pm 1$]和你这个 数自身整除的整数(不包括[$ \pm 1$])。比如[$2,3,5,7,11,13$]等等。

******

费马是一名律师,也是一名业余数学家。他对数学贡献很大,堪称“业余数学家之王”。比如他和帕斯卡的通信是是否是概率论的开端。还有“费马大定理”,可能性称为“费马猜想”。费马有在书边写注释的习惯。他在页边角写下了费马猜想,并说:

我发现了一一还还有一个 美妙的证明,但可能性空白太小而不到 写下来。

费马此人 的证明不到 再被发现。“费马猜想”的证明是50多年后,以现代数学为工具证得的,而那先 数学工具在费马的时代是不趋于稳定的。这意味现代的数学家怀疑费马是前会在吹牛。费马小定理是费马的不到 定理。在费马那里,也还是个猜想。证明要等到欧拉。

多线程 员们:注释要完正啊!

2. 欧拉定律

时间流过一百年。欧拉是18世纪的瑞典数学家。这位数学巨人写了75本数学专著,几乎把当时所有的数学领域都征服了一遍。欧拉要是 被叶卡捷琳娜二世邀请到俄国。据说,无神论者狄徳罗造访俄国,他宣称上帝未必趋于稳定,靠雄辩击败了整个俄国宫廷。欧拉曾醉心神学,对上帝很虔诚。欧拉看不下去了,上前说,“先生,[$e^{i\pi} + 1= 0$],其他上帝趋于稳定。请回答!” 狄徳罗败给你这个 问题图片,灰溜溜的走了。

(你这个 传说的可信度不高,可能性狄徳罗此人 也是一位颇有造诣的数学家。)

欧拉定理(Euler's theorem)是欧拉在证明费马小定理的过程中,发现的一一还还有一个 适用性更广的定理。

首先定义一一还还有一个 函数,叫做欧拉Phi函数,即[$\phi(n)$],其中,n是一一还还有一个 正整数。

$$\phi(n) = 总数(从1到n-1,与n互质的整数)$$

比如5,不到 1,2,3,4,都与5互质。与5互质的数有一一还还有一个 。[$\phi(5) = 4$]

再比如6,与1,5互质,与2,3,4未必互质。有日后,[$\phi(6) = 2$]

对于一一还还有一个 质数p来说,它和1, 2, 3, ..., p - 1都互质,其他[$\phi(p) = p - 1$]。比如[$\phi(7) = 6, \phi(11) = 10$]

*** “互质”的数学小贴士:

1) 因子 (factor):每个整数都可不还可不能能 写成质数相乘的形式,每个不到 的质数称为该整数的一一还还有一个 因子。

2) 互质 (relative prime):可能性一一还还有一个 整数不到 公共因子,你这个 一还还有一个 质数互质。

******

欧拉定理叙述如下:

可能性n是一一还还有一个 正整数,a是任意一一还还有一个 非0整数,且n和a互质。不到 ,[$a^{\phi(n)} - 1$]可不还可不能能 被n整除。  (1)

可能性质数p有[$\phi(p) = p - 1$]。有日后,从欧拉定理可不还可不能能 推出费马小定理。亲戚亲戚亲们可不还可不能能 只使用欧拉定理,把费马小定理抛到脑后了。亲戚亲戚亲们用一一还还有一个 例子简单的检验欧拉定理。可能性n是6,不到 [$\phi(6) = 2$]。让a是11,和6互质。[$11^2 - 1$]为120,着实可不还可不能能 被n,也其他 6整除,符合欧拉定理。

数学中还有一一还还有一个 关于Phi函数的推论

m和n是互质的正整数。不到 ,[$\phi(mn) = \phi(m) \phi(n)$]        (2)

RSA西游记

下面亲戚亲戚亲们要进入实质的证明。除了中间的(1)和(2)推论,还可不还可不能能提前说明一一还还有一个 问题图片,即:

[$[ab]_n = [a]_n[b]_n$]        (3)

证明:假设a和b除以n的余数为[$c_1, c_2$]。a和b可不还可不能能 写成[$a = nt_1 + c_1, b = nt_2 + c_2$]。不到 ,[$ab = n^2t_1t_2 + nt_1c_2 + nt_2c_1 + c_1c_2$]。有日后ab除以n的余数为[$c_1c_2$]。即[$[ab]_n = [a]_n[b]_n$]。

根据此可不还可不能能 推论,[$[a^m]_n = [a]_n^m$]。

演一出叫做“西游记”的大戏,选角日后刚开始:

先选者一一还还有一个 质数p和q,分别是沙和尚和白龙马。让[$n = pq$],n是唐僧。一路向西,唐僧靠的是沙和尚和白龙马出力:一一还还有一个 背行李,一一还还有一个 驮人。

而[$k = \phi(n) = (p - 1)(q - 1)$]。这里使用了(2)以及“质数p的Phi函数值为p-1”。k是八戒,也其他 Phi(唐僧),其他 唐僧的一一还还有一个 跟屁虫。

选者任意d,并保证它与k互质。d是观音。观音姐姐在高老庄,真的是把八戒给“质”了一把。

取整数e,使得[$[de]_k = [1]_k$]。也其他 说[$de = kt + 1$],t为某一整数。e是悟空,横行无忌。

亲戚亲戚亲们记得公开的用来上锁的一一还还有一个 数字,它们分别是悟空e和唐僧n。悟空威力大,负责乘方。唐僧太唠叨:一切妖怪见到它,就变成了余数。悟空和唐僧媒体协作,就把世界搞乱了。

总部的观音姐姐d看不下去了。观音姐姐威力也大,也是乘方。再逼着唐僧重新唠叨。世界就恢复了。

善哉,善哉!

亲戚亲戚亲们看一下你这个 魔幻大片“西游记”的现实主义原理。根据欧拉定理(1),对于任意z,可能性z与n互质,不到 :

$$[z^{\phi(n)}]_n = [z^k]_n = [1]_n$$

有日后,

$$[z^{de}]_n = [z^{kt + 1}]_n = [(z^k)^tz]_n =  [z]_n$$

中间主要使用了[$de = kt + 1$]以及(3)。也其他 说:

$$[z^{de}]_n = [z]_n$$

根据(3)的推论,有

$$([z^e]_n)^d = [z]_n$$

妖怪z,经过e和d的各一道,又变回了妖!中间过程中,悟空e和观音d忙得不亦乐乎,唐僧n就在一旁边唠叨边打酱油了。

你这个 等式,也正是亲戚亲戚亲们加密又解密的过程 (加密: 悟空次方 + 唐僧唠叨。解密: 观音次方 + 唐僧唠叨)。悟空和唐僧是公钥,扔出去亮相。观音是私钥,偷偷藏起来,必要的要是 才出来。

(中间都默认余数是最小正余数,也其他 说,10除以3的余数为1,而前会4。尽管4才可不还可不能能 是是否是10的余数,即[$[4]_3 = [10]_3$]。)

姐姐,饶了我吧。

3和8一一还还有一个 妖怪见到唐僧5,都被唠叨成了余数3。不到 就观音姐姐就算法力无边,还是不到 还原。为了让唐僧求余的要是 ,我这样 多 把数字弄混了,RSA算法要求所有妖怪z小于唐僧n。为了对足够多的字符转码加密,n可不还可不能能大过最大的妖怪。

但唐僧n大更重要的意味是要保护马仔。想破解,可不还可不能能找到观音。回顾亲戚亲戚亲们选者角色的过程。亲戚亲戚亲们可不还可不能能 不到 破解:唐僧n是公开的,1) 先找到它的隐藏手下沙和尚和白龙马。2) 沙和尚和白龙马知道了,不到 二师兄k就保不住了。3) de = kt + 1,即找到一一还还有一个 e,可不还可不能能 让de - 1被k整除。观音姐姐就找到了。

中间的整个破解过程中,最困难的是第一步,即找到一一还还有一个 隐藏的打手。通常,p和q前会选的非常大,比如说50位。这意味唐僧n也非常大,有50位。寻找一一还还有一个 50位数字的质数分解未必容易,亲戚亲戚亲们要做的除法运算次数共要为[$\sqrt{10^{50}}/2$]。这是[$10^{199}$]次除法运算!天河2号每秒浮点运是是否是[$10^{16}$]级别。不到 ,找到隐藏打手的工作,共要可不还可不能能[$10^{174}$]年……。你这个 活,看来不到佛祖干了。

练习 可能性唐僧趋于稳定问题大一段话,马仔就危险了。想想要是 的厨子,知道悟空是3,唐僧是10。隐藏打手是谁? 八戒呢? 观音呢?

总之,带头大哥趋于稳定问题“罩”一段话,团伙就要被一窝端了。

总结

正如我在“数学与编程”中提到的,数学可不还可不能能 是多线程 员军火库含有力的武器。加密、解密你这个 事关IT安全的大课题,却和数论你这个 纯粹数学好科趋于稳定奇妙的关系。RSA算法的数学基础在于欧拉定理。你这个 诞生了几百年不到 那先 实用性的数学理论,却在网络时代,找到此人 的栖身之处。

RSA算法是非对称算法。公开的加密依据,私有的解密依据。RSA安全的关键在于好难对一一还还有一个 大的整数进行因子分解。下一次,可能性都看RSA被破解类式的消息,卧底可不还可不能能大喊一声:“不给力呀,老湿!”