CSAPP Lab2 Defusing a Binary Bomb

CSAPP Lab2 Defusing a Binary Bomb

由于实验需要在 x86-64 环境下使用,因此我不得不放弃使用 m1 芯片的 mac 转而使用 win10 在虚拟机上跑了个 centos,这里用 vmware 安装好后,再在 centos 上安装 GDB 即可。

实验前务必参考 讲义

准备工作

首先,使用 objdump 反编译 bomb,方便后面拆炸弹。

1
[root@MiWiFi-R4A-srv bomb]# objdump -d bomb > bomb.txt

然后常用 GDB 命令查询了解即可,GDB 常用命令 - 大 CC - 博客园 (cnblogs.com) 。最后是 x86-64 架构的寄存器含义,可以参考 【原创】X86_64/X86 GNU 汇编、寄存器、内嵌汇编 - 沐多 - 博客园 (cnblogs.com),建议反复看。另外,如果想从 gdb 运行中途出来打印,又不想没头苍蝇一样打断点,可以直接俄 ctrl+c 出来,然后 continue 继续。

Phase1

1
2
3
4
5
6
/* Hmm...  Six phases must be more secure than one phase! */
input = read_line(); /* Get input */
phase_1(input); /* Run the phase */
phase_defused(); /* Drat! They figured it out!
/* Let me know how they did it. */
printf("Phase 1 defused. How about the next one?\n");
1
2
3
4
5
6
7
8
9
0000000000400ee0 <phase_1>:
400ee0: 48 83 ec 08 sub $0x8,%rsp
400ee4: be 00 24 40 00 mov $0x402400,%esi
400ee9: e8 4a 04 00 00 callq 401338 <strings_not_equal>
400eee: 85 c0 test %eax,%eax
400ef0: 74 05 je 400ef7 <phase_1+0x17>
400ef2: e8 43 05 00 00 callq 40143a <explode_bomb>
400ef7: 48 83 c4 08 add $0x8,%rsp
400efb: c3 retq

从 c 代码中不难发现,我们输入一行字符串作为参数,进入 phase1 进行解析。在反汇编得到的文件中找到 phase1 相关部分,挨个解析,再次提示可以反复查阅 【原创】X86_64/X86 GNU 汇编、寄存器、内嵌汇编 - 沐多 - 博客园 (cnblogs.com)

首先,esi 寄存器保存了 0x402400,按照经验这应该是一个地址,然后调用了函数 strings_not_equal,其功能不难猜出是比较两个字符串是否相等。注意,esi 常用来保存第二个参数,而 edi 常用保存第一个参数,由于在进入 strings_not_equal 之前并没有对其修改,所以其接受的第一个参数默认是父函数也就是 phase_1 接受的第一个(也是唯一一个)参数,即我们所输入的字符串。当我们得到结果后,会经过一段由 test 和 je 组合的检测代码,如果 eax 等于 0 则跳转,越过 explode_bomb。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
0000000000401338 <strings_not_equal>:
401338: 41 54 push %r12
40133a: 55 push %rbp
40133b: 53 push %rbx
40133c: 48 89 fb mov %rdi,%rbx // 字符串 input
40133f: 48 89 f5 mov %rsi,%rbp // 字符串"???"
401342: e8 d4 ff ff ff callq 40131b <string_length>
401347: 41 89 c4 mov %eax,%r12d
40134a: 48 89 ef mov %rbp,%rdi
40134d: e8 c9 ff ff ff callq 40131b <string_length>
401352: ba 01 00 00 00 mov $0x1,%edx
401357: 41 39 c4 cmp %eax,%r12d
40135a: 75 3f jne 40139b <strings_not_equal+0x63>
40135c: 0f b6 03 movzbl (%rbx),%eax
40135f: 84 c0 test %al,%al // 长度为 0 jump
401361: 74 25 je 401388 <strings_not_equal+0x50>
401363: 3a 45 00 cmp 0x0(%rbp),%al
401366: 74 0a je 401372 <strings_not_equal+0x3a>
401368: eb 25 jmp 40138f <strings_not_equal+0x57>
40136a: 3a 45 00 cmp 0x0(%rbp),%al
40136d: 0f 1f 00 nopl (%rax)
401370: 75 24 jne 401396 <strings_not_equal+0x5e>
401372: 48 83 c3 01 add $0x1,%rbx
401376: 48 83 c5 01 add $0x1,%rbp
40137a: 0f b6 03 movzbl (%rbx),%eax
40137d: 84 c0 test %al,%al
40137f: 75 e9 jne 40136a <strings_not_equal+0x32>
401381: ba 00 00 00 00 mov $0x0,%edx
401386: eb 13 jmp 40139b <strings_not_equal+0x63>
401388: ba 00 00 00 00 mov $0x0,%edx
40138d: eb 0c jmp 40139b <strings_not_equal+0x63>
40138f: ba 01 00 00 00 mov $0x1,%edx
401394: eb 05 jmp 40139b <strings_not_equal+0x63>
401396: ba 01 00 00 00 mov $0x1,%edx
40139b: 89 d0 mov %edx,%eax
40139d: 5b pop %rbx
40139e: 5d pop %rbp
40139f: 41 5c pop %r12
4013a1: c3 retq

然后,进入 strings_not_equal 具体分析,string_length 内部就是不断累加长度直到遇到’\0’。如果字符串 a 和 b 长度不相等就返回 1,长度相等且长度为 0 则返回 0,然后一个字符一个字符比较。

1
2
(gdb) print (char *)0x402400
$1 = 0x402400 "Border relations with Canada have never been better."

现在,我们知道 0x402400 确实是一个字符串起始地址,直接通过 GDB 找到并输入即可。

Phase2

1
2
3
4
5
6
/* The second phase is harder.  No one will ever figure out
* how to defuse this... */
input = read_line();
phase_2(input);
phase_defused();
printf("That's number 2. Keep going!\n");
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
0000000000400efc <phase_2>:
400efc: 55 push %rbp
400efd: 53 push %rbx
400efe: 48 83 ec 28 sub $0x28,%rsp
400f02: 48 89 e6 mov %rsp,%rsi
400f05: e8 52 05 00 00 callq 40145c <read_six_numbers>
400f0a: 83 3c 24 01 cmpl $0x1,(%rsp)
400f0e: 74 20 je 400f30 <phase_2+0x34>
400f10: e8 25 05 00 00 callq 40143a <explode_bomb>
400f15: eb 19 jmp 400f30 <phase_2+0x34>
400f17: 8b 43 fc mov -0x4(%rbx),%eax
400f1a: 01 c0 add %eax,%eax
400f1c: 39 03 cmp %eax,(%rbx)
400f1e: 74 05 je 400f25 <phase_2+0x29>
400f20: e8 15 05 00 00 callq 40143a <explode_bomb>
400f25: 48 83 c3 04 add $0x4,%rbx
400f29: 48 39 eb cmp %rbp,%rbx
400f2c: 75 e9 jne 400f17 <phase_2+0x1b>
400f2e: eb 0c jmp 400f3c <phase_2+0x40>
400f30: 48 8d 5c 24 04 lea 0x4(%rsp),%rbx
400f35: 48 8d 6c 24 18 lea 0x18(%rsp),%rbp
400f3a: eb db jmp 400f17 <phase_2+0x1b>
400f3c: 48 83 c4 28 add $0x28,%rsp
400f40: 5b pop %rbx
400f41: 5d pop %rbp
400f42: c3 retq

进入其汇编码后,发现有个函数 read_six_numbers,顾名思义读 6 个数字。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
000000000040145c <read_six_numbers>:
40145c: 48 83 ec 18 sub $0x18,%rsp
401460: 48 89 f2 mov %rsi,%rdx // 0->参数 3
401463: 48 8d 4e 04 lea 0x4(%rsi),%rcx // 4->参数 4
401467: 48 8d 46 14 lea 0x14(%rsi),%rax
40146b: 48 89 44 24 08 mov %rax,0x8(%rsp) // 20->参数 8
401470: 48 8d 46 10 lea 0x10(%rsi),%rax
401474: 48 89 04 24 mov %rax,(%rsp) // 16->参数 7
401478: 4c 8d 4e 0c lea 0xc(%rsi),%r9 // 12->参数 6
40147c: 4c 8d 46 08 lea 0x8(%rsi),%r8 // 8->参数 5
401480: be c3 25 40 00 mov $0x4025c3,%esi
401485: b8 00 00 00 00 mov $0x0,%eax
40148a: e8 61 f7 ff ff callq 400bf0 <__isoc99_sscanf@plt>
40148f: 83 f8 05 cmp $0x5,%eax
401492: 7f 05 jg 401499 <read_six_numbers+0x3d>
401494: e8 a1 ff ff ff callq 40143a <explode_bomb>
401499: 48 83 c4 18 add $0x18,%rsp
40149d: c3 retq

实际上其汇编码有点乱,但经过注释,不难发现其实它就是将连续六个数字的位置映射到__isoc99_sscanf@plt 函数的参数 3~8 中,第一个参数 rdi 虽然没写,但我们知道其实就是 input,而第二个参数 esi=0x4025c3 是这个读写函数的格式,我们用 gdb 直接调试可以查到:

1
2
(gdb) print (char*)0x4025c3
$3 = 0x4025c3 "%d %d %d %d %d %d"

而且,由于第一个数字(我注释 0→参数 3 那行)映射的 rsi 在父函数 phase2 中其实是 rsp,这下我们终于明白出函数 read_six_numbers 后,首先做的是将第一个数和 1 比较,相等则跳过炸弹。然后是一个循环函数,每次让前一个数的两倍和当前数比较,翻译过就是 a[i + 1] = a[i] * 2,直到 6 个数都遍历完。

最后,我们输入以 1 开始的一个等比数列即可 “1 2 4 8 16 32”,当然由于跳转语句最后用的 jg,我们后面还可以添加数字。另外,函数__isoc99_sscanf@plt 的返回值是其解析匹配成功的数字个数

Phase3

1
2
3
4
5
6
/* I guess this is too easy so far.  Some more complex code will
* confuse people. */
input = read_line();
phase_3(input);
phase_defused();
printf("Halfway there!\n");
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
0000000000400f43 <phase_3>:
400f43: 48 83 ec 18 sub $0x18,%rsp
400f47: 48 8d 4c 24 0c lea 0xc(%rsp),%rcx // 参数 4
400f4c: 48 8d 54 24 08 lea 0x8(%rsp),%rdx // 参数 3
400f51: be cf 25 40 00 mov $0x4025cf,%esi
400f56: b8 00 00 00 00 mov $0x0,%eax
400f5b: e8 90 fc ff ff callq 400bf0 <__isoc99_sscanf@plt>
400f60: 83 f8 01 cmp $0x1,%eax
400f63: 7f 05 jg 400f6a <phase_3+0x27> // jump greater
400f65: e8 d0 04 00 00 callq 40143a <explode_bomb>
400f6a: 83 7c 24 08 07 cmpl $0x7,0x8(%rsp)
400f6f: 77 3c ja 400fad <phase_3+0x6a> // jump above
400f71: 8b 44 24 08 mov 0x8(%rsp),%eax
400f75: ff 24 c5 70 24 40 00 jmpq *0x402470(,%rax,8)
400f7c: b8 cf 00 00 00 mov $0xcf,%eax // 0->0xcf=207
400f81: eb 3b jmp 400fbe <phase_3+0x7b>
400f83: b8 c3 02 00 00 mov $0x2c3,%eax // 2
400f88: eb 34 jmp 400fbe <phase_3+0x7b>
400f8a: b8 00 01 00 00 mov $0x100,%eax // 3
400f8f: eb 2d jmp 400fbe <phase_3+0x7b>
400f91: b8 85 01 00 00 mov $0x185,%eax // 4
400f96: eb 26 jmp 400fbe <phase_3+0x7b>
400f98: b8 ce 00 00 00 mov $0xce,%eax // 5
400f9d: eb 1f jmp 400fbe <phase_3+0x7b>
400f9f: b8 aa 02 00 00 mov $0x2aa,%eax // 6
400fa4: eb 18 jmp 400fbe <phase_3+0x7b>
400fa6: b8 47 01 00 00 mov $0x147,%eax // 7
400fab: eb 11 jmp 400fbe <phase_3+0x7b>
400fad: e8 88 04 00 00 callq 40143a <explode_bomb>
400fb2: b8 00 00 00 00 mov $0x0,%eax
400fb7: eb 05 jmp 400fbe <phase_3+0x7b>
400fb9: b8 37 01 00 00 mov $0x137,%eax // 1
400fbe: 3b 44 24 0c cmp 0xc(%rsp),%eax
400fc2: 74 05 je 400fc9 <phase_3+0x86>
400fc4: e8 71 04 00 00 callq 40143a <explode_bomb>
400fc9: 48 83 c4 18 add $0x18,%rsp
400fcd: c3 retq

在 phase3 起始位置我们看到了和 read_six_numbers 似曾相识的代码,不同的是这次读写格式地址变成了 0x4025cf,我们使用 gdb 解析,得到

1
2
(gdb) print (char*)0x4025cf
$4 = 0x4025cf "%d %d"

这次只需要解析两个数字,它们分别放在 0x8 (%rsp) 和 0xc (%rsp),理所当然的检查了一下解析数字数目,大于一个才能不爆炸。然后是 ja,让第一个数(我们假设为 a)不能大于 7。然后是一个跳转指令,要跳到 0x402470+8xa 这个地址。由于 8bit 为两个字节,所以我们在查看从 0~7 对应的 8 组地址时需要 16 个字节,当然也可以更多就是了,不过我们只需要 16 个字节,注意用 16 进制表示。

1
2
3
4
5
(gdb) x/16x 0x402470
0x402470: 0x00400f7c 0x00000000 0x00400fb9 0x00000000
0x402480: 0x00400f83 0x00000000 0x00400f8a 0x00000000
0x402490: 0x00400f91 0x00000000 0x00400f98 0x00000000
0x4024a0: 0x00400f9f 0x00000000 0x00400fa6 0x00000000

结合这八个地址和机器码不难发现,这就是一个分支选择,写入下标和其对应数字即可,比如 “0 207”。

Phase4

1
2
3
4
5
/* Oh yeah?  Well, how good is your math?  Try on this saucy problem! */
input = read_line();
phase_4(input);
phase_defused();
printf("So you got that one. Try this one.\n");
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
000000000040100c <phase_4>:
40100c: 48 83 ec 18 sub $0x18,%rsp
401010: 48 8d 4c 24 0c lea 0xc(%rsp),%rcx
401015: 48 8d 54 24 08 lea 0x8(%rsp),%rdx
40101a: be cf 25 40 00 mov $0x4025cf,%esi
40101f: b8 00 00 00 00 mov $0x0,%eax
401024: e8 c7 fb ff ff callq 400bf0 <__isoc99_sscanf@plt>
401029: 83 f8 02 cmp $0x2,%eax
40102c: 75 07 jne 401035 <phase_4+0x29>
40102e: 83 7c 24 08 0e cmpl $0xe,0x8(%rsp)
401033: 76 05 jbe 40103a <phase_4+0x2e> // below & equal
401035: e8 00 04 00 00 callq 40143a <explode_bomb>
40103a: ba 0e 00 00 00 mov $0xe,%edx
40103f: be 00 00 00 00 mov $0x0,%esi
401044: 8b 7c 24 08 mov 0x8(%rsp),%edi
401048: e8 81 ff ff ff callq 400fce <func4>
40104d: 85 c0 test %eax,%eax
40104f: 75 07 jne 401058 <phase_4+0x4c>
401051: 83 7c 24 0c 00 cmpl $0x0,0xc(%rsp)
401056: 74 05 je 40105d <phase_4+0x51>
401058: e8 dd 03 00 00 callq 40143a <explode_bomb>
40105d: 48 83 c4 18 add $0x18,%rsp
401061: c3 retq

phase4 依然是读入两个数字,jbe 就是 jump+below+equal 的组合,其含义不言自明,第一个数要小于等于 14。然后预设了两个参数 14 和 0,和输入的第一个数一起传入 func4。后面紧跟 test 和 jne,要求 func4 结果必须为 0,后面的 cmpl 和 je 要求第二个数必须为 0。一切都很明朗,我们需要输入一个 x 和一个 0。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
0000000000400fce <func4>:
400fce: 48 83 ec 08 sub $0x8,%rsp
400fd2: 89 d0 mov %edx,%eax
400fd4: 29 f0 sub %esi,%eax
400fd6: 89 c1 mov %eax,%ecx
400fd8: c1 e9 1f shr $0x1f,%ecx // shift+right
400fdb: 01 c8 add %ecx,%eax
400fdd: d1 f8 sar %eax
400fdf: 8d 0c 30 lea (%rax,%rsi,1),%ecx // (r - l) / 2 + l
400fe2: 39 f9 cmp %edi,%ecx
400fe4: 7e 0c jle 400ff2 <func4+0x24>
400fe6: 8d 51 ff lea -0x1(%rcx),%edx // r = mid - 1
400fe9: e8 e0 ff ff ff callq 400fce <func4>
400fee: 01 c0 add %eax,%eax
400ff0: eb 15 jmp 401007 <func4+0x39>
400ff2: b8 00 00 00 00 mov $0x0,%eax
400ff7: 39 f9 cmp %edi,%ecx
400ff9: 7d 0c jge 401007 <func4+0x39>
400ffb: 8d 71 01 lea 0x1(%rcx),%esi // l = mid + 1
400ffe: e8 cb ff ff ff callq 400fce <func4>
401003: 8d 44 00 01 lea 0x1(%rax,%rax,1),%eax
401007: 48 83 c4 08 add $0x8,%rsp
40100b: c3 retq

由于 func4 有递归,所以我们可以假设输入的是 x,l,r,然后是 (r-l)/2+l。这里有一些细节,shr 逻辑右移时用 0 填充,lea 等效于 mov 的源操作数从地址变成了内容(lea (A) B == mov A B)。以及通过逻辑右移获得 l 和 r 两个变量差值的符号位,这里需要解释一下,由于 ecx 是 32 位形式,所以逻辑右移 31 位得到符号位,这个操作本质是让 r 大于等于 l。然后,我们不难发现,eax 会在从高半区返回后乘以 2 加 1(401003),而从低半区返回后仅仅乘以 2。

综上,我们了解到,首先需要 r 大于等于 l,然后每次都从低半区出来,由于判断语句是 jle,所以等于情况也算作低半区。又因为之前分析过,x 需要小于等于 14,所以只有 0,1,3,7 这四个数字符合,填入即可。

Phase5

1
2
3
4
5
/* Round and 'round in memory we go, where we stop, the bomb blows! */
input = read_line();
phase_5(input);
phase_defused();
printf("Good work! On to the next...\n");
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
0000000000401062 <phase_5>:
401062: 53 push %rbx
401063: 48 83 ec 20 sub $0x20,%rsp
401067: 48 89 fb mov %rdi,%rbx
40106a: 64 48 8b 04 25 28 00 mov %fs:0x28,%rax
401071: 00 00
401073: 48 89 44 24 18 mov %rax,0x18(%rsp)
401078: 31 c0 xor %eax,%eax
40107a: e8 9c 02 00 00 callq 40131b <string_length>
40107f: 83 f8 06 cmp $0x6,%eax
401082: 74 4e je 4010d2 <phase_5+0x70>
401084: e8 b1 03 00 00 callq 40143a <explode_bomb>
401089: eb 47 jmp 4010d2 <phase_5+0x70>
40108b: 0f b6 0c 03 movzbl (%rbx,%rax,1),%ecx
40108f: 88 0c 24 mov %cl,(%rsp)
401092: 48 8b 14 24 mov (%rsp),%rdx
401096: 83 e2 0f and $0xf,%edx
401099: 0f b6 92 b0 24 40 00 movzbl 0x4024b0(%rdx),%edx
4010a0: 88 54 04 10 mov %dl,0x10(%rsp,%rax,1)
4010a4: 48 83 c0 01 add $0x1,%rax
4010a8: 48 83 f8 06 cmp $0x6,%rax
4010ac: 75 dd jne 40108b <phase_5+0x29>
4010ae: c6 44 24 16 00 movb $0x0,0x16(%rsp)
4010b3: be 5e 24 40 00 mov $0x40245e,%esi
4010b8: 48 8d 7c 24 10 lea 0x10(%rsp),%rdi
4010bd: e8 76 02 00 00 callq 401338 <strings_not_equal>
4010c2: 85 c0 test %eax,%eax
4010c4: 74 13 je 4010d9 <phase_5+0x77>
4010c6: e8 6f 03 00 00 callq 40143a <explode_bomb>
4010cb: 0f 1f 44 00 00 nopl 0x0(%rax,%rax,1)
4010d0: eb 07 jmp 4010d9 <phase_5+0x77>
4010d2: b8 00 00 00 00 mov $0x0,%eax
4010d7: eb b2 jmp 40108b <phase_5+0x29>
4010d9: 48 8b 44 24 18 mov 0x18(%rsp),%rax
4010de: 64 48 33 04 25 28 00 xor %fs:0x28,%rax
4010e5: 00 00
4010e7: 74 05 je 4010ee <phase_5+0x8c>
4010e9: e8 42 fa ff ff callq 400b30 <__stack_chk_fail@plt>
4010ee: 48 83 c4 20 add $0x20,%rsp
4010f2: 5b pop %rbx
4010f3: c3 retq

通过函数 string_length 函数限制输入字符串长度为 6,然后是一段循环,观察代码 (%rbx,%rax,1),由于 rbx 是起始位置,所以不断增加 rax 即可达到遍历每个字符的效果。由于 cl 是 rcx 的 8 比特形式(相当于 mod255),后面又和 0xf 相与(相当于去后四位为有效数字),然后将结果同地址 0x4024b0 加起来得到一个新的地址,这个地址显然保存着一个数,将这个数存到 edx。而 dl 是 edx 的 8 比特形式,存到 0x10 (%rsp+rax * 1)。综合来看,就是将我们输入的六个字符按照特殊方式挨个转换成新的字符,最后同 0x40245e 处的字符串比较,匹配就不爆炸。

1
2
3
4
(gdb) print (char*)0x4024b0
$6 = 0x4024b0 <array> "maduiersnfotvbylSo you think you can stop the bomb with ctrl-c, do you?"
(gdb) print (char*)0x40245e
$7 = 0x40245e "flyers"

这里字典很长,但其实我们只需要前 16 个有效字母,也就是 “maduiersnfotvbyl”,而 “flyers” 映射到字母序列为 “f-9 l-15 y-14 e-5 r-6 s-7”,而恰好 a 的 ASCII 码等于 0110 0001,当然 A 对应 0100 0001,所以大小写其实都是等效的,我们通过目标字符串解析的对应下标,倒推我们的源码为 “ionefg”。

另外,汇编中的 401063、40106a 和 4010d9、4010de 呼应,如果二者不匹配会报错。

Phase6

1
2
3
4
5
/* This phase will never be used, since no one will get past the
* earlier ones. But just in case, make this one extra hard. */
input = read_line();
phase_6(input);
phase_defused();
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
00000000004010f4 <phase_6>:
4010f4: 41 56 push %r14
4010f6: 41 55 push %r13
4010f8: 41 54 push %r12
4010fa: 55 push %rbp
4010fb: 53 push %rbx
4010fc: 48 83 ec 50 sub $0x50,%rsp
401100: 49 89 e5 mov %rsp,%r13
401103: 48 89 e6 mov %rsp,%rsi
401106: e8 51 03 00 00 callq 40145c <read_six_numbers>
40110b: 49 89 e6 mov %rsp,%r14
40110e: 41 bc 00 00 00 00 mov $0x0,%r12d
====================================================
401114: 4c 89 ed mov %r13,%rbp
401117: 41 8b 45 00 mov 0x0(%r13),%eax
40111b: 83 e8 01 sub $0x1,%eax
40111e: 83 f8 05 cmp $0x5,%eax
401121: 76 05 jbe 401128 <phase_6+0x34>
401123: e8 12 03 00 00 callq 40143a <explode_bomb>
401128: 41 83 c4 01 add $0x1,%r12d
40112c: 41 83 fc 06 cmp $0x6,%r12d
401130: 74 21 je 401153 <phase_6+0x5f>
401132: 44 89 e3 mov %r12d,%ebx
401135: 48 63 c3 movslq %ebx,%rax
401138: 8b 04 84 mov (%rsp,%rax,4),%eax
40113b: 39 45 00 cmp %eax,0x0(%rbp)
40113e: 75 05 jne 401145 <phase_6+0x51>
401140: e8 f5 02 00 00 callq 40143a <explode_bomb>
401145: 83 c3 01 add $0x1,%ebx
401148: 83 fb 05 cmp $0x5,%ebx
40114b: 7e e8 jle 401135 <phase_6+0x41>
40114d: 49 83 c5 04 add $0x4,%r13
401151: eb c1 jmp 401114 <phase_6+0x20>
====================================================
401153: 48 8d 74 24 18 lea 0x18(%rsp),%rsi
401158: 4c 89 f0 mov %r14,%rax
40115b: b9 07 00 00 00 mov $0x7,%ecx
401160: 89 ca mov %ecx,%edx
401162: 2b 10 sub (%rax),%edx
401164: 89 10 mov %edx,(%rax)
401166: 48 83 c0 04 add $0x4,%rax
40116a: 48 39 f0 cmp %rsi,%rax
40116d: 75 f1 jne 401160 <phase_6+0x6c>
40116f: be 00 00 00 00 mov $0x0,%esi
401174: eb 21 jmp 401197 <phase_6+0xa3>
401176: 48 8b 52 08 mov 0x8(%rdx),%rdx
40117a: 83 c0 01 add $0x1,%eax
40117d: 39 c8 cmp %ecx,%eax
40117f: 75 f5 jne 401176 <phase_6+0x82>
401181: eb 05 jmp 401188 <phase_6+0x94>
401183: ba d0 32 60 00 mov $0x6032d0,%edx
401188: 48 89 54 74 20 mov %rdx,0x20(%rsp,%rsi,2)
40118d: 48 83 c6 04 add $0x4,%rsi
401191: 48 83 fe 18 cmp $0x18,%rsi
401195: 74 14 je 4011ab <phase_6+0xb7>
401197: 8b 0c 34 mov (%rsp,%rsi,1),%ecx
40119a: 83 f9 01 cmp $0x1,%ecx
40119d: 7e e4 jle 401183 <phase_6+0x8f>
40119f: b8 01 00 00 00 mov $0x1,%eax
4011a4: ba d0 32 60 00 mov $0x6032d0,%edx
4011a9: eb cb jmp 401176 <phase_6+0x82>
====================================================
4011ab: 48 8b 5c 24 20 mov 0x20(%rsp),%rbx
4011b0: 48 8d 44 24 28 lea 0x28(%rsp),%rax
4011b5: 48 8d 74 24 50 lea 0x50(%rsp),%rsi
4011ba: 48 89 d9 mov %rbx,%rcx
4011bd: 48 8b 10 mov (%rax),%rdx
4011c0: 48 89 51 08 mov %rdx,0x8(%rcx)
4011c4: 48 83 c0 08 add $0x8,%rax
4011c8: 48 39 f0 cmp %rsi,%rax
4011cb: 74 05 je 4011d2 <phase_6+0xde>
4011cd: 48 89 d1 mov %rdx,%rcx
4011d0: eb eb jmp 4011bd <phase_6+0xc9>
4011d2: 48 c7 42 08 00 00 00 movq $0x0,0x8(%rdx)
4011d9: 00
4011da: bd 05 00 00 00 mov $0x5,%ebp
4011df: 48 8b 43 08 mov 0x8(%rbx),%rax
4011e3: 8b 00 mov (%rax),%eax
4011e5: 39 03 cmp %eax,(%rbx)
4011e7: 7d 05 jge 4011ee <phase_6+0xfa>
4011e9: e8 4c 02 00 00 callq 40143a <explode_bomb>
4011ee: 48 8b 5b 08 mov 0x8(%rbx),%rbx
4011f2: 83 ed 01 sub $0x1,%ebp
4011f5: 75 e8 jne 4011df <phase_6+0xeb>
4011f7: 48 83 c4 50 add $0x50,%rsp
4011fb: 5b pop %rbx
4011fc: 5d pop %rbp
4011fd: 41 5c pop %r12
4011ff: 41 5d pop %r13
401201: 41 5e pop %r14
401203: c3 retq

c++ - Print the whole linked list in gdb? - Stack Overflow

在分析代码的过程,我发现这段冗长的代码主要可以分为三个部分,一开始是常规的读入我们输入的六个数字,然后在第一部分将输入 input 根据值转换成新的六个数字(这里我们设其为数组 a),然后在第二部分会根据 a 的值和一个特殊地址 0x5032d0 二者得到得到六个地址(这里我们设其为数组 b,里面每个值都是一个地址),最后在第三部分判断根据 b 的地址得到的值是否满足降序排列,也就是 [b [i] ≥ b [i + 1]]。

下面我们逆向分析,首先通过打印 0x5032d0 处的数据不难发现,其类型为节点,而通过之前的分析,我们知道一共有 6 个节点,观察发现每个节点占四个字节:

1
2
3
4
5
6
7
(gdb) x/24w 0x6032d0
0x6032d0 <node1>: 0x0000014c 0x00000001 0x006032e0 0x00000000
0x6032e0 <node2>: 0x000000a8 0x00000002 0x006032f0 0x00000000
0x6032f0 <node3>: 0x0000039c 0x00000003 0x00603300 0x00000000
0x603300 <node4>: 0x000002b3 0x00000004 0x00603310 0x00000000
0x603310 <node5>: 0x000001dd 0x00000005 0x00603320 0x00000000
0x603320 <node6>: 0x000001bb 0x00000006 0x00000000 0x00000000

经过解析得到六个节点值为 0x14c、0xa8、0x39c、0x2b3、0x1dd、0x1bb,为了让其降序排列,我们需要将其下标交换,得到 3、4、5、6、1、2,也就是 b [0] 存 node3 的地址,b [1] 存 node4 的地址,以此类推。

再进入第二部分,经过分析,我们发现可以分两种情况:当 a [i]≤1 时,直接让 b [i]=node1;当 a [i]>1 时,会有一个变量 %edx(我们假设它是 j)从 2 到 6 遍历,直到 j 和 a [i] 相等时,让 b [i]=nodej。现在我们应该能推断,实际上 a [i] 的值应是 2~6 以及一个可能为 1 或者 0 的值,而这部分的逻辑就是 b [i]=node_a [i],而为了得到 b=[node3,node4,node5,node6,node1,node2],需要让 a=[3, 4, 5, 6, 0 or 1, 2]。

现在再分析第一部分,这部分就相对比较简单了,a [i] = 7 - input [i],且 a [i] 两两不相等并且限制了输入数字不能大于 6,所以 a [4] 不能等于 0,综上得到 input=“4 3 2 1 6 5”

答案:

1.“Border relations with Canada have never been better.”

2.“1 2 4 8 16 32”

3.“0 207”

4.“0 0”

5.“ionefg”

6.“4 3 2 1 6 5”

参考:

《深入理解计算机系统》Bomb Lab 实验解析 | Yi’s Blog (earthaa.github.io)

CMU 15213: Bomb Lab (1) | Wei Bai 白巍 (wordpress.com)

CSAPP Lab2 Defusing a Binary Bomb

https://zion4h.github.io/2022/06/02/CSAPP-LAB-2/

作者

zion h4

发布于

2022-06-02

更新于

2024-09-08

许可协议

评论