计算机系统基础综合实践 PA1

NEMU 是什么?

PA的目的是要实现NEMU, 一款经过简化的全系统模拟器.

但什么是模拟器呢?你小时候应该玩过红白机, 超级玛丽, 坦克大战, 魂斗罗… 它们的画面是否让你记忆犹新? (希望我们之间没有代沟…) 随着时代的发展, 你已经很难在市场上看到红白机的身影了. 当你正在为此感到苦恼的时候, 模拟器的横空出世唤醒了你心中尘封已久的童年回忆. 红白机模拟器可以为你模拟出红白机的所有功能. 有了它, 你就好像有了一个真正的红白机, 可以玩你最喜欢的红白机游戏. 这里是jyy移植的一个小型项目LiteNES, PA工程里面已经带有这个项目, 你可以在如今这个红白机难以寻觅的时代, 再次回味你儿时的快乐时光, 这实在是太神奇了!

这是实验指导书中的一段描述。

前言

理解程序如何在计算机上运行的根本途径是实现一个完整的计算机系统。

实验环境

NEMU 是基于 Linux/GNU 实验环境，所需要的环境如下：

操作系统：Ubuntu18.04
编译器：GCC-4.4.7

实验内容

阶段 1：实现“单步、打印寄存器状态、扫描内存”三个调试功能
阶段 2：实现调试功能的表达式求值
阶段 3：实现监视点

开始实验

必做任务 1：实现正确的寄存器结构体

nemu/include/cpu/reg.h

typedef struct {
    union {
        union {
            uint32_t _32;
            uint16_t _16;
            uint8_t _8[2];
        } gpr[8];

        /* Do NOT change the order of the GPRs' definitions. */

        struct {
            uint32_t eax, ecx, edx, ebx, esp, ebp, esi, edi;
        };
    };

    swaddr_t eip;
    // ...
} CPU_state;

这是关于匿名结构体和联合体的使用。我们可以在结构体中使用匿名的方式声明某个联合体（或结构体）。之后就可以直接利用结构体访问成员的方式一样访问结构体中已经声明过的匿名联合体（或结构体）的成员，使用这种方式可以让代码更加简洁。

输出结果

nemu@nemu-VirtualBox:~/NEMU$ make run
objcopy -S -O binary obj/kernel/kernel entry
obj/nemu/nemu obj/testcase/mov-c
Welcome to NEMU!
The executable is obj/testcase/mov-c.
For help, type "help"
(nemu) c
nemu: HIT GOOD TRAP at eip = 0x001012db

必做任务2：实现单步执行、打印寄存器、扫描内存

这次的任务主要是模拟GDB相关的功能。

nemu/src/monitor/debug/ui.c

static struct {
	char *name;
	char *description;
	int (*handler) (char *);
} cmd_table [] = {
	{ "help", "Display informations about all supported commands", cmd_help },
	{ "c", "Continue the execution of the program", cmd_c },
	{ "q", "Exit NEMU", cmd_q },
	{ "si", "One step", cmd_si },
	{ "info", "Display all informations of regisiters", cmd_info },
	/* TODO: Add more commands */
};

在相应位置填写所需要的指令。

单步执行

nemu/src/monitor/debug/ui.c

static int cmd_si(char *args){
	char *sencondWord = strtok(NULL," ");
	int step = 0;
	int i;
	if (sencondWord == NULL){
		cpu_exec(1);
		return 0;	
	}
	sscanf(sencondWord, "%d", &step);
	if (step <= 0){
		printf("MISINIPUT\n");
		return 0;
	}
	for (i = 0; i < step; i++){
		cpu_exec(1);
	}
	return 0;
}

添加单步执行的相关代码。这里用了for循环，一条一条指令执行。因为cpu_exec()函数中的宏MAX_INSTR_TO_PRINT限制为10，更改宏或者for循环后，两种方法都可以解决无法执行10条以上指令的问题。

打印寄存器

nemu/src/monitor/debug/ui.c

static int cmd_info(char *args){
	char *sencondWord = strtok(NULL," ");
	int i;
	if (strcmp(sencondWord, "r") == 0){
		for (i = 0; i < 8; i++){
			printf("%s\t\t", regsl[i]);
			printf("0x%08x\t\t%d\n", cpu.gpr[i]._32, cpu.gpr[i]._32);
		}
		printf("eip\t\t0x%08x\t\t%d\n", cpu.eip, cpu.eip);
	return 0;
	}
	printf("MISINPUT\n");
	return 0;
}

添加打印寄存器的相关代码。

扫描内存

nemu/src/monitor/debug/ui.c

static int cmd_x(char *args){
	char *sencondWord = strtok(NULL," ");
	char *thirdWord = strtok(NULL, " ");
	
	int step = 0;
	swaddr_t address;
	
	sscanf(sencondWord, "%d", &step);
	sscanf(thirdWord, "%x", &address);

	int i, j = 0;
	for (i = 0; i < step; i++){
		if (j % 4 == 0){
			printf("0x%x:", address);
		}
		printf("0x%08x ", swaddr_read(address, 4));
		address += 4;
		j++;
		if (j % 4 == 0){
			printf("\n");
		}
			}
	printf("\n");
	return 0;
}

添加扫描内存的相关代码，我把要输出的地址分割成一行输出五个。

这里全部使用到了char *strtok(char *str, const char *delim) 库函数，delim代表了分隔符，str则代表要被分解的一组字符串。该函数会有一个返回值，若没有可检索的字符串，则返回一个空指针，否则返回第一个子字符串。

输出结果

(nemu) si
  100000:   bd 00 00 00 00                        movl $0x0,%ebp
(nemu) si 5
  100005:   bc 00 00 00 08                        movl $0x8000000,%esp
  10000a:   e9 11 12 00 00                        jmp 101220
  101220:   55                                    pushl %ebp
  101221:   b8 60 12 10 00                        movl $0x101260,%eax
  101226:   89 e5                                 movl %esp,%ebp
(nemu) si 15
  101228:   83 ec 18                              subl $0x18,%esp
  10122b:   ff e0                                 jmp *%eax
  101260:   55                                    pushl %ebp
  101261:   89 e5                                 movl %esp,%ebp
  101263:   83 ec 18                              subl $0x18,%esp
  101266:   c7 44 24 0c a3 19 10 00               movl $0x1019a3,0xc(%esp)
  10126e:   c7 44 24 08 4a 00 00 00               movl $0x4a,0x8(%esp)
  101276:   c7 44 24 04 5c 19 10 00               movl $0x10195c,0x4(%esp)
  10127e:   c7 04 24 70 19 10 00                  movl $0x101970,(%esp)
  101285:   e8 c6 fe ff ff                        call  101150
  101150:   55                                    pushl %ebp
  101151:   89 e5                                 movl %esp,%ebp
  101153:   5d                                    popl %ebp
  101154:                                         ret
  10128a:   e8 d1 fe ff ff                        call  101160
(nemu) info r
eax             0x00101260              1053280
ecx             0x26365f3f              641097535
edx             0x5123097b              1361250683
ebx             0x7d3f57d7              2101303255
esp             0x07ffffc4              134217668
ebp             0x07ffffe0              134217696
esi             0x1d0c876a              487360362
edi             0x4d2976e8              1294563048
eip             0x00101160              1053024
(nemu) x 10 0x100000
0x100000:0x000000bd 0x0000bc00 0x11e90800 0x90000012 
0x100010:0x56e58955 0x08458b53 0x2d0c5d8b 0x40000000 
0x100020:0xeac1da89 0xf0002516

输出可能会和我稍有不同。