5 通往32位模式之路

我们一直都没有说明asmhead.nas中的如同谜一样的大约100行程序。等笔者回过神儿来,已经到了可以说明的时候了。现在就是个好机会,我们来具体看看。

在没有说明的这段程序中,最开始做的事情如下:

asmhead.nas节选

; PIC关闭一切中断
;   根据AT兼容机的规格,如果要初始化PIC,
;   必须在CLI之前进行,否则有时会挂起。
;   随后进行PIC的初始化。

        MOV      AL,0xff
        OUT      0x21, AL
        NOP                        ; 如果连续执行OUT指令,有些机种会无法正常运行
        OUT      0xa1, AL

        CLI                        ; 禁止CPU级别的中断

这段程序等同于以下内容的C程序。

io_out(PIC0_IMR, 0xff); /* 禁止主PIC的全部中断 */
io_out(PIC1_IMR, 0xff); /* 禁止从PIC的全部中断 */
io_cli(); /* 禁止CPU级别的中断*/

如果当CPU进行模式转换时进来了中断信号,那可就麻烦了。而且,后来还要进行PIC的初始化,初始化时也不允许有中断发生。所以,我们要把中断全部屏蔽掉。

顺便说一下,NOP指令什么都不做,它只是让CPU休息一个时钟长的时间。

■■■■■

再往下看,会看到以下部分。

asmhead.nas节选(续)

; 为了让CPU能够访问1MB以上的内存空间,设定A20GATE

        CALL     waitkbdout
        MOV      AL,0xd1
        OUT      0x64, AL
        CALL     waitkbdout
        MOV      AL,0xdf          ; enable A20
        OUT      0x60, AL
        CALL     waitkbdout

这里的waitkbdout,等同于wait_KBC_sendready(以后还会详细说明)。这段程序在C语言里的写法大致如下:

#define KEYCMD_WRITE_OUTPORT     0xd1
#define KBC_OUTPORT_A20G_ENABLE 0xdf

    /* A20GATE的设定 */
    wait_KBC_sendready();
    io_out8(PORT_KEYCMD, KEYCMD_WRITE_OUTPORT);
    wait_KBC_sendready();
    io_out8(PORT_KEYDAT, KBC_OUTPORT_A20G_ENABLE);
    wait_KBC_sendready(); /* 这句话是为了等待完成执行指令 */

程序的基本结构与init_keyboard完全相同,功能仅仅是往键盘控制电路发送指令。

这里发送的指令,是指令键盘控制电路的附属端口输出0xdf。这个附属端口,连接着主板上的很多地方,通过这个端口发送不同的指令,就可以实现各种各样的控制功能。

这次输出0xdf所要完成的功能,是让A20GATE信号线变成ON的状态。这条信号线的作用是什么呢?它能使内存的1MB以上的部分变成可使用状态。最初出现电脑的时候,CPU只有16位模式,所以内存最大也只有1MB。后来CPU变聪明了,可以使用很大的内存了。但为了兼容旧版的操作系统,在执行激活指令之前,电路被限制为只能使用1MB内存。和鼠标的情况很类似哟。A20GATE信号线正是用来使这个电路停止从而让所有内存都可以使用的东西。

最后还有一点,“wait_KBC_sendready(); ”是多余的。在此之后,虽然不会往键盘送命令,但仍然要等到下一个命令能够送来为止。这是为了等待A20GATE的处理切实完成。

■■■■■

我们再往下看。

asmhead.nas节选(续)

; 切换到保护模式

[INSTRSET "i486p"]                ; “想要使用486指令”的叙述
        LGDT [GDTR0] ; 设定临时GDT
        MOV EAX, CR0
        AND EAX,0x7fffffff;设bit31为0(为了禁止分页)
        OR EAX,0x00000001;设bit0为1(为了切换到保护模式)
        MOV CR0, EAX
        JMP pipelineflush

pipelineflush:
        MOV      AX,1*8           ;  可读写的段 32bit
        MOV      DS, AX
        MOV      ES, AX
        MOV      FS, AX
        MOV      GS, AX
        MOV      SS, AX

INSTRSET指令,是为了能够使用386以后的LGDT, EAX, CR0等关键字。

LGDT指令,不管三七二十一,把随意准备的GDT给读进来。对于这个暂定的GDT,我们以后还要重新设置。然后将CR0这一特殊的32位寄存器的值代入EAX,并将最高位置为0,最低位置为1,再将这个值返回给CR0寄存器。这样就完成了模式转换,进入到不用颁的保护模式。CR0,也就是control register 0,是一个非常重要的寄存器,只有操作系统才能操作它。

保护模式本来的说法应该是“protected virtual address mode”,翻译过来就是“受保护的虚拟内存地址模式”。与此相对,从前的16位模式称为“real mode”,它是“real address mode”的省略形式,翻译过来就是“实际地址模式”。这些术语中的“virtual”,“real”的区别在于计算内存地址时,是使用段寄存器的值直接指定地址值的一部分呢,还是通过GDT使用段寄存器的值指定并非实际存在的地址号码。与先前的16位模式不同,段寄存器的解释不是16倍,而是能够使用GDT。这里的“保护”,来自英文的“protect”。在这种模式下,应用程序既不能随便改变段的设定,又不能使用操作系统专用的段。操作系统受到CPU的保护,所以称为保护模式。

在保护模式中,有带保护的16位模式,和带保护的32位模式两种。我们要使用的,是带保护的32位模式。

讲解CPU的书上会写到,通过代入CR0而切换到保护模式时,要马上执行JMP指令。所以我们也执行这一指令。为什么要执行JMP指令呢?因为变成保护模式后,机器语言的解释要发生变化。CPU为了加快指令的执行速度而使用了管道(pipeline)这一机制,就是说,前一条指令还在执行的时候,就开始解释下一条甚至是再下一条指令。因为模式变了,就要重新解释一遍,所以加入了JMP指令。

而且在程序中,进入保护模式以后,段寄存器的意思也变了(不再是乘以16后再加算的意思了),除了CS以外所有段寄存器的值都从0x0000变成了0x0008。CS保持原状是因为如果CS也变了,会造成混乱,所以只有CS要放到后面再处理。0x0008,相当于“gdt + 1”的段。

■■■■■

我们再往下读程序。

asmhead.nas节选(续)

; bootpack的转送

        MOV      ESI, bootpack     ; 转送源
        MOV      EDI, BOTPAK       ; 转送目的地
        MOV      ECX,512*1024/4
        CALL     memcpy

; 磁盘数据最终转送到它本来的位置去

; 首先从启动扇区开始

        MOV      ESI,0x7c00       ; 转送源
        MOV      EDI, DSKCAC       ; 转送目的地
        MOV      ECX,512/4
        CALL     memcpy

; 所有剩下的

        MOV      ESI, DSKCAC0+512 ; 转送源
        MOV      EDI, DSKCAC+512  ; 转送目的地
        MOV      ECX,0
        MOV      CL, BYTE [CYLS]
        IMUL     ECX,512*18*2/4  ; 从柱面数变换为字节数/4
        SUB      ECX,512/4        ; 减去IPL
        CALL     memcpy

简单来说,这部分程序只是在调用memcpy函数。为了让大家掌握这段程序的大意,我们将这段程序写成了C语言形式。虽然写法本身可能不很正确,但有助于大家抓住程序的中心思想。

memcpy(bootpack,     BOTPAK,      512*1024/4);
memcpy(0x7c00,       DSKCAC,      512/4      );
memcpy(DSKCAC0+512, DSKCAC+512, cyls * 512*18*2/4-512/4);

函数memcpy是复制内存的函数,语法如下:

memcpy(转送源地址,转送目的地址,转送数据的大小);

转送数据大小是以双字为单位的,所以数据大小用字节数除以4来指定。在上面3个memcpy语句中,我们先来看看中间一句。

memcpy(0x7c00, DSKCAC, 512/4);

DSKCAC是0x00100000,所以上面这句话的意思就是从0x7c00复制512字节到0x00100000。这正好是将启动扇区复制到1MB以后的内存去的意思。下一个memcpy语句:

memcpy(DSKCAC0+512, DSKCAC+512, cyls * 512*18*2/4-512/4);

它的意思就是将始于0x00008200的磁盘内容,复制到0x00100200那里。

上文中“转送数据大小”的计算有点复杂,因为它是以柱面数来计算的,所以需要减去启动区的那一部分长度。这样始于0x00100000的内存部分,就与磁盘的内容相吻合了。顺便说一下,IMULIMUL,来自英文“integer multipule”(整数乘法)。是乘法运算,SUBSUB,来自英文“substract”(减法)。是减法运算。它们与ADD(加法)运算同属一类。

现在我们还没说明的函数就只有有程序开始处的memcpy了。bootpack是asmhead.nas的最后一个标签。haribote.sys是通过asmhead.bin和bootpack.hrb连接起来而生成的(可以通过Makefile确认),所以asmhead结束的地方,紧接着串连着bootpack.hrb最前面的部分。

memcpy(bootpack, BOTPAK, 512*1024/4);
  → 从bootpack的地址开始的512KB内容复制到0x00280000号地址去。

这就是将bootpack.hrb复制到0x00280000号地址的处理。为什么是512KB呢?这是我们酌情考虑而决定的。内存多一些不会产生什么问题,所以这个长度要比bootpack.hrb的长度大出很多。

■■■■■

后面还剩50行程序,我们继续往下看。

asmhead.nas节选(续)

; 必须由asmhead来完成的工作,至此全部完毕
;   以后就交由bootpack来完成

; bootpack的启动

        MOV      EBX, BOTPAK
        MOV      ECX, [EBX+16]
        ADD      ECX,3             ; ECX += 3;
        SHR      ECX,2             ; ECX /= 4;
        JZ       skip              ; 没有要转送的东西时
        MOV      ESI, [EBX+20]     ; 转送源
        ADD      ESI, EBX
        MOV      EDI, [EBX+12]     ; 转送目的地
        CALL     memcpy
skip:
        MOV      ESP, [EBX+12]     ; 栈初始值
        JMP      DWORD 2*8:0x0000001b

结果我们仍然只是在做memcpy。它对bootpack.hrb的header(头部内容)进行解析,将执行所必需的数据传送过去。EBX里代入的是BOTPAK,所以值如下:

[EBX + 16]......bootpack.hrb之后的第16号地址。值是0x11a8
[EBX + 20]......bootpack.hrb之后的第20号地址。值是0x10c8
[EBX + 12]......bootpack.hrb之后的第12号地址。值是0x00310000

上面这些值,是我们通过二进制编辑器,打开harib05d的bootpack.hrb后确认的。这些值因harib的版本不同而有所变化。

SHR指令是向右移位指令,相当于“ECX >>=2; ”,与除以4有着相同的效果。因为二进制的数右移1位,值就变成了1/2;左移1位,值就变成了2倍。这可能不太容易理解。还是拿我们熟悉的十进制来思考一下吧。十进制的时候,向右移动1位,值就变成了1/10(比如120 → 12);向左移动1位,值就变成了10倍(比如3 → 30)。二进制也是一样。所以,向右移动2位,正好与除以4有着同样的效果。

JZ是条件跳转指令,来自英文jump if zero,根据前一个计算结果是否为0来决定是否跳转。在这里,根据SHR的结果,如果ECX变成了0,就跳转到skip那里去。在harib05d里,ECX没有变成0,所以不跳转。

而最终这个memcpy到底用来做什么事情呢?它会将bootpack.hrb第0x10c8字节开始的0x11a8字节复制到0x00310000号地址去。大家可能不明白为什么要做这种处理,但这个问题,必须要等到“纸娃娃系统”的应用程序讲完之后才能讲清楚,所以大家现在不懂也没关系,我们以后还会说明的。

最后将0x310000代入到ESP里,然后用一个特别的JMP指令,将2 * 8代入到CS里,同时移动到0x1b号地址。这里的0x1b号地址是指第2个段的0x1b号地址。第2个段的基地址是0x280000,所以实际上是从0x28001b开始执行的。这也就是bootpack.hrb的0x1b号地址。

这样就开始执行bootpack.hrb了。

■■■■■

下面要讲的内容可能有点偏离主题,但笔者还是想介绍一下“纸娃娃系统”的内存分布图。

0x00000000-0x000fffff : 虽然在启动中会多次使用,但之后就变空。(1MB)
0x00100000-0x00267fff : 用于保存软盘的内容。(1440KB)
0x00268000-0x0026f7ff : 空(30KB)
0x0026f800-0x0026ffff : IDT(2KB)
0x00270000-0x0027ffff : GDT(64KB)
0x00280000-0x002fffff : bootpack.hrb(512KB)
0x00300000-0x003fffff : 栈及其他(1MB)
0x00400000-              : 空

这个内存分布图当然是笔者所做出来的。为什么要做成这呢?其实也没有什么特别的理由,觉得这样还行,跟着感觉走就决定了。另外,虽然没有明写,但在最初的1MB范围内,还有BIOS, VRAM等内容,也就是说并不是1MB全都空着。

从软盘读出来的东西,之所以要复制到0x00100000号以后的地址,就是因为我们意识中有这个内存分布图。同样,前几天,之所以能够确定正式版的GDT和IDT的地址,也是因为这个内存分布图。

如果一开始就制作内存分布图,那么做起操作系统来就会顺利多了。

■■■■■

关于内存分布图就讲这么多,还是让我们回到asmhead.nas的说明上来吧。

asmhead.nas节选(续)

waitkbdout:
        IN        AL,0x64
        AND       AL,0x02
        IN        AL,0x60         ; 空读(为了清空数据接收缓冲区中的垃圾数据)
        JNZ      waitkbdout       ; AND的结果如果不是0,就跳到waitkbdout
        RET

这就是waitkbdout所完成的处理。基本上,如前面所说的那样,它与wait_KBC_sendready相同,但也添加了部分处理,就是从Ox60号设备进行IN的处理。也就是说,如果控制器里有键盘代码,或者是已经累积了鼠标数据,就顺便把它们读取出来。

JNZ与JZ相反,意思是“jump if not zero”。

■■■■■

只剩下一点点内容了,下面是memcpy程序。

asmhead.nas节选(续)

memcpy:
        MOV      EAX, [ESI]
        ADD      ESI,4
        MOV      [EDI], EAX
        ADD      EDI,4
        SUB      ECX,1
        JNZ      memcpy           ; 减法运算的结果如果不是0,就跳转到memcpy
        RET

这是复制内存的程序。不用笔者解释,大家也能明白。

■■■■■

最后是剩下来的全部内容。

asmhead.nas节选(续)

ALIGNB 16
GDT0:
RESB     8                 ; NULL selector
DW       0xffff,0x0000,0x9200,0x00cf ; 可以读写的段(segment)32bit
DW       0xffff,0x0000,0x9a28,0x0047 ; 可以执行的段(segment)32bit(bootpack用)

DW       0
GDTR0:
DW       8*3-1
DD       GDT0

ALIGNB  16
bootpack:

ALIGNB指令的意思是,一直添加DBO,直到时机合适的时候为止。什么是“时机合适”呢?大家可能有点不明白。ALIGNB 16的情况下,地址能被16整除的时候,就称为“时机合适”。如果最初的地址能被16整除,则ALIGNB指令不作任何处理。

如果标签GDT0的地址不是8的整数倍,向段寄存器复制的MOV指令就会慢一些。所以我们插入了ALIGNB指令。但是如果这样,“ALIGNB 8”就够了,用“ALIGNB 16”有点过头了。最后的“bootpack:”之前,也是“时机合适”的状态,所以笔者就适当加了一句“ALIGNB 16”。

GDT0也是一种特定的GDT。0号是空区域(null sector),不能够在那里定义段。1号和2号分别由下式设定。

set_segmdesc(gdt + 1, 0xffffffff,   0x00000000, AR_DATA32_RW);
set_segmdesc(gdt + 2, LIMIT_BOTPAK, ADR_BOTPAK, AR_CODE32_ER);

我们用纸笔事先计算了一下,然后用DW排列了出来。

GDTR0是LGDT指令,意思是通知GDT0说“有了GDT哟”。在GDT0里,写入了16位的段上限,和32位的段起始地址。

■■■■■

到此为止,关于asmhead.nas的说明就结束了。就是说,最初状态时,GDT在asmhead.nas里,并不在0x00270000~0x0027ffff的范围里。IDT连设定都没设定,所以仍处于中断禁止的状态。应当趁着硬件上积累过多数据而产生误动作之前,尽快开放中断,接收数据。

因此,在bootpack.c的HariMain里,应该在进行调色板(palette)的初始化以及画面的准备之前,先赶紧重新创建GDT和IDT,初始化PIC,并执行“io_sti(); ”。

bootpack.c节选

void HariMain(void)
{
    struct BOOTINFO *binfo = (struct BOOTINFO *) ADR_BOOTINFO;
    char s[40], mcursor[256], keybuf[32], mousebuf[128];
    int mx, my, i;
    struct MOUSE_DEC mdec;

    init_gdtidt();
    init_pic();
    io_sti(); /* IDT/PIC的初始化已经完成,于是开放CPU的中断 */
    fifo8_init(&keyfifo, 32, keybuf);
    fifo8_init(&mousefifo, 128, mousebuf);
    io_out8(PIC0_IMR, 0xf9); /* 开放PIC1和键盘中断(11111001) */
    io_out8(PIC1_IMR, 0xef); /* 开放鼠标中断(11101111)  */

    init_keyboard();

    init_palette();
    init_screen8(binfo->vram, binfo->scrnx, binfo->scrny);

■■■■■

夜已经深了,今天就到此为止。在考虑明天要做什么的同时,笔者也决定要睡觉了。晚安!