(二)数据在计算机中的表示

【考点6】计算机采用二进制编码

1.二进制编码

在计算机中,数字和符号都是用电子元件的不同状态表示的,即以电信号表示。电信号只有两种,即“0”和“1”。所以计算机内部的信息都是以这两个状态的组合存储的,即二进制数。平常在解决实际问题中输入/输出使用的都是十进制数,即“逢十进一”。而计算机内部采用二进制数,按“逢二进一”的原则进行计数,即每位计满2时向高位进1。

二进制数的特点是:数字的个数等于基数2;最大数字是1,最小数字是0;有两个数字字符——0和1;在数的表示中,每个数字都要乘以基数2的幂次方,例如:(101.01)2=1×22+0×21+1×20+0×2 -1+1×2 -2

计算机内部均使用二进制数来表示各种信息,但计算机与外部交往仍采用人们熟悉和便于阅读的形式,如十进制数据、文字显示以及图形描述等。而两种数制的转换是由计算机系统的硬件和软件来实现的。计算机系统采用二进制编码的主要原因是电路设计简单、运算简单、工作可靠、逻辑性强。

2.十进制数及其之间的转换

(1)十进制整数转换成二进制整数。把十进制整数转换成二进制整数是采用“除二取余”法。具体步骤是:把十进制整数除以2得一商数和一余数;再将所得的商除以2,又得到一个新的商数和余数;这样不断地用2去除所得的商数,直到商等于0为止。每次相除所得的余数便是对应的二进制整数的各位数码。第一次得到的余数为最低有效位,最后一次得到的余数为最高有效位。

上述方法同样适用于十进制数与十六进制数的转换,只是使用的基数不同。

(2)二进制数与十六进制数间的转换。二进制数整数部分转换成十六进制数的方法是从个位数开始向左按每4位一组划分,不足4位的组以0补足,然后将每组4位二进制数以一位十六进制数字代替即可;小数部分的分法是从小数部分的最高位开始向右按每4位一组划分,不足4位的组以0补足,然后将每组4位二进制以一位十六进制数字代替即可。十六进制数转换成二进制数的方法相反。

表1.2列出了0~15这16个十进制数与二进制数、十六进制数的对应表示。

表1.2 常用计数制表示

(3)非十进制数转换成十进制数。利用按权展开的方法,可以把任意数制转换成十进制数。

【考点7】计算机中的信息单元

1.位

位(bit)是度量数据的最小单位,在数字电路和计算机技术中采用二进制,代码只有0和1,无论0还是1,在CPU 中都是1位。

2.字节

一个字节(Byte)由8位二进制数组成(1Byte=8bit)。字节是信息组织和存储的基本单元,也是计算机体系结构的基本单元。

早期的计算机并无字节的概念,20世纪50年代中期,随着计算机逐渐从单纯用于科学计算扩展到数据处理领域,为了在体系结构上兼顾表示“数”和“字符”,就出现了“字节”。

为了便于衡量存储器的大小,统一以字节(Byte,简写B)为单位。常用的存储单元大小表示为:

KB 1KB=1024B

MB 1MB=1024KB

GB 1GB=1024MB

TB 1TB=1024GB

【考点8】字符

1.西文字符的编码

计算机中常用的字符编码有 EBCDIC 码和 ASCII 码。ASCII码有7位码和8位码两种版本。国际的7位ASCII码是用7位二进制数表示一个字符的编码,其编码范围为0000000B~1111111B,共有27=128个不同的编码值,即可以表示128个不同的编码。

数字“0~9”的起始ASCII码值为“048”;大写英文字母“A~Z”的起始 ASCII 码值为“65”,小写英文字母的 ASCII码值比对应的大写字母的多32,即在大写字母ASCII码值的基础上加32,即为对应的小写字母的ASCII 码值。另外,比较ASCII码值大小的试题也较为常见。在ASCII码表中,基本是按数字、大写英文字母、小写英文字母的顺序排列的,排在后面的码值比排在前面的大。

2.中文字符

GB 2312又称为GB 2312—1980字符集,全称为《信息交换用汉字编码字符集 基本集》,由原中国国家标准总局发布,1981年5月1日开始实施。

汉字信息交换码简称交换码,也叫国标码。国标码的编码范围是2121H~7E7EH。区位码和国标码之间的转换方法是将一个汉字的十进制区号和十进制位号分别转换成十六进制数,然后分别加上20H,就成为此汉字的国标码,即:

汉字国标码=[区号(十六进制数)+20H][位号(十六进制数)+20H]

在得到汉字的国标码之后,就可以使用以下公式计算汉字的机内码。

汉字机内码=汉字国标码+8080H

汉字字形码也叫字模或汉字输出码。在计算机中,由于8个二进制位组成一个字节(字节是度量空间的基本单位),可见一个16×16点阵的字型码需要16×16/8=32字节存储空间。

3.汉字的处理过程

从汉字编码的角度看,计算机对汉字信息的处理过程实际上就是各种汉字编码间的转换过程。这些编码主要包括汉字输入码、汉字内码、汉字地址码、汉字字形码等。汉字信息处理的流程如图1.2所示。

图1.2

4.其他汉字内码

(1)BIG5字符集:又称大五码或五大码。

(2)GB 18030字符集:GB 18030的全称是GB 18030—2000《信息交换用汉字编码字符集基本集的扩充》,是我国政府于2000年3月17日发布的新的汉字编码国家标准,2001年8月31日后在中国市场上发布的软件必须符合该标准。

(3)Unicode 字符集:是 Universal Multiple-Octet Coded Character Set(通用多八位编码字符集)的简称。

真题演练

(1)计算机中所有信息的存储都采用()。

A.十进制

C.ASCII

B.十六进制

D.二进制

(2)与二进制数1010.01等值的十进制数是()。

A.16

B.10.25

C.10.52

D.11.5

(3)二进制数110110对应的十进制数是()。

A.53

B.54

C.55

D.56

(4)与十进制数5324等值的十六进制数为()。

A.1144

B.14C4

C.14CC

D.1C4C

(5)计算机中信息存储的基本单元是()。

A.十进制数

B.字节

C.二进制数

D.字

(6)1TB是()MB。

A.1024

B.1024×1024

C.1024×1024×1024

D.0

(7)在下列字符中,其ASCII码值最大的一个是()。

A.8

B.9

C.a

D.b

(8)设汉字点阵为32×32,那么100个汉字的字形码信息所占用的字节数是()。

A.12800

B.128

C.32×3200

D.32×32