目录
一、整形数据类型的分类
二、整形数据在内存中的存储
三、大小端的介绍
什么是大端小端?
一、整形数据类型的分类
char //字符类型
short //短整型
int //整形
long //长整形
long long //更长的整形
而这些也分为有符号和无符号,有符号是signed ,无符号是unsigned,例如:
signed int//有符号的整形 unsigned int//无符号的整形
二、整形数据在内存中的存储
首先,我们要先了解几个概念:原码,反码,补码。
计算机中的整数有三种2进制表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位
正数的原、反、补码都相同。
负整数的三种表示方法各不相同。
原码:直接将数值按照正负数的形式翻译成二进制就可以得到原码。
反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。
补码:反码+1就得到补码。
#includeint main() { unsigned char a = 200; unsigned char b = 100; unsigned char c = 0; c = a + b; //0000000000000000000000000000000011001000 ——200的二进制 //11001000 ——被截断赋给char类型的a变量 //0000000000000000000000000000000001100100 ——100的二进制 //01100100 ——被截断赋给char类型的b变量 //a + b发生整形提升 //0000000000000000000000000000000011001000 ——(int)a //0000000000000000000000000000000001100100 ——(int)b //0000000000000000000000000000000100101100 ——(int)c //00101100 ——用无符号的char类型接受,发生截断 //转换成十进制就是44,所以c就是44 //而a + b只参与运算,不赋值,所以是300 printf("%d %d", a + b, c);//300 44 return 0; } int main() { unsigned char a = 200; char b = -100; unsigned char c = 0; c = a + b; //0000000000000000000000000000000011001000 ——200的二进制 //11001000 ——被截断赋给char类型的a变量 //1000000000000000000000000000000001100100 ——(-100)的二进制原码 //1111111111111111111111111111111110011011 ——(-100)的二进制反码 //1111111111111111111111111111111110011100 ——(-100)的二进制补码 //10011100 ——被截断赋给char类型的b变量 //a + b发生整形提升 //0000000000000000000000000000000011001000 ——(int)a //1111111111111111111111111111111110011100 ——(int)b //10000000000000000000000000000000001100100 ——(int)c //01100100 ——用无符号的char类型接受,发生截断 //转换成十进制就是100,所以c就是100 //而a + b只参与运算,不赋值,所以是100 printf("%d %d", a + b, c);//100 100 return 0; }
而对于整形来说,数据存储在内存中的存的是二进制的补码。
为什么呢?
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统
一处理;
同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程
是相同的,不需要额外的硬件电路。
那我们来看看数据在内存中是什么样的?
int b = -10; //10000000000000000000000000001010 ——(-10)二进制原码 //11111111111111111111111111110101 ——(-10—)二进制反码 //11111111111111111111111111110110 ——(-10)二进制补码 //1111 1111 1111 1111 1111 1111 1111 0110 ——拆开划分成一个一个的字节 //十六进制是0~9,a,b,c,d,e,f. //所以(-10)二进制补码对应的十六进制是 //fffffff6 //所以存进去的数字应该是fffffff6
等等,这里为什么内存中展示的十六进制却是倒着的?
这里就关系到大小端的问题了。
三、大小端的介绍
什么是大端小端?
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址
中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地
址中。
再看上面的举例:
本来应该存的是fffffff6,但是实际存进去的是f6ffffff,由此可见,我们这个编译器的按小端存储的。
那么为什么会有大小端之分呢?
这是因为在计算机系统中,我们是以字节为单位的,每个地址单元
都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short
型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32
位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因
此就导致了大端存储模式和小端存储模式。
例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为
高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高
地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则
为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式
还是小端模式。
我们可以写个小程序来判断当前机械的字节序:
#includeint check_sys() { int i = 1; return (*(char*)&i); } int main() { int ret = check_sys(); if (ret == 1) { printf("小端n"); } else { printf("大端n"); } return 0; }