float和double类型数据在内存中的存储方法
浮点数(单精度的float和双精度的double)在内存中以二进制的科学计数法表示,表达式为N = 2^E * F;其中E为阶码(采用移位存储),F为尾数。
float和double都由符号位、阶码、尾数三部分组成,float存储时使用4个字节,double存储时使用8个字节。各部分占用位宽如下所示:
符号位 阶码 尾数 长度
float 1 8 23 32
double 1 11 52 64
符号位:0代表正数,1代表负数。
阶码:用移位表示法存储科学计数法中的指数数据:float阶码占8位,取值范围-128~127,但并没有按照移位表示法+128,而是+127。同理double要+1023。
尾数:尾数部分:用二进制的科学计数法表示后,去掉小数点前面恒定的1,只保留小数点后面的二进制数据,存入尾数位置即可。
上述中阶码也是指数位,但阶码和尾数的描述显然是看不懂的。我们继续。
比如8.25,二进制科学计数法表示为:1.00001*2^3,具体转换方法:8的二进制1000;.25的二进制.01:即0*2^(-1) + 1*2^(-2)。写为:1000.01,小数点左移3位,即转换完毕。
符号位确定:8.25为正数,符号位为0。
阶码的表示:阶码位3+127=130;二进制10000010,已经是8位。
尾数的表示:去掉小数点前面的1,为00001,后面补充0至23位:000 0100 0000 0000 0000 0000
最终8.25在内存里存储的二进制为:0100 0001 0000 0100 0000 0000 0000 0000
又比如11.4,二进制科学计数法表示:float:1.01101100110011001100110 * 2^3,double:1.0110 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1101 * 2^3,所以他们的值其实是不同的,因为.4用二进制无法精确表示,这也就是为什么float类型数据和double类型数据都存储11.4,但是对比起来,他们不相等的原因。比如float a = 11.4; double b = 11.4; 要让他们正确对比,比如((float)b == a),让double数据舍弃比float多的那些尾数。
对于double型数据,只要将阶码前面加0扩展到11位,尾数后面补充0至52位即可。
移位表示法:在数X上加一个偏移量,常用于表示浮点数中的阶码(注意阶码的偏移量和移位表示法定义有差别)。
定义:若X为纯整数,X[移] = 2^(n-1) + X,-2^(n-1) <= X < 2^(n-1);若X为纯小数,X[移] = 1 - X,-1<= X < 1
#include <stdio.h> #define print_float(a) print_bitxx(a, 4) #define print_int(a) print_bitxx(a, 4) #define print_double(a) print_bitxx(a, 8) int is_little_endian() { short int x = 0x0001; return ((char*)&x)[0]; } void print_bitxx(const void *a, int bytes) { const unsigned char *pos = (const unsigned char *)a; int i, j; int max_i = bytes - 1; if (is_little_endian()) { for (i=max_i; i>=0; i--) { for (j=7; j>=0; j--) { printf("%d", ((pos[i] & (1 << j)) ? 1 : 0)); if (j == 4 || j == 0) printf(" "); } printf(" "); } } printf("\n"); } int main(int argc, char **argv) { float a = 11.4; double b = 11.4; print_float(&a); print_double(&b); printf("%d\n", a == (float) b); printf("%d\n", (double)a == (double) b); return 0; }
相关推荐
c语言中的float , double 等数据类型的存储,如何计算 , 如何用vc vs查看内存
将32bit的float型数据 转换为 64bit的double类型存储在内存中,跨平台可用。解决C51等平台double类型为32bit存储的问题。
浮点数在内存中的存储机制和整型数不同,其有舍入误差,在计算机中用近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这种表示方法类似于...
C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,...
在Java中,基本数据类型是指原始的数据类型,它们是用于存储基本数据值的数据类型。Java的基本数据类型包括以下几种: 整数类型:byte、short、int、long 浮点类型:float、double 字符类型:char 布尔类型:...
分别定义float,double类型的变量各一个,并依次输出它们的存储空间大小(单位:字节)。 【输入】 (无) 【输出】 一行,两个整数,分别是两个变量的存储空间大小,用一个空格隔开。 【输入样例】 (无) 【输出...
分别定义float,double类型的变量各一个,并依次输出它们的存储空间大小(单位:字节)。 【输入】 (无) 【输出】 一行,两个整数,分别是两个变量的存储空间大小,用一个空格隔开。 【输入样例】 (无) 【输出...
FLOAT类型数据可以存储⾄多8位⼗进制数,并在内存中占4字节。 DOUBLE类型数据可以存储⾄多18位⼗进制数,并在内存中占8字节。 2. 字段为什么要求定义为not null? MySQL官⽹这样介绍: NULL columns require ...
C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit, double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,...
JAVA8⼤数据类型 ⼤数据类型 8⼤基本数据类型 8⼤基本数据类型在内存中占⽤的⽐特数: 基本数据类型的⾃动转换: ⾃动类型转换,也称隐式类型转换,是指不需要书写代码,由系统⾃动完成的类型转换。由于实际开发中...
C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,...
问题1:char、varchar的区别是什么?...DOUBLE类型数据可以存储至多18位十进制数,并在内存中占8字节。 问题5:如何在MySQL种获取当前日期? SELECT CURRENT_DATE(); 问题6:如何查询第n高的
在 C/C++中,使用浮点方式存储实数,用两种数据类型来保存浮点数: foat(单精度)和double(双精度)。float在内存中占4字节,double在内存中占8字节。由于占用空间大,double可描述的精度更高。这两种数据类型在内存中...
d static :存储类:在内存中是以固定地址存放的,在整个程序运行期间都有效 6 变量a,想给他起个别名 可以这样写int a; int&b=a 使得a跟b相同 运算符与表达式 1 %(模运算符) 如 7%4的值为3 2 j=++1 值4 j=1++ ...
此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector由于使用了synchronized方法(线程安全),...
数据类型可以理解为固定内存大小的别名,数据类型是创建变量的模子。 char 1字节 short 2字节 int 4字节 long 4字节 float 4字节 double 8字节 变量是一段实际连续存储空间的别名,通过变量的名字可以使用存储...
任何数据在内存中都是以二进制的形式存储的,例如一个short型数据1156,其二进制表示形式为00000100 10000100。则在Intel CPU架构的系统中,存放方式为 10000100(低地址单元) 00000100(高地址单元),因为Intel CPU...
此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector由于使用了synchronized方法(线程安全),...
此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector由于使用了synchronized方法(线程安全),...