`

float和double类型数据在内存中的存储方法

阅读更多

float和double类型数据在内存中的存储方法

 

浮点数(单精度的float和双精度的double)在内存中以二进制的科学计数法表示,表达式为N = 2^E * F;其中E为阶码(采用移位存储),F为尾数。

float和double都由符号位、阶码、尾数三部分组成,float存储时使用4个字节,double存储时使用8个字节。各部分占用位宽如下所示:

             符号位     阶码      尾数     长度

float              1           8         23      32

double          1         11        52      64

 

 

符号位:0代表正数,1代表负数。

阶码:用移位表示法存储科学计数法中的指数数据:float阶码占8位,取值范围-128~127,但并没有按照移位表示法+128,而是+127。同理double要+1023。

尾数:尾数部分:用二进制的科学计数法表示后,去掉小数点前面恒定的1,只保留小数点后面的二进制数据,存入尾数位置即可。

上述中阶码也是指数位,但阶码和尾数的描述显然是看不懂的。我们继续。

 

比如8.25,二进制科学计数法表示为:1.00001*2^3,具体转换方法:8的二进制1000;.25的二进制.01:即0*2^(-1) + 1*2^(-2)。写为:1000.01,小数点左移3位,即转换完毕。

符号位确定:8.25为正数,符号位为0。

阶码的表示:阶码位3+127=130;二进制10000010,已经是8位。

尾数的表示:去掉小数点前面的1,为00001,后面补充0至23位:000 0100 0000 0000 0000 0000

最终8.25在内存里存储的二进制为:0100 0001  0000 0100  0000 0000  0000 0000

 

又比如11.4,二进制科学计数法表示:float:1.01101100110011001100110 * 2^3,double:1.0110  1100 1100  1100 1100  1100 1100  1100 1100  1100 1100  1100 1101 * 2^3,所以他们的值其实是不同的,因为.4用二进制无法精确表示,这也就是为什么float类型数据和double类型数据都存储11.4,但是对比起来,他们不相等的原因。比如float a = 11.4; double b = 11.4; 要让他们正确对比,比如((float)b == a),让double数据舍弃比float多的那些尾数。

 

对于double型数据,只要将阶码前面加0扩展到11位,尾数后面补充0至52位即可。

 

移位表示法:在数X上加一个偏移量,常用于表示浮点数中的阶码(注意阶码的偏移量和移位表示法定义有差别)。

定义:若X为纯整数,X[移] = 2^(n-1) + X,-2^(n-1) <= X < 2^(n-1);若X为纯小数,X[移] = 1 - X,-1<= X < 1

 

 

#include <stdio.h>

#define print_float(a) print_bitxx(a, 4)
#define print_int(a) print_bitxx(a, 4)

#define print_double(a) print_bitxx(a, 8)

int is_little_endian()
{
    short int x = 0x0001;
    return ((char*)&x)[0];
}

void print_bitxx(const void *a, int bytes)
{
    const unsigned char *pos = (const unsigned char *)a;
    int i, j;
    int max_i = bytes - 1;
    if (is_little_endian()) {
        for (i=max_i; i>=0; i--) {
            for (j=7; j>=0; j--) {
                printf("%d", ((pos[i] & (1 << j)) ? 1 : 0));
                if (j == 4 || j == 0)
                    printf(" ");
            }
            printf(" ");
        }
    }
    printf("\n");
}

int main(int argc, char **argv)
{
    float a = 11.4;
    double b = 11.4;
    print_float(&a);
    print_double(&b);
    printf("%d\n", a == (float) b);
    printf("%d\n", (double)a == (double) b);
    return 0;
}

 

分享到:
评论

相关推荐

    c语言 float double数据类型的内存中的存储和验证

    c语言中的float , double 等数据类型的存储,如何计算 , 如何用vc vs查看内存

    float_double.c

    将32bit的float型数据 转换为 64bit的double类型存储在内存中,跨平台可用。解决C51等平台double类型为32bit存储的问题。

    基于C++浮点数(float、double)类型数据比较与转换的详解

    浮点数在内存中的存储机制和整型数不同,其有舍入误差,在计算机中用近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这种表示方法类似于...

    浮点数在计算机中的存储方式

    C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,...

    java基本数据类型.docx

    在Java中,基本数据类型是指原始的数据类型,它们是用于存储基本数据值的数据类型。Java的基本数据类型包括以下几种: 整数类型:byte、short、int、long 浮点类型:float、double 字符类型:char 布尔类型:...

    1017浮点型数据类型存储空间大小.cpp

    分别定义float,double类型的变量各一个,并依次输出它们的存储空间大小(单位:字节)。 【输入】 (无) 【输出】 一行,两个整数,分别是两个变量的存储空间大小,用一个空格隔开。 【输入样例】 (无) 【输出...

    1018 其他数据类型存储空间大小.cpp

    分别定义float,double类型的变量各一个,并依次输出它们的存储空间大小(单位:字节)。 【输入】 (无) 【输出】 一行,两个整数,分别是两个变量的存储空间大小,用一个空格隔开。 【输入样例】 (无) 【输出...

    mysql面试题目大全

    FLOAT类型数据可以存储⾄多8位⼗进制数,并在内存中占4字节。 DOUBLE类型数据可以存储⾄多18位⼗进制数,并在内存中占8字节。 2. 字段为什么要求定义为not null? MySQL官⽹这样介绍: NULL columns require ...

    C++单精度与双精度浅析.pdf

    C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit, double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,...

    JAVA8大数据类型.pdf

    JAVA8⼤数据类型 ⼤数据类型 8⼤基本数据类型 8⼤基本数据类型在内存中占⽤的⽐特数: 基本数据类型的⾃动转换: ⾃动类型转换,也称隐式类型转换,是指不需要书写代码,由系统⾃动完成的类型转换。由于实际开发中...

    浮点数在计算机中存储方式是怎样的

    C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,...

    常问的MySQL面试题集合

    问题1:char、varchar的区别是什么?...DOUBLE类型数据可以存储至多18位十进制数,并在内存中占8字节。   问题5:如何在MySQL种获取当前日期? SELECT CURRENT_DATE(); 问题6:如何查询第n高的

    浮点数与十六进制转换工具

    在 C/C++中,使用浮点方式存储实数,用两种数据类型来保存浮点数: foat(单精度)和double(双精度)。float在内存中占4字节,double在内存中占8字节。由于占用空间大,double可描述的精度更高。这两种数据类型在内存中...

    C++零基础(数据类型)

    d static :存储类:在内存中是以固定地址存放的,在整个程序运行期间都有效 6 变量a,想给他起个别名 可以这样写int a; int&b=a 使得a跟b相同 运算符与表达式 1 %(模运算符) 如 7%4的值为3 2 j=++1 值4 j=1++ ...

    java面试题

    此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector由于使用了synchronized方法(线程安全),...

    C语言学习笔记

    数据类型可以理解为固定内存大小的别名,数据类型是创建变量的模子。 char 1字节 short 2字节 int 4字节 long 4字节 float 4字节 double 8字节 变量是一段实际连续存储空间的别名,通过变量的名字可以使用存储...

    深入C/C++浮点数在内存中的存储方式详解

    任何数据在内存中都是以二进制的形式存储的,例如一个short型数据1156,其二进制表示形式为00000100 10000100。则在Intel CPU架构的系统中,存放方式为 10000100(低地址单元) 00000100(高地址单元),因为Intel CPU...

    关于JAVA面试的100题及其答案

    此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector由于使用了synchronized方法(线程安全),...

    进销存系统文档作业例子

    此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector由于使用了synchronized方法(线程安全),...

Global site tag (gtag.js) - Google Analytics