C 为什么字节内的位之间的endianess很重要?

C 为什么字节内的位之间的endianess很重要?,c,bit,endianness,C,Bit,Endianness,以下是linux机器上库的IP结构 struct ip { #if __BYTE_ORDER == __LITTLE_ENDIAN unsigned int ip_hl:4; /* header length */ unsigned int ip_v:4; /* version */ #endif #if __BYTE_ORDER == __BIG_ENDIAN

以下是linux机器上库的IP结构

   struct ip
      {
    #if __BYTE_ORDER == __LITTLE_ENDIAN
        unsigned int ip_hl:4;               /* header length */
        unsigned int ip_v:4;                /* version */
    #endif
    #if __BYTE_ORDER == __BIG_ENDIAN
        unsigned int ip_v:4;                /* version */
        unsigned int ip_hl:4;               /* header length */
    #endif
        u_int8_t ip_tos;                    /* type of service */
        u_short ip_len;                     /* total length */
        u_short ip_id;                      /* identification */
        u_short ip_off;                     /* fragment offset field */
    #define IP_RF 0x8000                    /* reserved fragment flag */
    #define IP_DF 0x4000                    /* dont fragment flag */
    #define IP_MF 0x2000                    /* more fragments flag */
    #define IP_OFFMASK 0x1fff               /* mask for fragmenting bits */
        u_int8_t ip_ttl;                    /* time to live */
        u_int8_t ip_p;                      /* protocol */
        u_short ip_sum;                     /* checksum */
        struct in_addr ip_src, ip_dst;      /* source and dest address */
      };
对于这些线路:

    #if __BYTE_ORDER == __LITTLE_ENDIAN
        unsigned int ip_hl:4;               /* header length */
        unsigned int ip_v:4;                /* version */
    #endif
    #if __BYTE_ORDER == __BIG_ENDIAN
        unsigned int ip_v:4;                /* version */
        unsigned int ip_hl:4;               /* header length */
    #endif
为什么字节内的endianess很重要? 我认为endianess只影响多字节整数,但在我看来,endianess也影响字节内的位排列

此外,它只是一个字节,为什么它是
unsigned int
,即4个字节

我注意到在wireshark中,ip_v和ip_hl显示为
0x45
如果我捕获了一个IP数据包。第一个字节由ip_v和ip_hl组成 我把它放入一个字符变量
x


那么
x&0b11110000
的结果是什么?是否总是4无matther什么endianess,或者可能是5?

在多字节数据的情况下,字节顺序是相关的。但在您的情况下,重要的是
位字段顺序
,它处理单字节数据的位顺序。C标准没有提出关于位字段排序的规则。它依赖于实现,由编译器决定


变量的大小不是4字节。它只有4位。它们不是自变量。它们是结构中的位字段。

尾数定义了最高有效位(MSB)的位置,它与变量中的数字在内存中的解释方式有关。考虑无符号整数:

00000001 (Binary) = 1 (2 to the power of 0) -> If the most significant bit is to the left

00000001 (Binary) = 128 (2 to the power of 7) -> If the most significant bit is to the right
正如您所看到的,当涉及到内存中的数字表示时,最高有效位的位置非常重要,即使在8位数字中也是如此

最后一个问题你是对的,它是1字节还是4字节没有区别,因为它只占用4位。但请记住,无符号整数并不总是一个4字节的数字


希望有帮助

x&0b11110000的结果是否可能重复?是否始终为4无matther什么endianness,或者可能为5?是的,
0x45&0b1110000
的结果始终为
0x40
,无论endianness是什么。但是,编译器可以按任意顺序放置位字段(“冒号4”
:4
东西)。因此,如果您分配
ip_hl=4,ip_v=5
,您可以得到
0x45
0x54
,这取决于编译器(编译器在决定半字节的尾数时通常遵循字节的尾数)。它只有一个字节,为什么它是无符号整数的类型,即4个字节。“无符号整数”后跟冒号和整数,如“unsigned int ip_v:4”中所述,是位字段的声明。如果有帮助,可以将其视为“大小为4位的无符号int”(严格来说,声明位字段时不能使用其他类型除外)。那么
的结果如何&0b11110000?是否总是4无matther什么Endianness,或者可能是5?
我真的很困惑这是误导。就C而言,二进制
00000001
0x01
)总是以10为基数
1
。例如,右移运算符
>
将(正)数(大致)减半,但不会将它们加倍:
4>>1==2
。正如其他人所指出的,endianess是位字段的一部分。§6.7.2.1,本标准第11段规定,单元内位字段分配的
顺序(从高阶到低阶或从低阶到高阶)是实现定义的。
但问题不在于C中的Endianness,当然是,在几乎所有的计算机语言中,相同的指令在不同的硬件中以相同的方式运行是可以预期的。如果您注意代码,它似乎是在处理来自硬件接口的数据->不同的硬件可以有不同的endianess->endianess Matters问题在于C中的endianness,因此C代码和标记。在标准C中,不能寻址特定的位。直接访问它们的唯一方法是使用移位、按位操作和位字段。标准要求数字显示为MS位为“第一”。无论底层硬件的位顺序如何(如果适用),翻译器都有责任确保这一点。位字段可以从任意一端开始,但结果值仍然是MSB first。网络和通信协议可能首先通过LSB传输,但这并不意味着它们是以C语言存储或访问的。这个答案根本不正确。请参阅下面的和Deepu的答案。Endianness作为一个概念通常不涉及位的顺序,但某些实现可能基于Endianness翻转位顺序,只是出于自身的判断。