C 为什么字节内的位之间的endianess很重要?
以下是linux机器上库的IP结构C 为什么字节内的位之间的endianess很重要?,c,bit,endianness,C,Bit,Endianness,以下是linux机器上库的IP结构 struct ip { #if __BYTE_ORDER == __LITTLE_ENDIAN unsigned int ip_hl:4; /* header length */ unsigned int ip_v:4; /* version */ #endif #if __BYTE_ORDER == __BIG_ENDIAN
struct ip
{
#if __BYTE_ORDER == __LITTLE_ENDIAN
unsigned int ip_hl:4; /* header length */
unsigned int ip_v:4; /* version */
#endif
#if __BYTE_ORDER == __BIG_ENDIAN
unsigned int ip_v:4; /* version */
unsigned int ip_hl:4; /* header length */
#endif
u_int8_t ip_tos; /* type of service */
u_short ip_len; /* total length */
u_short ip_id; /* identification */
u_short ip_off; /* fragment offset field */
#define IP_RF 0x8000 /* reserved fragment flag */
#define IP_DF 0x4000 /* dont fragment flag */
#define IP_MF 0x2000 /* more fragments flag */
#define IP_OFFMASK 0x1fff /* mask for fragmenting bits */
u_int8_t ip_ttl; /* time to live */
u_int8_t ip_p; /* protocol */
u_short ip_sum; /* checksum */
struct in_addr ip_src, ip_dst; /* source and dest address */
};
对于这些线路:
#if __BYTE_ORDER == __LITTLE_ENDIAN
unsigned int ip_hl:4; /* header length */
unsigned int ip_v:4; /* version */
#endif
#if __BYTE_ORDER == __BIG_ENDIAN
unsigned int ip_v:4; /* version */
unsigned int ip_hl:4; /* header length */
#endif
为什么字节内的endianess很重要?
我认为endianess只影响多字节整数,但在我看来,endianess也影响字节内的位排列
此外,它只是一个字节,为什么它是unsigned int
,即4个字节
我注意到在wireshark中,ip_v和ip_hl显示为0x45
如果我捕获了一个IP数据包。第一个字节由ip_v和ip_hl组成
我把它放入一个字符变量x
那么
x&0b11110000
的结果是什么?是否总是4无matther什么endianess,或者可能是5?在多字节数据的情况下,字节顺序是相关的。但在您的情况下,重要的是位字段顺序
,它处理单字节数据的位顺序。C标准没有提出关于位字段排序的规则。它依赖于实现,由编译器决定
变量的大小不是4字节。它只有4位。它们不是自变量。它们是结构中的位字段。尾数定义了最高有效位(MSB)的位置,它与变量中的数字在内存中的解释方式有关。考虑无符号整数:
00000001 (Binary) = 1 (2 to the power of 0) -> If the most significant bit is to the left
00000001 (Binary) = 128 (2 to the power of 7) -> If the most significant bit is to the right
正如您所看到的,当涉及到内存中的数字表示时,最高有效位的位置非常重要,即使在8位数字中也是如此
最后一个问题你是对的,它是1字节还是4字节没有区别,因为它只占用4位。但请记住,无符号整数并不总是一个4字节的数字
希望有帮助 x&0b11110000的结果是否可能重复?是否始终为4无matther什么endianness,或者可能为5?是的,
0x45&0b1110000
的结果始终为0x40
,无论endianness是什么。但是,编译器可以按任意顺序放置位字段(“冒号4”:4
东西)。因此,如果您分配ip_hl=4,ip_v=5
,您可以得到0x45
或0x54
,这取决于编译器(编译器在决定半字节的尾数时通常遵循字节的尾数)。它只有一个字节,为什么它是无符号整数的类型,即4个字节。“无符号整数”后跟冒号和整数,如“unsigned int ip_v:4”中所述,是位字段的声明。如果有帮助,可以将其视为“大小为4位的无符号int”(严格来说,声明位字段时不能使用其他类型除外)。那么的结果如何&0b11110000?是否总是4无matther什么Endianness,或者可能是5?
我真的很困惑这是误导。就C而言,二进制00000001
(0x01
)总是以10为基数1
。例如,右移运算符>
将(正)数(大致)减半,但不会将它们加倍:4>>1==2
。正如其他人所指出的,endianess是位字段的一部分。§6.7.2.1,本标准第11段规定,单元内位字段分配的顺序(从高阶到低阶或从低阶到高阶)是实现定义的。
但问题不在于C中的Endianness,当然是,在几乎所有的计算机语言中,相同的指令在不同的硬件中以相同的方式运行是可以预期的。如果您注意代码,它似乎是在处理来自硬件接口的数据->不同的硬件可以有不同的endianess->endianess Matters问题在于C中的endianness,因此C代码和标记。在标准C中,不能寻址特定的位。直接访问它们的唯一方法是使用移位、按位操作和位字段。标准要求数字显示为MS位为“第一”。无论底层硬件的位顺序如何(如果适用),翻译器都有责任确保这一点。位字段可以从任意一端开始,但结果值仍然是MSB first。网络和通信协议可能首先通过LSB传输,但这并不意味着它们是以C语言存储或访问的。这个答案根本不正确。请参阅下面的和Deepu的答案。Endianness作为一个概念通常不涉及位的顺序,但某些实现可能基于Endianness翻转位顺序,只是出于自身的判断。