自定义类型：结构体-天翼云

结构体类型的声明

结构是⼀些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。而数组是一些类型相同元素的集合，每个元素的类型都是一样的。

结构的声明

struct tag
{
 member-list;
}variable-list;//分号不能少

//tag，结构体标签
//member-list，成员列表
//variable-list，变量列表

什么情况下，我们要用到结构体呢？当我们想要描述一些复杂变量时，例如：一本书，要描述其作者，出版社，出版日期…… 一个学生，可以从姓名，学号，年龄，性别……来分别描述。

现在就可以创建一个结构体类型：学生

struct stu//创建了一个结构体类型学生
{
	char name[20];//姓名
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
};

结构体变量的创建和初始化

#include <stdio.h>
struct stu//创建了一个结构体类型学生
{
	char name[20];//姓名
	int age;//年龄
	char sex[5];//性别
	char id[20];//学号
};

int main()
{
	//创建一个学生类型的结构体变量，并且初始化
	//一个中文汉字表示两个英文字符
	struct stu s1 = { "zhangsan", 18, "男", "20240305" };
	printf("%s %d %s %s\n", , s1.age, s1.sex, s1.id);
	struct stu s2 = { "李四", 20, "男",  "20220305" };
	printf("%s %d %s %s\n", , s2.age, s2.sex, s2.id);
}

自定义类型：结构体

结构的特殊声明

在声明结构的时候，可以不完全的声明。

struct
{
	int a;
	char b;
	float c;
}x;

struct
{
	int a;
	char b;
	float c;
}a[20], * p;
//上面的两个结构在声明的时候省略掉了结构体标签（tag）

那么就有一个问题来了？这两个结构体变量是一样的吗？或者说是：*p = &a;

答案是：编译器会把上面的两个声明当成完全不同的两个类型，所以是非法的。匿名的结构体类型，如果没有对结构体类型重命名的话，基本上只能使用一次。因此，我们在创建结构体类型时，要完全声明。

结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢？比如，定义一个链表的节点：

struct Node
{
	int data;
	struct Node next;
};

上述代码正确吗？如果正确，那 sizeof(struct Node) 是多少？仔细分析，其实是不行的，因为⼀个结构体中再包含⼀个同类型的结构体变量，这样结构体变量的大小就会无穷的大，是不合理的。自定义类型：结构体

正确的自引用方式：

struct Node
{
	int data;
	struct Node* next;
};

这个是把下一个结构体的的地址拿到了，然后就可以逐级的去找了。

在结构体自引用使用的过程中，夹杂了 typedef 对匿名结构体类型重命名，也容易引入问题。

typedef struct
{
 int data;
 Node* next;
}Node;

这个Node是我们对匿名结构体重命名之后才产生的，但是我们却在匿名结构体内部使用了这个Node来创建成员变量。这就相互矛盾了。最好的解决办法就是我们不要在创建匿名结构体 。

typedef struct Node
{
 int data;
 struct Node* next;
}Node;

在重命名时，这个struct Node类型已经有了，因此我们在创建成员变量时使用struct Node就是没问题的。可能有小伙伴不知道那个代码是什么意思，下面有介绍：自定义类型：结构体

结构体内存对齐

我们已经掌握了结构体的基本使用了。现在我们深入讨论一个问题：计算结构体的大小。这也是一个特别热门的考点：结构体内存对齐。

对齐规则

首先得掌握结构体的对齐规则： 1. 结构体的第一个成员对齐到和结构体变量起始位置偏移量为0的地址处 2. 其他成员变量要对齐到某个数字（这个数是对齐数）的整数倍的地址处。对齐数 = 编译器默认的一个对数数与该成员变量大小的较小值。VS 中默认的值为 8 Linux中 gcc 没有默认对齐数，对齐数就是成员自身的大小 3. 结构体总大小为最大对齐数（结构体中每个成员变量都有⼀个对齐数，所有对齐数中最大的）的整数倍。 4. 如果嵌套了结构体的情况，嵌套的结构体成员对齐到自己的成员中最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体中成员的对齐数）的整数倍。

接下来，我们就用一些练习来彻底理解它们。（下面所有打印时，都是用的%d，没有用%zd，两者都可以，不过用%zd更好，而且也没有警告。）

#include <stdio.h>
struct S1
{
	char c1;
	int i;
	char c2;
};

int main()
{
	printf("%d\n", sizeof(struct S1));
	return 0;
}

自定义类型：结构体

#include <stdio.h>
struct S2
{
	char c1;
	char c2;
	int i;
};

int main()
{
	printf("%d\n", sizeof(struct S2));
	return 0;
}

自定义类型：结构体

这个的分析过程没有第一个详细，如果没有看懂的话，可以去多看看第一个练习。

#include <stdio.h>
struct S3
{
	double d;
	char c;
	int i;
};

int main()
{
	printf("%d\n", sizeof(struct S3));
	return 0;
}

自定义类型：结构体

#include <stdio.h>
struct S3
{
	double d;
	char c;
	int i;
};
struct S4
{
	char c1;
	struct S3 s3;
	double d;
};

int main()
{
	printf("%d\n", sizeof(struct S4));
}

自定义类型：结构体

为什么存在内存对齐

1. 平台原因 (移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。假设一个处理器总是从内存中取8个字节，则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数，那么就可以用一个内存操作来读或者写值了。否则，我们可能需要执行两次内存访问，因为对象可能被分放在两个8字节内存块中。

总体来说：结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到呢？让占用空间小的成员尽量集中在一起。

struct S1
{
	char c1;//0
	//3
	int i;//4~7
	char c2;//8
};


struct S2
{
	char c1;//0
	char c2;//1
	int i;//4~7
};

我们就会发现s1是8个字节的空间，s2是7个字节的空间

修改默认对齐数

#pragma 这个预处理指令，可以改变编译器的默认对⻬数

#include <stdio.h>
#pragma pack(1)//设置默认对⻬数为1
struct S
{
	char c1;//0
    //4（int） > 1（VS），1
	int i;//1~4
    //1(char) == 1(VS)，1
	char c2;//5
    //总共的大小是6个字节
};
#pragma pack()//取消设置的对⻬数，还原为默认
int main()
{
	printf("%d\n", sizeof(struct S));
	return 0;
}

自定义类型：结构体

结构体在对齐方式不合适的时候，我们可以自己更改默认对齐数。注意一般都是改成2的次方数。例如：1是2的0次方。

结构体传参

#include <stdio.h>
struct S
{
	int data[1000];
	int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体（数值）传参
void print1(struct S s)
{
	printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
	printf("%d\n", ps->num);
}

int main()
{
	print1(s);//传值调用
	print2(&s);//传址调用
	return 0;
}

我们前面在学习函数的时候，就学习了传值调用与传址调用的区别以及选用。

传值调用：会重新创建一个变量来接收，会浪费内存空间和时间。

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。如果传递一个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

传址调用：拿到的是地址，会修改这个变量本身的值。（如果我们用const来修饰会更好）

总结：我们在结构体传参的时候，应该采用传址调用，并用const修饰指针。

结构体实现位段

什么是位段

位段的声明和结构是类似的，有两个不同： 1. 位段的成员必须是 int、unsigned int 或signed int ，在C99中位段成员的类型也可以选择其他类型（只要是整型家族即可）。 2. 位段的成员名后边有一个冒号和一个数字。

例如：

#include <stdio.h>
struct A
{
	//与结构体不同，多了个冒号和数字
    //这里的数字是指比特位
	int _a : 2;
	int _b : 5;
	int _c : 10;
	int _d : 30;
};

int main()
{
	printf("%zd\n", sizeof(struct A));
	return 0;
}

A就是一个位段类型。那位段A所占内存的大小是多少？

自定义类型：结构体

为什么是8个字节呢？我们现在就一起来分析一下。

位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char 等类型（只要是整型家族即可） 2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的（一次只能开辟1个字节的空间或者4个字节的空间）。 3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

现在我们就来具体分析这个位段的内存分配。

#include <stdio.h>
struct S
{
    //冒号后面的数字，是这个变量对应的空间，单位是比特位
    //创建了char类型的变量，分别给出3，4，5，4个比特位的空间
	char a : 3;
	char b : 4;
	char c : 5;
	char d : 4;
};

int main()
{
	struct S s = { 0 };
    //分别给对应的变量赋值
	s.a = 10;
	s.b = 12;
	s.c = 3;
	s.d = 4;
	return 0;
}

因为这个位段全部是char类型，是一个字节一个字节的分配，所以是先分配一个字节（8个比特位）的空间给s，a先是用了3个比特位，后面b又用了4个比特位，当c要来使用这个空间时，就会发现这个空间不足，这时就会另外分配一个字节的空间给c来用。但是就有一个问题出来了：这个c会用前面那个字节剩下的一个比特位吗？如果不用的话，就会舍弃最终的结果是3个字节。如果用的话，最终的结果就是2个字节。

自定义类型：结构体

从结果来看，在内存中分配的空间是按下面的方式来的

自定义类型：结构体

至于到底是不是按照从低地址到高地址这样的分配，我们就需要通过赋值来观察。

自定义类型：结构体

上面这个是我们分析出来的结果。下面这个是在内存中的情况。自定义类型：结构体

可以看到我们分析的结果是正确的。（注意这些数字都是十六进制，因为在操作符中我们学习了四个二进制数字对应一个十六进制数字）。

位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的，就是这个位段成员的类型是int 时，我们不知道这个int 是signed int 还是unsigned int。 2. 位段中最大位的数目不能确定。（16位机器最大(int)16；32位机器最大(int)32，会被写成27，在16位机器会出问题。 3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义（我们刚刚测试的结果是VS自己这样设置的）。 4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的（刚刚那个也是VS自己设置的，因此VS对于新手是非常友好的）。

总结：跟结构相比，位段可以达到同样的效果，并且可以很好的节省空间（例如：表示真假：用一个比特位就能够表示0/1，我们就没必要用一个字节或者是四个字节了），但是有跨平台的问题存在。

位段的应用

下图是网络协议中，IP数据报的格式，我们可以看到其中很多的属性只需要几个bit位就能描述，这里使用位段，能够实现想要的效果，也节省了空间，这样网络传输的数据报大小也会较小一些，对网络的畅通是有帮助的。

自定义类型：结构体

位段使用的注意事项

位段的几个成员共有同一个字节，这样有些成员的起始位置并不是某个字节的起始位置，那么这些位置处是没有地址的。因为内存中每个字节分配一个地址，一个字节内部的bit位是没有地址的。所以不能对位段的成员使用取地址操作符（&），这样就不能使用scanf直接给位段的成员输入值，只能是先输入放在一个变量中，然后赋值给位段的成员。

#include <stdio.h>
struct A
{
	int _a : 2;
	int _b : 5;
	int _c : 10;
	int _d : 30;
};
int main()
{
	struct A sa = { 0 };
	scanf("%d", &sa._b);//这是错误的,编译器这里也会报错

	//正确的⽰范
	int b = 0;
	scanf("%d", &b);
	sa._b = b;
	return 0;
}

自定义类型：结构体

好啦！本期结构体的学习就到此结束了！我们下一期再一起学习吧！

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

自定义类型：结构体

自定义类型：结构体

结构体类型的声明

结构的声明

结构体变量的创建和初始化

结构的特殊声明

结构的自引用

结构体内存对齐

对齐规则

为什么存在内存对齐

修改默认对齐数

结构体传参

结构体实现位段

什么是位段

位段的内存分配

位段的跨平台问题

位段的应用

位段使用的注意事项

相关文章

C语言：深入理解指针(1)

【C语言：自定义类型（结构体、位段、共用体、枚举）】

【Java】类与对象简介

【Java】引用传递的实例分析

【Hive】常用的数据类型

【C++】初识类和对象

C语言指针（1）

指针的理解（三）

【C++】优先级队列(容器适配器)

数据在内存中的存储（超详细讲解）

作者介绍

最新文章

数据在内存中的存储（超详细讲解）

Redis多级缓存指南：从前端到后端全方位优化！

javascript 西瓜一期 15 数据的存储单位

php phpexcel导文件爆500(爆内存) && 应对

Linux系统性能调优技巧

极限挑战：40亿个非负整数中找到没有出现的数（bit数组）

热门文章

获取服务器CPU、内存等各类信息工具类

linux的存储管理

libcurl第十二课 内存分析

JS 变量、作用域与内存

Confluence 7 如何修改启动内存

JVM内存模型

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Redis 的数据被删除，为什么占用内存没减少？

【C初阶】内存函数：memcpy+memmove+memset+memcmp

Redis入门

【内存管理】flink内存管理(一)：内存管理概述：flink主动管理内存原理、flink内存模型

不重复大数据量的批量生成

Linux内核之内存4: 内存与I/O的交换

libcurl第十二课内存分析