使用vector＜char＞作为输入缓冲区-天翼云

使用vector＜char＞作为输入缓冲区

2024-05-09 09:22:19 阅读次数：42

一、引言

当我们编写代码：实现网络接收、读取文件内容等功能时，我们往往要在内存中开辟一个输入缓冲区(又名：input buffer/读缓冲区）来存贮接收到的数据。在C++里面我们可以用如下方法开辟输入缓冲区。

①使用C语言中的数组：

char buf[100] = {0};

②使用malloc/new动态分配内存：

char *pBuf = new char[100];

③使用std::string

string sBuf;

④使用vector<char> / vector<unsigned char>

vector<char> vecBuf(100);

在这里面推荐使用方法④作为输入缓冲区。方法①在栈中开辟空间，对于大数组可能会有栈内存不够的问题。方法②在堆上分配内存，但是使用完需要程序员自行手动释放(delete pBuf)，而且需要一个额外的变量记录申请空间的大小。方法③只能处理字符串，不能处理二进制数据。下面具体阐述使用vector<char>作为输入缓冲区的优势。

二、使用vector<char>作为输入缓冲区的优势

（一）跟方法①相比，vector<char>可以在程序运行时调整大小

例子1：

main.cpp

#include <iostream>
#include <fstream>
#include <vector>
#include <windows.h>

// 通过stat结构体 获得文件大小，单位字节
size_t getFileSize1(const char* fileName) {

	if (fileName == NULL) {
		return 0;
	}
	// 这是一个存储文件(夹)信息的结构体，其中有文件大小和创建时间、访问时间、修改时间等
	struct stat statbuf;

	// 提供文件名字符串，获得文件属性结构体
	stat(fileName, &statbuf);

	// 获取文件大小
	size_t filesize = statbuf.st_size;
	return filesize;
}


int main()
{
	const char *fileName = "test.txt";
	std::ifstream ifs(fileName);
	int nFileSize = getFileSize1(fileName);
	char buf[100] = { 0 };
	ifs.read(buf, sizeof(buf));
	printf("%s", buf);
	return 0;
}

test.txt

hello world!

运行效果：

使用vector＜char＞作为输入缓冲区

上述的例子中，定义一个大小为100字节的数组buf，一次性读取文件test.txt中的内存，并保存到buf里面，然后打印。该代码存在的问题是：假如文件test.txt中的内容非常多，超过数组的最大容量（100个字节），则超出数组容量外（超过100个字节之外）的数据会丢失。针对该问题我们可以尝试将上述代码优化为例子2。

例子2：

我们将例子1中的语句 char buf[100] = { 0 }; 修改为：char buf[nFileSize] = { 0 };

结果编译报错了：

使用vector＜char＞作为输入缓冲区

在例子2中，我们尝试将数组buf的大小定义为要读取的文件的大小。很明显，这样是不行的，因为定义数组的时候，数组的大小必须确定，并且得是整型。我们继续优化代码。

例子3：

main.cpp

#include <iostream>
#include <fstream>
#include <vector>
#include <windows.h>

// 通过stat结构体 获得文件大小，单位字节
size_t getFileSize1(const char* fileName) {

	if (fileName == NULL) {
		return 0;
	}
	// 这是一个存储文件(夹)信息的结构体，其中有文件大小和创建时间、访问时间、修改时间等
	struct stat statbuf;

	// 提供文件名字符串，获得文件属性结构体
	stat(fileName, &statbuf);

	// 获取文件大小
	size_t filesize = statbuf.st_size;
	return filesize;
}


int main()
{
	const char *fileName = "test.txt";
	std::ifstream ifs(fileName);
	int nFileSize = getFileSize1(fileName);
	std::vector<char> vecBuf(nFileSize);
	ifs.read(&vecBuf[0], vecBuf.size());
	for (const auto& e : vecBuf)
	{
		std::cout << e;
	}
	return 0;
}

运行效果如下：

使用vector＜char＞作为输入缓冲区

例子3使用了vector<char>，所以可以在程序运行过程中调整大小（可以用resize()调整vector大小）。从而解决例子2中的问题。可能有些朋友会说用方法②“使用malloc/new动态分配内存”，不一样可以吗？确实是可以。但是vector<char>相当于对malloc/new进行了一层封装，使用起来更方便。而且不用手动调用delete函数释放内存，避免内存泄漏。

（二）跟方法②相比，vector<char>提供了各种方法

使用vector::reserve预分配内存
使用vector::size的记录缓冲区位置
使用vector::resize增长/清除缓冲区
使用&your_vector[0]转换为C缓冲区
使用vector::swap转换缓冲区所有权

例子4：

int bufsize = 4096;
char *pBuf = new char[bufsize];
int recv = read(sock, pbuf, bufsize)

例子4是一个网络接收的小demo。可以看到使用new的方式，需要额外增加一个变量bufsize来存贮缓冲区的大小。我们可以用vector<char>优化如下：

例子5：

std::vector<char> buf(4096); // create buffer with preallocated size
int recv = read( sock, &buf[0], buf.size() );

可以看到vector已经提供了size()方法来记录缓冲区的大小，不需要再额外增加变量了。所以使用vector<char>更方便，而且离开作用域自动释放内存，不需要手动delete，更安全。

（三）跟方法③相比，vector<char>可以存贮二进制数据

例子6：

main.cpp

#include <iostream>
#include <vector>
#include <string>

using namespace std;


int main()
{
	string strBuf = "abc\0ef";
	cout << strBuf << endl;
	
	std::vector<char> vecBuf = { 'a', 'b', 'c', '\0', 'e', 'f'};
	for (const auto& e : vecBuf)
	{
		std::cout << e;
	}
	return 0;
}

运行效果如下：

使用vector＜char＞作为输入缓冲区

可以看到使用std::string丢失了'\0'之后的数据，但是vector<char>不会。所以std::string只能存贮字符串，不能存贮二进制数据。二进制数据中可能会包含0x00（即：'\0'），刚好是字符串结束标志，使用std::string会有截断问题。所以对于二进制数据的保存（比如保存图片，网络接收）我们得要用vector<char>，不要用string。

三、总结

综上所述。我们首选vector<char>作为输入缓冲区。

版权声明：本文内容来自第三方投稿或授权转载，原文地址：https://blog.csdn.net/u014552102/article/details/129108886，作者：cuijiecheng2018，版权归原作者所有。本网站转在其作品的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如因作品内容、版权等问题需要同本网站联系，请发邮件至ctyunbbs@chinatelecom.cn沟通。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

使用vector＜char＞作为输入缓冲区

使用vector＜char＞作为输入缓冲区

一、引言

二、使用vector<char>作为输入缓冲区的优势

（一）跟方法①相比，vector<char>可以在程序运行时调整大小

（二）跟方法②相比，vector<char>提供了各种方法

（三）跟方法③相比，vector<char>可以存贮二进制数据

三、总结

相关文章

数据在内存中的存储（超详细讲解）

【C++】vector模拟实现的测试

STL详解（八）—— stack和queue的模拟实现

【算法入门08】青蛙跳台阶

STL详解（九）—— priority_queue的使用与模拟实现

【算法入门09】矩形覆盖

【算法入门14】二叉树的镜像

golang与 C++数据结构类型对应关系是怎样的？

MFC编程 -- 判断是否按下ctrl和shift键

MFC编程 -- 浮点数与字符串之间转换

作者介绍

最新文章

STL详解（八）—— stack和queue的模拟实现

【广度优先搜索】【二分图】【并集查找】2493. 将节点分成尽可能多的组

【图论】【状态压缩】【树】【深度优先搜索】1617. 统计子树中城市之间最大距离

【二叉树】【单调双向队列】LeetCode239:滑动窗口最大值

【单调栈】LeetCode:1944队列中可以看到的人数

【单调栈】LeetCode1776:车队

热门文章

E0144 “const char *“ 类型的值不能用于初始化 “char *“ 类型的实体

c++rand()函数-产生随机数

c++中的using namespace std;

4.寻找两个正序数组的中位数 （困难）

c++primer Plus 6 的课后题（第三章3.6）

Codeforces 题记 Different Rules

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

0027 自然数的和之和 c/c++

STL详解（十四）—— bitset（位图）的介绍与使用

【二叉树】【单调双向队列】LeetCode239:滑动窗口最大值

Windows平台里的grep——1.Borland grep

1940. C二级辅导-阶乘数列

1500. 统计字母个数

E0144 “const char “ 类型的值不能用于初始化 “char “ 类型的实体

4.寻找两个正序数组的中位数（困难）