C++——map和set-天翼云

C++——map和set

2025-02-10 08:56:19 阅读次数：7

一.map和set理解

1.set

set从简单的角度理解，就是一颗二叉搜索树，每个节点存放一个元素，并且不允许有相同元素的节点出现，被要求的是，节点的值不能被修改，但可以增加或删除。

2.map

而map则是在set的基础上，将存储数据更替为键值对pair<K,V>，其中K一般是不能更改的，而V是能够更改的。

二.map和set实现

由于map和set的底层都是红黑树，所以这里我们分享一种map和set共用一份红黑树代码的实现方式。

1.基本框架

首先我们要知道，map和set存储的数据类型是有区别的，前者为pair<K,V>键值对，后者为单一的数据类型K，所以对于红黑树的数据类型，我们需要做出更改：

template<class T>
struct RBTreeNode
{
	RBTreeNode<T>* _left;
	RBTreeNode<T>* _right;
	RBTreeNode<T>* _parent;

	T _data;
	Colour _col;

	RBTreeNode(const T& data)
		:_left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _data(data)
		, _col(RED)
	{}
};

能够看出，我们直接将数据类型改为模版T，用来替换pair<K,V>和K，数据直接用data代替。

当进行插入操作时，我们又会面临一些问题：

如果是set，当进行比较操作时直接比较K，无妨。
但是如果是map，比较时则会比较pair，虽然pair类型可以进行比较，但是其底层的比较方式却与我们想要的结果不同。

为了让map也进行key的比较，我们引入仿函数，通过仿函数，来获取到map中pair的key：

		struct MapKeyOfT
		{
			const K& operator(const pair<K,V>& kv)
			{
				return kv.first;
			}
		};
		struct SetKeyOfT
		{
			const K& operator(const K& key)
			{
				return key;
			}
		};

为了帮助map完成操作，set也同样需要一个仿函数。

由于仿函数需要创建对象使用，所以我们还需引入新的模版KeyOfT：

template<class K, class T,class KeyOfT>
class RBTree
{
	typedef RBTreeNode<T> Node;
public:
	//插入
	bool Insert(const T& data)
	{
		if (_root == nullptr)
		{
			_root = new Node(data);
			_root->_col = BLACK;//根给黑色
			return true;
		}
		KeyOfT kot;
		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (kot(cur->data) < kot(data))
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (kot(cur->data) > kot(data))
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return false;
			}
		}

那么为什么我们这里还要保留模版参数K呢？？

这是因为当使用find函数和erase等函数时，无论是map还是set，我们只需要传入K即可。

进行数据比较时，只需调用仿函数，即可完成key的比较。

到此，两个容器的基本框架才算完成：

#include"RBTree.h"
namespace MyMapSet
{
	template<class K>
	class set
	{
		struct SetKeyOfT
		{
			const K& operator()(const K& key)
			{
				return key;
			}
		};
	public:
		bool Insert(const K& key)
		{
			return _t.Insert(key);
		}
	private:
		RBTree<K, K, SetKeyOfT> _t;
	};
}

#include"RBTree.h"
namespace MyMapSet
{
	template<class K,class V>
	class map
	{
		struct MapKeyOfT
		{
			const K& operator()(const pair<K,V>& kv)
			{
				return kv.first;
			}
		};
	public:
		bool Insert(const pair<K, V>& kv)
		{
			return _t.Insert(kv);
		}
	private:
		RBTree<K, pair<K,V>, MapKeyOfT> _t;
	};
}

2.迭代器

那么map和set只要是C++的容器，就一定会存在迭代器，下面我们直接通过代码来分析迭代器的常用功能该如何实现。

template<class T,class Ref,class Ptr>
struct __RBTreeIterator
{
	typedef RBTreeNode<T> Node;
	typedef __RBTreeIterator<T,Ref,Ptr> Self;
	Node* _node;
	__RBTreeIterator(Node* node)
		:_node(node)
	{}

	Ref operator*()
	{
		return _node->_data;
	}
	Ptr operator->()
	{
		return &_node->_data;
	}
	bool operator!=(const Self& s)
	{
		return _node != s._node;
	}
};

创建一个迭代器类能更好的帮助我们在红黑树类中实现迭代器功能。

这些功能容易理解，这里就不做过多解释。

下面我们来分析关键功能++。

首先红黑树是二叉搜索树，其数据本质上是按升序的顺序排序，所以当使用++时，我们得到的一定是按升序的下一个数据。

而我们已经知道，红黑树的中序遍历结果即为升序，所以在一棵同时包含父子节点的树中，其三个节点的大小顺序为：左子节点 < 根节点 < 右子节点。

所以如果该节点为左子节点，那么++之后的节点就是其父节点，如果该节点为父节点，那么++之后的节点则会是其右子树的最小节点。而如果该节点为右子节点，那么就说明其为该棵同时包含父子节点的树中的最大节点，此时就要循环往上遍历，直至循环至根节点，说明此时已经为整棵树的最大节点，再++即为空。

或者循环过程中cur节点为父节点的子节点，再++则为父节点。

	Self& operator++()
	{
		if (_node->_right)//有右子树，去找右子树的最左子节点
		{
			Node* leftMin = _node->_right;
			while (leftMin && leftMin->_left)
			{
				leftMin = leftMin->_left;
			}
			_node = leftMin;
		}
		else//没有右子树，则找到其父节点
		{
			Node* cur = _node;
			Node* parent = cur->_parent;
			while (parent && cur == parent->_right)//如果该节点为父节点的右子树，则向上循环
			{
				cur = parent;
				parent = parent->_parent;
			}
			_node = parent;//直至循环至根节点，或者循环过程中cur节点为父节点的子节点
		}
		return *this;
	}

完成迭代器类的实现之后，紧接着就是将其封装在红黑树类中：

template<class K, class T,class KeyOfT>
class RBTree
{
	typedef RBTreeNode<T> Node;
public:
	typedef __RBTreeIterator<T, T&, T*> Iterator;
	Iterator Begin()
	{
		Node* leftMin = _root;
		while (leftMin && leftMin->_left)
		{
			leftMin = leftMin->_left;
		}
		return Iterator(leftMin);
	}
	Iterator End()
	{
		return Iterator(nullptr);
	}

而迭代器的begin，即为整棵树的最左节点，end即为空。

最后再将其分别封装到map和set中，即可完成迭代器的实现：

set：

	public:
		typedef typename RBTree<K, K, SetKeyOfT>::Iterator iterator;
		iterator begin()
		{
			return _t.Begin();
		}
		iterator end()
		{
			return _t.End();
		}

map：

	public:
		typedef typename RBTree<K, pair<K, V>, MapKeyOfT>::Iterator iterator;
		iterator begin()
		{
			return _t.Begin();
		}
		iterator end()
		{
			return _t.End();
		}

测试如下：

C++——map和set

最后还有一个值得关注的问题，就是set和map的key都是不能被修改的，但是我们上边的代码并不能实现：

C++——map和set

这是不合理的，而解决的方法为：

map：

RBTree<K, pair<const K,V>, MapKeyOfT> _t;

typedef typename RBTree<K, pair<const K, V>, MapKeyOfT>::Iterator iterator;
set：

RBTree<K, const K, SetKeyOfT> _t;
typedef typename RBTree<K, const K, SetKeyOfT>::Iterator iterator;

在封装时即将key定义为const类型，便可保证其不能被修改。

3.map重载[]

map不同于set的另外一点就在于其重载了运算符[]，可以使得map通过key来直接得到其value。

当key存在时，就返回其对应的value，不存在则会新插入该key，并返回其迭代器。

所以想要重载[]，我们还需对插入函数进行改进：

pair<Iterator, bool> Insert(const T& data)
	{
		if (_root == nullptr)
		{
			_root = new Node(data);
			_root->_col = BLACK;//根给黑色
			return make_pair(Iterator(_root),true);//树为空，创建并返回迭代器
		}
		KeyOfT kot;
		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (kot(cur->_data) < kot(data))
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (kot(cur->_data) > kot(data))
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return make_pair(Iterator(cur), false);//节点存在，返回
			}
		}
        cur = new Node(data);
		Node* newnode = cur;//插入后cur会变，所以提前记录
		cur->_col = RED;//新增节点给红色
        //此处省略插入步骤
       _root->_col = BLACK;
		return make_pair(Iterator(newnode), true);//树不为空，但不存在，返回新节点
	}

要将插入函数的返回值改为pair类型，同时包含Iterator和bool。

此时我们便可在map中重载[]：

		V& operator[](const K& key)
		{
			pair<iterator, bool> ret = _t.Insert(make_pair(key,V()));
			return ret.first->second;
		}

定义ret去接收返回值，其中ret.first得到的是迭代器，而迭代器中也包含data的pair类型，所以再取second即可返回value。

测试如下：

C++——map和set

活动

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

C++——map和set

C++——map和set

一.map和set理解

1.set

2.map

二.map和set实现

1.基本框架

2.迭代器

3.map重载[]

相关文章

【C++图论】2359. 找到离给定两个节点最近的节点|1714

【C++图论】1993. 树上的操作|1861

【C++DFS】2049. 统计最高分的节点数目|1911

【C++图论 二分图 DFS】785. 判断二分图|1624

【C++图论 BFS算法】2467. 树上最大得分和路径|2053

基础—常用数据结构：列表、元祖、集合、字典、函数等（爬虫及数据可视化）

【网络】网络故障排查命令 -- 编辑中

【C\\C++】程序如何执行shell命令并获取执行结果|popen

初步认识arduino程序（基础知识）

Shell提升配置管理的效率与质量：基于Shell脚本修改变更值

作者介绍

最新文章

【C++DFS】2049. 统计最高分的节点数目|1911

【C++图论】2359. 找到离给定两个节点最近的节点|1714

【C++图论】1993. 树上的操作|1861

【C++图论 二分图 DFS】785. 判断二分图|1624

【C++图论 BFS算法】2467. 树上最大得分和路径|2053

【C\\C++】程序如何执行shell命令并获取执行结果|popen

热门文章

Python 函数调用父类详解

Python编程：pkgutil获取包里面的所有模块列表

游戏编程之六 游戏编程的特点

Python 输出函数运行时间的两种方式（常规、装饰器）

C#8.0新语法

实现远程线程DLL注入

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

Python 中的高阶函数与闭包

【C++11】C++11多线程(简约但不简单)|多线程类Thread和用法示例

【C++】哈夫曼编码求完全二叉树叶结点编号

Java零基础入门之IO流详解（二）

Linux源码阅读笔记07-进程管理4大常用API函数

主函数和子函数中使用多线程的区别

【C++图论二分图 DFS】785. 判断二分图|1624

【C++图论二分图 DFS】785. 判断二分图|1624

游戏编程之六游戏编程的特点