关联式容器
C++STL包含了序列式容器和关联式容器:
- 序列式容器里面存储的是元素本身,其底层为线性序列的数据结构。比如:vector,list,deque,forward_list(C++11)等。
- 关联式容器里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高。比如:set、map、unordered_set、unordered_map等。
注意: C++STL当中的stack、queue和priority_queue属于容器适配器,它们默认使用的基础容器分别是deque、deque和vector。
树形结构与哈希结构
根据应用场景的不同,C++STL总共实现了两种不同结构的关联式容器:树型结构和哈希结构。
关联式容器 | 容器结构 | 底层实现 |
---|---|---|
set、map、multiset、multimap | 树型结构 | 平衡搜索树(红黑树) |
unordered_set、unordered_map、unordered_multiset、unordered_multimap | 哈希结构 | 哈希表 |
其中,树型结构容器中的元素是一个有序的序列,而哈希结构容器中的元素是一个无序的序列。
键值对
键值对是用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。
比如我们若是要建立一个英译汉的字典,那么该字典中的英文单词与其对应的中文含义就是一一对应的关系,即通过单词可以找到与其对应的中文含义。
在SGI-STL中关于键值对的定义如下:
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair() : first(T1()), second(T2())
{}
pair(const T1& a, const T2& b) : first(a), second(b)
{}
};
set
set的介绍
-
set是按照一定次序存储元素的容器,使用set的迭代器遍历set中的元素,可以得到有序序列。
-
set当中存储元素的value都是唯一的,不可以重复,因此可以使用set进行去重。
-
与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对,因此在set容器中插入元素时,只需要插入value即可,不需要构造键值对。
-
set中的元素不能被修改,因为set在底层是用二叉搜索树来实现的,若是对二叉搜索树当中某个结点的值进行了修改,那么这棵树将不再是二叉搜索树。
-
在内部,set中的元素总是按照其内部比较对象所指示的特定严格弱排序准则进行排序。当不传入内部比较对象时,set中的元素默认按照小于来比较。
-
set容器通过key访问单个元素的速度通常比unordered_set容器慢,但set容器允许根据顺序对元素进行直接迭代。
-
set在底层是用平衡搜索树(红黑树)实现的,所以在set当中查找某个元素的时间复杂度为 l o g N logN logN。
set的定义方式
方式一: 构造一个某类型的空容器。
set<int> s1; //构造int类型的空容器
方式二: 拷贝构造某类型set容器的复制品。
set<int> s2(s1); //拷贝构造int类型s1容器的复制品
方式三: 使用迭代器拷贝构造某一段内容。
string str("abcdef");
set<char> s3(str.begin(), str.end()); //构造string对象某段区间的复制品
方式四: 构造一个某类型的空容器,比较方式指定为大于。
set < int, greater<int>> s4; //构造int类型的空容器,比较方式指定为大于
set的使用
set当中常用的成员函数如下:
成员函数 | 功能 |
---|---|
insert | 插入指定元素 |
erase | 删除指定元素 |
find | 查找指定元素 |
size | 获取容器中元素的个数 |
empty | 判断容器是否为空 |
clear | 清空容器 |
swap | 交换两个容器中的数据 |
count | 获取容器中指定元素值的元素个数 |
set当中迭代器相关函数如下:
成员函数 | 功能 |
---|---|
begin | 获取容器中第一个元素的正向迭代器 |
end | 获取容器中最后一个元素下一个位置的正向迭代器 |
rbegin | 获取容器中最后一个元素的反向迭代器 |
rend | 获取容器中第一个元素前一个位置的反向迭代器 |
使用示例:
#include <iostream>
#include <set>
using namespace std;
int main()
{
set<int> s;
//插入元素(去重)
s.insert(1);
s.insert(4);
s.insert(3);
s.insert(3);
s.insert(2);
s.insert(2);
s.insert(3);
//遍历容器方式一(范围for)
for (auto e : s)
{
cout << e << " ";
}
cout << endl; //1 2 3 4
//删除元素方式一
s.erase(3);
//删除元素方式二
set<int>::iterator pos = s.find(1); //查找值为1的元素
if (pos != s.end())
{
s.erase(pos);
}
//遍历容器方式二(正向迭代器)
set<int>::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
it++;
}
cout << endl; //2 4
//容器中值为2的元素个数
cout << s.count(2) << endl; //1
//容器大小
cout << s.size() << endl; //2
//清空容器
s.clear();
//容器判空
cout << s.empty() << endl; //1
//交换两个容器的数据
set<int> tmp{ 11, 22, 33, 44 };
s.swap(tmp);
//遍历容器方式三(反向迭代器)
set<int>::reverse_iterator rit = s.rbegin();
while (rit != s.rend())
{
cout << *rit << " ";
rit++;
}
cout << endl; //44 33 22 11
return 0;
}
multiset
multiset容器与set容器的底层实现一样,都是平衡搜索树(红黑树),其次,multiset容器和set容器所提供的成员函数的接口都是基本一致的,这里就不再列举了,multiset容器和set容器的唯一区别就是,multiset允许键值冗余,即multiset容器当中存储的元素是可以重复的。
#include <iostream>
#include <set>
using namespace std;
int main()
{
multiset<int> ms;
//插入元素(允许重复)
ms.insert(1);
ms.insert(4);
ms.insert(3);
ms.insert(3);
ms.insert(2);
ms.insert(2);
ms.insert(3);
for (auto e : ms)
{
cout << e << " ";
}
cout << endl; //1 2 2 3 3 3 4
return 0;
}
由于multiset容器允许键值冗余,因此两个容器中成员函数find和count的意义也有所不同:
成员函数find | 功能 |
---|---|
set对象 | 返回值为val的元素的迭代器 |
multiset对象 | 返回底层搜索树中序的第一个值为val的元素的迭代器 |
成员函数count | 功能 |
---|---|
set对象 | 值为val的元素存在则返回1,不存在则返回0(find成员函数可代替) |
multiset对象 | 返回值为val的元素个数(find成员函数不可代替) |
map
map的介绍
-
map是关联式容器,它按照特定的次序(按照key来比较)存储键值key和值value组成的元素,使用map的迭代器遍历map中的元素,可以得到有序序列。
-
在map中,键值key通常用于排序和唯一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,并取别名为pair。
-
map容器中元素的键值key不能被修改,但是元素的值value可以被修改,因为map底层的二叉搜索树是根据每个元素的键值key进行构建的,而不是值value。
-
在内部,map中的元素总是按照键值key进行比较排序的。当不传入内部比较对象时,map中元素的键值key默认按照小于来比较。
-
map容器通过键值key访问单个元素的速度通常比unordered_map容器慢,但map容器允许根据顺序对元素进行直接迭代。
-
map容器支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
-
map在底层是用平衡搜索树(红黑树)实现的,所以在map当中查找某个元素的时间复杂度为 l o g N logN logN。
map的定义方式
方式一: 指定key和value的类型构造一个空容器。
map<int, double> m1; //构造一个key为int类型,value为double类型的空容器
方式二: 拷贝构造某同类型容器的复制品。
map<int, double> m2(m1); //拷贝构造key为int类型,value为double类型的m1容器的复制品
方式三: 使用迭代器拷贝构造某一段内容。
map<int, double> m3(m2.begin(), m2.end()); //使用迭代器拷贝构造m2容器某段区间的复制品
方式四: 指定key和value的类型构造一个空容器,key比较方式指定为大于。
map<int, double, greater<int>> m4; //构造一个key为int类型,value为double类型的空容器,key比较方式指定为大于
map的插入
map的插入函数的函数原型如下:
pair<iterator,bool> insert (const value_type& val);
insert函数的参数
insert函数的参数显示是value_type类型的,实际上value_type就是pair类型的别名:
typedef pair<const Key, T> value_type;
因此,我们向map容器插入元素时,需要用key和value构造一个pair对象,然后再将pair对象作为参数传入insert函数。
方式一: 构造匿名对象插入。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
//方式一:调用pair的构造函数,构造一个匿名对象插入
m.insert(pair<int, string>(2, "two"));
m.insert(pair<int, string>(1, "one"));
m.insert(pair<int, string>(3, "three"));
for (auto e : m)
{
cout << "<" << e.first << "," << e.second << ">" << " ";
}
cout << endl; //<1,one> <2,two> <3,three>
return 0;
}
但是这种方式会使得我们的代码变得很长,尤其是没有直接展开命名空间的情况下,因此我们最常用的是方式二。
方式二: 调用make_pair函数模板插入。
在库当中提供以下make_pair函数模板:
template <class T1, class T2>
pair<T1, T2> make_pair(T1 x, T2 y)
{
return (pair<T1, T2>(x, y));
}
我们只需向make_pair函数传入key和value,该函数模板会根据传入参数类型进行自动隐式推导,最终构造并返回一个对应的pair对象。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
//方式二:调用函数模板make_pair,构造对象插入
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
for (auto e : m)
{
cout << "<" << e.first << "," << e.second << ">" << " ";
}
cout << endl; //<1,one> <2,two> <3,three>
return 0;
}
insert函数的返回值
insert函数的返回值也是一个pair对象,该pair对象中第一个成员的类型是map的迭代器类型,第二个成员的类型的一个bool类型,具体含义如下:
- 若待插入元素的键值key在map当中不存在,则insert函数插入成功,并返回插入后元素的迭代器和true。
- 若待插入元素的键值key在map当中已经存在,则insert函数插入失败,并返回map当中键值为key的元素的迭代器和false。
map的查找
map的查找函数的函数原型如下:
iterator find (const key_type& k);
map的查找函数是根据所给key值在map当中进行查找,若找到了,则返回对应元素的迭代器,若未找到,则返回容器中最后一个元素下一个位置的正向迭代器。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
//获取key值为2的元素的迭代器
map<int, string>::iterator pos = m.find(2);
if (pos != m.end())
{
cout << pos->second << endl; //two
}
return 0;
}
map的删除
map的删除函数的函数原型如下:
//删除函数1
size_type erase (const key_type& k);
//删除函数2
void erase(iterator position);
也就是说,我们既可以根据key值删除指定元素,也可以根据迭代器删除指定元素,若是根据key值进行删除,则返回实际删除的元素个数。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
//方式一:根据key值进行删除
m.erase(3);
//方式二:根据迭代器进行删除
map<int, string>::iterator pos = m.find(2);
if (pos != m.end())
{
m.erase(pos);
}
return 0;
}
map的[ ]运算符重载
map的[ ]运算符重载函数的函数原型如下:
mapped_type& operator[] (const key_type& k);
[ ]运算符重载函数的参数就是一个key值,而这个函数的返回值如下:
(*((this->insert(make_pair(k, mapped_type()))).first)).second
就这样看着不太好理解,我们整理一下,实际上[ ]运算符重载实现的逻辑实际上就是以下三个步骤:
- 调用insert函数插入键值对。
- 拿出从insert函数获取到的迭代器。
- 返回该迭代器位置元素的值value。
对应分解代码如下:
mapped_type& operator[] (const key_type& k)
{
//1、调用insert函数插入键值对
pair<iterator, bool> ret = insert(make_pair(k, mapped_type()));
//2、拿出从insert函数获取到的迭代器
iterator it = ret.first;
//3、返回该迭代器位置元素的值value
return it->second;
}
那么这个函数的价值体现在哪里呢?我们来看看下面这段代码:
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
m[2] = "dragon"; //修改key值为2的元素的value为dragon
m[6] = "six"; //插入键值对<6, "six">
for (auto e : m)
{
cout << "<" << e.first << "," << e.second << ">" << " ";
}
cout << endl; //<1,one> <2,dragon> <3,three> <6,six>
return 0;
}
以代码中的m[2] = "dragon"
为例说明,通过[ ]运算符重载函数的三个步骤后,不管是调用insert函数插入的也好,是容器当中本来就已经存在的也好,反正无论如何map容器当中都已经有了一个key值为2的元素。而[ ]运算符重载函数的返回值就是这个key值为2的元素的value的引用,因此我们对该函数的返回值做修改,实际上就是对键值为2的元素的value做修改。
总结一下:
- 如果k不在map中,则先插入键值对<k, V()>,然后返回该键值对中V对象的引用。
- 如果k已经在map中,则返回键值为k的元素对应的V对象的引用。
map的迭代器遍历
map当中迭代器相关函数如下:
成员函数 | 功能 |
---|---|
begin | 获取容器中第一个元素的正向迭代器 |
end | 获取容器中最后一个元素下一个位置的正向迭代器 |
rbegin | 获取容器中最后一个元素的反向迭代器 |
rend | 获取容器中第一个元素前一个位置的反向迭代器 |
遍历方式一: 用正向迭代器进行遍历。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
//用正向迭代器进行遍历
map<int, string>::iterator it = m.begin();
while (it != m.end())
{
cout << "<" << it->first << "," << it->second << ">" << " ";
it++;
}
cout << endl; //<1,one> <2,two> <3,three>
return 0;
}
遍历方式二: 用反向迭代器进行遍历。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
//用反向迭代器进行遍历
map<int, string>::reverse_iterator rit = m.rbegin();
while (rit != m.rend())
{
cout << "<" << rit->first << "," << rit->second << ">" << " ";
rit++;
}
cout << endl; //<3,three> <2,two> <1,one>
return 0;
}
遍历方式三: 用范围for进行遍历。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
//用范围for进行遍历
for (auto e : m)
{
cout << "<" << e.first << "," << e.second << ">" << " ";
}
cout << endl; //<1,one> <2,two> <3,three>
return 0;
}
注意: 编译器在编译时会自动将范围for替换为迭代器的形式,因此支持了迭代器实际上就支持了范围for。
map的其他成员函数
除了上述成员函数外,set当中还有如下几个常用的成员函数:
成员函数 | 功能 |
---|---|
size | 获取容器中元素的个数 |
empty | 判断容器是否为空 |
clear | 清空容器 |
swap | 交换两个容器中的数据 |
count | 获取容器中指定key值的元素个数 |
使用示例:
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
map<int, string> m;
m.insert(make_pair(2, "two"));
m.insert(make_pair(1, "one"));
m.insert(make_pair(3, "three"));
//获取容器中元素的个数
cout << m.size() << endl; //3
//容器中key值为2的元素个数
cout << m.count(2) << endl; //1
//清空容器
m.clear();
//容器判空
cout << m.empty() << endl; //1
//交换两个容器中的数据
map<int, string> tmp;
m.swap(tmp);
return 0;
}
multimap
multimap容器与map容器的底层实现一样,也都是平衡搜索树(红黑树),其次,multimap容器和map容器所提供的成员函数的接口都是基本一致的,这里也就不再列举了,multimap容器和map容器的区别与multiset容器和set容器的区别一样,multimap允许键值冗余,即multimap容器当中存储的元素是可以重复的。
#include <iostream>
#include <string>
#include <map>
using namespace std;
int main()
{
multimap<int, string> mm;
//插入元素(允许重复)
mm.insert(make_pair(2, "two"));
mm.insert(make_pair(2, "double"));
mm.insert(make_pair(1, "one"));
mm.insert(make_pair(3, "three"));
for (auto e : mm)
{
cout << "<" << e.first << "," << e.second << ">" << " ";
}
cout << endl; //<1,one> <2,two> <2,double> <3,three>
return 0;
}
由于multimap容器允许键值冗余,因此两个容器中成员函数find和count的意义也有所不同:
成员函数find | 功能 |
---|---|
map对象 | 返回值为键值为key的元素的迭代器 |
multimap对象 | 返回底层搜索树中序的第一个键值为key的元素的迭代器 |
成员函数count | 功能 |
---|---|
map对象 | 键值为key的元素存在则返回1,不存在则返回0(find成员函数可代替) |
multimap对象 | 返回键值为key的元素个数(find成员函数不可代替) |
其次,由于multimap容器允许键值冗余,调用[ ]运算符重载函数时,应该返回键值为key的哪一个元素的value的引用存在歧义,因此在multimap容器当中没有实现[ ]运算符重载函数。