人工智能基础 - Cross-Validation（交叉验证）详解-天翼云

人工智能基础 - Cross-Validation（交叉验证）详解

2024-10-22 06:29:28 阅读次数：22

在机器学习里，通常来说我们不能将全部用于数据训练模型，否则我们将没有数据集对该模型进行验证，从而评估我们的模型的预测效果。为了解决这一问题，有如下常用的方法：

1.The Validation Set Approach

第一种是最简单的，也是很容易就想到的。我们可以把整个数据集分成两部分，一部分用于训练，一部分用于验证，这也就是我们经常提到的训练集（training set）和测试集（test set）。

人工智能基础 - Cross-Validation（交叉验证）详解

例如，如上图所示，我们可以将蓝色部分的数据作为训练集（包含7、22、13等数据），将右侧的数据作为测试集（包含91等），这样通过在蓝色的训练集上训练模型，在测试集上观察不同模型不同参数对应的MSE的大小，就可以合适选择模型和参数了。

不过，这个简单的方法存在两个弊端。

1.最终模型与参数的选取将极大程度依赖于你对训练集和测试集的划分方法。什么意思呢？我们再看一张图：

人工智能基础 - Cross-Validation（交叉验证）详解

右边是十种不同的训练集和测试集划分方法得到的test MSE，可以看到，在不同的划分方法下，test MSE的变动是很大的，而且对应的最优degree也不一样。所以如果我们的训练集和测试集的划分方法不够好，很有可能无法选择到最好的模型与参数。

2.该方法只用了部分数据进行模型的训练

我们都知道，当用于模型训练的数据量越大时，训练出来的模型通常效果会越好。所以训练集和测试集的划分意味着我们无法充分利用我们手头已有的数据，所以得到的模型效果也会受到一定的影响。

基于这样的背景，有人就提出了Cross-Validation方法，也就是交叉验证。

2.Cross-Validation

2.1 LOO-CV

首先，我们先介绍LOOCV方法，即（Leave-one-out cross-validation）。像Test set approach一样，LOOCV方法也包含将数据集分为训练集和测试集这一步骤。但是不同的是，我们现在只用一个数据作为测试集，其他的数据都作为训练集，并将此步骤重复N次（N为数据集的数据数量）。

人工智能基础 - Cross-Validation（交叉验证）详解

如上图所示，假设我们现在有n个数据组成的数据集，那么LOOCV的方法就是每次取出一个数据作为测试集的唯一元素，而其他n-1个数据都作为训练集用于训练模型和调参。结果就是我们最终训练了n个模型，每次都能得到一个MSE。而计算最终test MSE则就是将这n个MSE取平均。

人工智能基础 - Cross-Validation（交叉验证）详解

比起test set approach，LOOCV有很多优点。首先它不受测试集合训练集划分方法的影响，因为每一个数据都单独的做过测试集。同时，其用了n-1个数据训练模型，也几乎用到了所有的数据，保证了模型的bias更小。不过LOO-CV的缺点也很明显，那就是计算量过于大，是test set approach耗时的n-1倍。

为了解决计算成本太大的弊端，又有人提供了下面的式子，使得LOOCV计算成本和只训练一个模型一样快。

人工智能基础 - Cross-Validation（交叉验证）详解

其中表示的是第i个模型在第i组测试集上的分类错误的个数。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

人工智能基础 - Cross-Validation（交叉验证）详解

人工智能基础 - Cross-Validation（交叉验证）详解

1.The Validation Set Approach

2.Cross-Validation

相关文章

java使用poi实现excel保护工作表实例代码（支持.xls和.xlsx）

机器学习项目的流程：从数据到部署

python 无监督生成模型

图神经网络与图表示学习: 从基础概念到前沿技术

优化线性回归模型的代价函数

oracle导出导入命令行

基于数据分析与PyTorch框架实现天气未来温度预测

人工智能与AI生成内容：探索AI大模型的无限可能

AI大模型的战场 通用大模型 vs. 垂直大模型

机器学习和深度学习的区别

作者介绍

最新文章

python 无监督生成模型

图神经网络与图表示学习: 从基础概念到前沿技术

优化线性回归模型的代价函数

人工智能与AI生成内容：探索AI大模型的无限可能

AI大模型的战场 通用大模型 vs. 垂直大模型

深度学习中的核心概念详解

热门文章

Django入门：第五章、模型建立与迁移

PyTorch 06： PyTorch保存和加载模型

AIGC从入门到大神：解锁人工智能生成内容的奥秘

什么是模型

数学建模系列（1/4）：数学建模简介

什么是迁移学习

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

深入解析MVC架构（Model-View-Controller Architecture）

AI的智慧精华：解锁知识蒸馏的秘密

tensorflow从入门到精通——Alexnet网络实现分类

【大模型认识】警惕AI幻觉，利用插件+微调来增强GPT模型

零信任安全模型和多因素身份验证：提升网络安全的关键一步

StyleGAN——定制人脸生成思路

AI大模型的战场通用大模型 vs. 垂直大模型

AI大模型的战场通用大模型 vs. 垂直大模型