R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化-天翼云

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

2023-02-10 10:10:49 阅读次数：444

关联规则挖掘是一种无监督的学习方法，从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中，我将解释如何在R中提取关联规则。
关联规则模型适用于交易数据。交易数据的一个例子可以是客户的购物历史。

数据分析的第一件事是了解目标数据结构和内容。出于学习的目的，我认为使用一个简单的数据集更好。一旦我们知道了这个模型，就可以很容易地把它应用于更复杂的数据集。

在这里，我们使用杂货店的交易数据。首先，我们创建一个数据框并将其转换为交易类型。

读取数据

n=500 # 交易数量

trans <- data.frame() # 收集数据的数据框架

创建数据并将其收集到交易数据框中。

for(i in 1:n)
{
  count <- sample(1:3, 1) # 从1到3的物品计数
  如果(i %% 2 == 1)
  {
    if(!add_product %in% selected)
    {
      tran <- data.frame(items = add_product, tid = i)

检查交易数据框中的数据。

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

接下来，我们需要将生成的数据框转换为交易数据类型。

 as(split([, "items"], [, "tid"]), "transa")

为了检查交易数据的内容，我们使用 inspect() 命令。

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

挖掘规则

sort(rules_1, dby = "confidence")

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

.......

我们从上面的列表中获取第一个rhs项（规则后项）来检查该项的规则。但如果你知道目标项目，可以在参数中只写rhs="melon"。

 inspect(rules_1@rhs[1])

> rhs_item <- gsub("\\}","", rhs)

我们为我们的rhs_item建立规则

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

按 "置信度 "排序并检查规则

sort(rules_2, "confidence")

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

结果可视化

最后，我们从规则集_2中绘制出前5条规则。

> plot(rules_2[1:5])

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

绘制全部规则

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

交互可视化

绘制出前5条规则

precision	 =  3
igraphLayout	 =  layout_nicely
list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe, 
            edgesToDataframe = edgesToDataframe,
x$legend <- legend
    htmlwidgets::createWidget( x, width = width, 
        height = height)

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

绘制全部规则

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

相关文章

pandas数据分析41——不同地区不同城市数据分级统计汇总

pandas数据分析38——数据框表格拓展以及缩回对齐

pandas数据分析42——读取和写入stata和spss的数据格式

Python计算分类问题的评价指标(准确率、精确度、召回率和F1值，Kappa指标)

Backtrader获取数据集当天的全部数据

决策树算法

R语言实现基于随机森林的高光谱影像分类

拓端tecdat|R语言代码编写用向量自回归（VAR）进行经济数据脉冲响应研究分析

R语言混合效应模型（mixed model）案例研究|附代码数据

R语言广义相加模型 (GAMs)分析预测CO2时间序列数据|附代码数据

作者介绍

最新文章

R语言实现基于随机森林的高光谱影像分类

拓端tecdat|R语言代码编写用向量自回归（VAR）进行经济数据脉冲响应研究分析

R语言混合效应模型（mixed model）案例研究|附代码数据

R语言广义相加模型 (GAMs)分析预测CO2时间序列数据|附代码数据

r语言中对LASSO回归，Ridge岭回归和弹性网络Elastic Net模型实现|附代码数据

R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例|附代码数据

热门文章

R语言Rstan概率编程规划MCMC采样的贝叶斯模型

R语言方差分析（ANOVA）学生参加辅导课考试成绩差异

r语言中对LASSO，Ridge岭回归和Elastic Net模型实现

使用R语言进行时间序列（arima，指数平滑）分析

R语言实现绘制Sankey桑基图（河流图、分流图）流程数据可视化

R语言画ROC曲线总结

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

R语言对混合分布中的不可观测与可观测异质性因子分析

拓端tecdat|R语言SIR模型（Susceptible Infected Recovered Model）代码sir模型实例

Matlab广义线性模型glm泊松回归的lasso、弹性网络正则化分类预测考试成绩数据和交叉验证可视化

R语言生成时间序列

R语言在不同样本量下的Little's MCAR检验

R语言中的风险价值模型度量指标TVaR与VaR