R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据-天翼云

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

2024-07-29 08:01:57 阅读次数：30

在这篇文章中，我将对多元线性回归使用block的Gibbs采样，得出block的Gibbs采样所需的条件后验分布。然后，对采样器进行编码，并使用模拟数据对其进行测试。

贝叶斯模型

假设我们有一个样本量的主题。贝叶斯多元回归假设该向量是从多元正态分布中提取的，通过使用恒等矩阵，我们假设独立的观察结果。

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

到目前为止，这与多元正态回归相同。则将概率最大化可得出以下解：

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

贝叶斯模型是通过指定为一个先验分布得到。在此示例中，我将在以下情况下使用先验值

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

block Gibbs

在对采样器进行编码之前，我们需要导出Gibbs采样器的每个参数的后验条件分布。

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

条件后验取更多的线性代数。

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

这是一个非常漂亮和直观的结果。条件后验的协方差矩阵是协方差矩阵的估计，

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

还要注意，条件后验是一个多元分布。因此，在Gibbs采样器的每次迭代中，我们从后验绘制出一个完整的矢量。

模拟

我模拟的结果向量

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

。

运行 Gibbs采样器会生成对真实系数和方差参数的估计。运行了500,000次迭代。周期为100,000次，10次迭代。

以下是MCMC链的图，其中真实值用红线表示。

# 计算后验摘要统计信息
post_dist %>%
  group_by(para) %>%
  summarise(median=median(draw),
            lwr=quantile(.025),
            upr=quantile(.975)) %>%
 
# 合并汇总统计信息
post_dist <- post_dist %>%
  left_join(post_sum_stats, by='param')
 
# 绘制MCMC链
ggplot(post_dist,aes(x=iter,y=dra)) +
  geom_line() +
  geom_hline(aes(yintercept=true_vals))

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

这是修整后参数的后验分布：

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

ggplot(post_dist,aes(x=draw)) +
  geom_histogram(aes(x=draw),bins=50) +
  geom_vline(aes(xintercept = true_vals))

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

似乎能够获得这些参数的合理后验估计。为了确保贝叶斯估计器正常工作，我对1,000个模拟数据集重复了此过程。

这将产生1,000组后验均值和1,000组95％置信区间。平均而言，这1000个后验均值应以真实值为中心。平均而言，真实参数值应在95％的时间的置信区间内。

以下是这些评估的摘要。

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

“估计平均值”列是所有1,000个模拟中的平均后验平均值。偏差百分比均小于5％。对于所有参数，95％CI的覆盖率约为95％。

扩展

我们可以对该模型进行许多扩展。例如，可以使用除正态分布外的其他分布来拟合不同类型的结果。例如，如果我们有二元数据，则可以将其建模为：

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

然后在上放一个先验分布。这个想法将贝叶斯线性回归推广到贝叶斯GLM。

在本文中概述的线性情况下，可以更灵活地对协方差矩阵建模。相反，假设协方差矩阵是对角线且具有单个公共方差。这是多元线性回归中的同方差假设。如果数据是分类的（例如，每个受试者有多个观察结果），我们可以使用反Wishart分布来建模整个协方差矩阵。

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归|附代码数据

贝叶斯模型

block Gibbs

模拟

扩展

相关文章

javascript 西瓜一期 05-08 计算机的基本组成

javascript 西瓜一期 15 数据的存储单位

机器学习项目的流程：从数据到部署

Flask ORM 学习笔记Part05：marshmallow的使用（中）

如何把一个python列表(有很多个元素)变成一个excel表格的第一列？

TCP头部信息有哪些？

谈谈TCP的控制位？

基于数据分析与PyTorch框架实现天气未来温度预测

线性表之数组

你应该知道一些其他存储——列式存储

作者介绍

最新文章

如何把一个python列表(有很多个元素)变成一个excel表格的第一列？

谈谈TCP的控制位？

数据字典的实现与应用 —— 提高系统灵活性与维护效率的关键

R语言多元（多变量）GARCH ：GO-GARCH、BEKK、DCC-GARCH和CCC-GARCH模型和可视化|附代码数据

React中的key作用

服务器数据恢复-UNIX类文件系统软件层级常见数据丢失的故障有哪些？UNIX类文件系统数据恢复可能性分析

热门文章

R语言Rstan概率编程规划MCMC采样的贝叶斯模型

R语言方差分析（ANOVA）学生参加辅导课考试成绩差异

Python|斐波那契数列

游戏编程之十一 图像页CPICPAGE介绍

PHP：将list列表转为tree树形数据

r语言中对LASSO，Ridge岭回归和Elastic Net模型实现

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

如何在Java中实现大规模数据可视化

在Spring Boot中实现数据校验与验证

使用Java实现高并发的数据同步

缓存优化利器：5分钟实现 LRU Cache，从原理到代码！

r语言中对LASSO回归，Ridge岭回归和弹性网络Elastic Net模型实现|附代码数据

R语言实现绘制Sankey桑基图（河流图、分流图）流程数据可视化

游戏编程之十一图像页CPICPAGE介绍