|多所知名高校合著综述论文、Nature 新子刊创刊首发,这是你常听到的贝叶斯统计与建模( 二 )

文章插图
图 3:博士延毕示例中的先验预测检验。确定似然函数
似然函数在贝叶斯推断和频率学派推断中都有应用。在两种推断范式下,似然函数的作用都是将观测数据的概率表示为未知参数。在一些案例中,指定似然函数是非常直接的,例如投掷一枚硬币的实验。
文章插图
似然函数的硬币实验示例。(来源:https://zh.wikipedia.org/wiki/%E4%BC%BC%E7%84%B6%E5%87%BD%E6%95%B0)后验分布
指定先验和似然函数,并收集数据之后,就可以得到后验分布。本文解释了如何将模型与数据拟合来获取后验分布、如何选择变量,以及为什么需要后验预测检验。
模型构建是一个迭代的过程,任何贝叶斯模型都可以看做是一个占位符,可以在面对新数据或对现有数据拟合不足时进行改进,也可以仅通过模型改进( model refinement)过程来实现。
在贝叶斯推断中,模型拟合的一种不错方法是马尔可夫链蒙特卡罗方法(MCMC)。MCMC 能够利用计算机模拟间接获取对后验分布的推断,下表 1 概述了基于 MCMC 和不基于 MCMC 的采样技术。
表 1:基于 MCMC 和不基于 MCMC 的采样技术概览。
下图展示了在博士延毕示例中使用 MCMC 方法的后验估计情况:
文章插图
此外,实现贝叶斯分析有很多标准计算包,参见下表 2:
文章插图
表 2:常用的开源贝叶斯软件程序包。后验预测检验
获取特定模型的后验分布后,我们可以用它模拟基于这一分布的新数据,这有助于评估模型是否提供有效预测,对未来事件进行推断。这些模拟可用于多种目的,比如通过对比观测数据和模拟数据的核密度估计值来检验模拟数据是否类似于观测数据。在评估模型是否与数据生成机制有不错的拟合时需要更正式的后验预测检验方法。任何参数依赖的统计或差异都可用于后验预测检验。这与先验预测检验的使用方式类似,但在对比观测数据和模拟数据时要更加严苛。
为了阐释后验预测分布的用法,本文展示了另一个示例:了解一个维基百科网页的浏览量,以及与浏览量相关的时间关联因素。
文章插图
图 6:基于当前观测数据进行后验预测检验和对未来页面浏览量进行预测。应用
贝叶斯推断在多个科学领域得到了广泛应用,本文重点介绍了其在「社会和行为科学」、「生态学」和「遗传学」领域的应用,此处不再展开介绍。
可复现性与数据处理
恰当的统计信息报告(包括数据和脚本共享)对于研究的验证和可复现是关键因素。优秀的研究实践鼓励可复现性,其工作流程参见下图 7:
文章插图
图 7:研究工作流程中的可复现性因素。这里展示了贝叶斯研究阶段(图 1)和 WAMBS 检查表在更广泛的研究透明度中的应用,并提供了更新版的 WAMBS 检查表。
文章插图
文章插图
WAMBS 检查表更新版。对人工智能的影响
出于支持大规模应用的需要,贝叶斯概念已经利用了以深度学习为中心的新技术的发展,包括深度学习框架(TensorFlow、Pytorch),创建表示能力更强、数据驱动的模型。除了提供一个强大的工具来挑选灵活、模块化的生成模型之外,DNN 已被用于开发新的近似推理方法,并为贝叶斯实践提出了一种新的范式,该范式将统计建模和计算融入了其核心之中。
一个典型的例子就是变分自编码器,它已经成功地应用于多个领域,比如单细胞基因组学,为这些领域提供一个通用的建模框架。该框架带来了很多扩展,包括 latent factor disentanglement。底层的统计模型是一个简单的贝叶斯分层潜变量模型,将高维观测值映射到通过 DNN 定义的函数假定正态分布的低维潜变量。变分推断被用于近似潜变量的后验分布。
然而,在标准变分推断中,我们为每个潜变量引入一个局部变分参数,在这种情况下,计算需求将随着数据样本的数量的变化呈线性增长。变分自编码器使用一种名为 amortization 的近似过程,用一个单一全局参数集(一种识别网络)取代对许多单个变分参数的推断。该识别网络用于参数化 DNN,输出每个数据点的局部变分参数。
- |美国有微软和苹果,日本有丰田和本田,那么我国有哪些知名企业呢
- 折叠屏|知名爆料人再爆OPPO折叠屏消息,应该快商用了
- 锤子科技|锤子手机复活?知名手机品牌宣布回归:邀请函居然是锤子!
- 财讯网|全球知名杂志独家专访!林晓伟:将创新根植九牧基因
- 双十一|安卓的标志设计灵感和厕所有关?7个世界知名品牌的标志冷知识
- 实验室|上海人工智能实验室联合商汤与高校发布通用视觉技术体系“书生”
- 教务|小米小爱课程表“优化版教务系统”尝鲜招募,21 所高校均可报名
- 今日头条|今日头条:捏造某知名商业人士去世消息的账号已永久封禁
- 乐谱|网易云音乐与世界知名数字乐谱订阅库nkoda达成合作
- 微软|知名美企退出中国,8年前就没了存在感,2021年“灰头土脸”离开
