仪器网(yiqi.com)欢迎您!

| 注册2 登录
网站首页-资讯-专题- 微头条-话题-产品- 品牌库-搜索-供应商- 展会-招标-采购- 社区-知识-技术-资料库-方案-产品库- 视频

技术中心

当前位置:仪器网>技术中心> 工作原理> 正文

机器学习算法之贝叶斯算法介绍(一)

来源:康宁反应器技术有限公司 更新时间:2024-11-06 11:22:49 阅读量:352
导读:贝叶斯算法是很高级非常有用,而又带有一些神秘感

*图片来源于网络

近些年来很多化学化工类文献会在其里面提到贝叶斯算法(或贝叶斯优化算法),让人有种感觉,这个贝叶斯算法是很高级非常有用,而又带有一些神秘感。

随便上网一搜索,会出现大量文章介绍贝叶斯定理、贝叶斯算法,条件概率、先验概率、后验概率、朴素贝叶斯、高斯贝叶斯等等名词,让非这个专业的人感觉到头大。例如在搜索引擎里面输入“贝叶斯定理”会查到关于贝叶斯定理的历史来源,计算公式介绍等。

贝叶斯算法

比如百度百科中关于“贝叶斯公式”的介绍:贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1761年) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(A|B)=P(B|A)*P(A)/P(B)

*图片来源于网络it.sohu.com/a/577883879_99977650

本文为了非专业背景的读者了解“贝叶斯算法”原理,采用轻松的方式为您介绍贝叶斯算法的思路逻辑。



在开始前,我们先来看看平时下结论的步骤:

在观察到一个证据或线索后,我们通常会根据自己历史经验,该证据出现时多少概率产生某后果,然后选择最大概率的后果做出结论判断。其实这就是类似朴素贝叶斯算法的步骤。

为了方便理解,举一个不严谨的例子:

住在南方海边城市的人在夏季,天气闷热而且感觉到胸闷,会做出大概率海上会有台风的判断。

这里的夏季天气闷热胸闷是证据(Evidence,E),台风是输出(Outcome,Y),根据这个证据得出这个台风的判断的概率,使用数学表达为P(Y|E)。当然这个输出也可以为疾病(Y2,使用Y2区分台风),毕竟有胸闷现象,但判断者为什么选择是台风的判断而不是身体疾病的判断?

 P(Y)即先验概率 P(Y|E)为后验概率 

因为判断者其中一个理由是认为自己身体很棒有病的概率很低,也就是P(Y2)概率比出现台风的概率P(Y)小多了(注,这里的P(Y)即先验概率,P(Y|E)为后验概率)。

 历史经验 P(E|Y)概率 

再进一步分析,为什么判断者根据这个证据做出台风判断,是因为他在南方海边城市住有“历史经验”,我们看看他是如何得到这个历史经验的。

小时候,第一次发现有台风很好奇,第二次发现有台风,好像都是在夏季及其闷热而且胸闷。渐渐地他发现,在夏天有台风前感觉非常闷热和胸闷的概率很高,也就是P(E|Y)概率很高,而且他所住的城市出现台风的概率比较高P(Y)。另外他身体健康出现胸闷的机会不大,即P(Y2)比较小。在他脑海中做出P(Y|E)=P(E|Y)*P(Y)/P(E)计算,因而有了出现这个证据做出有台风的判断。

看完前面不严谨的例子后,我们来看看电脑是如何实现朴素贝叶斯算法的?

比如给出一个水果的特征为“长”“甜”“黄色”,电脑如何通过已有的数据来“学习”,并预测出现这三个特征的水果是什么。

首先电脑具有以下数据:

*该数据引用自网络参考资料:朴素贝叶斯算法是如何工作的?

电脑是根据比较在出现“长”、“甜”、“黄色”这三个特征下为香蕉、橙子或其它水果的概率大小做出判断的。即比较概率P(香蕉|长甜黄色)、P(橙子|长甜黄色)、P(其它|长甜黄色),哪个概率大就预测为哪一种水果。

第一步:我们先计算出证据概率P(E)即P(长甜黄色),我们需要知道这些特征(长、甜、黄色)在给定样本中出现的频率。由于这些特征是相互独立的,我们可以分别计算每个特征的边缘概率,然后将它们相乘得到联合概率P(E)。

P(长):在给定样本中,长度为长的样本所占的比例500/1000=0.5。

P(甜):在给定样本中,甜度为甜的样本所占的比例650/1000=0.65。

P(黄色):在给定样本中,颜色为黄色的样本所占的比例800/1000=0.8。

计算联合概率P(E): 由于特征之间相互独立,我们可以将每个特征的边缘概率相乘得到联合概率: 

P(E) = P(长) * P(甜) * P(黄色)=0.26.

第二步,P(香蕉)、P(橙子)、P(其它)的先验概率分别为P(香蕉)=500/1000=0.5、P(橙子)=300/1000=0.3、P(其它)=200/1000=0.2。

第三步,计算P(长|香蕉)=400/500=0.8、P(甜|香蕉)=350/500=0.7、P(黄色|香蕉)=450/500=0.9。这样P(香蕉|长甜黄色)= P(长|香蕉)* P(甜|香蕉)* P(黄色|香蕉)* P(香蕉)/ P(长甜黄色)=0.969。

然后再分别计算出:

P(橙子|长甜黄色)=0,

P(其它|长甜黄色)=0.072。

因而电脑根据特征为“长”、“甜”、“黄色”预测该水果为香蕉

参考内容:How Naive Bayes Algorithm Works? (with example and full code) | ML+  (machinelearningplus.com)


下篇预告

下一篇我们即将进入贝叶斯优化算法的原理介绍。


推荐阅读

关于机器学习的那点事儿-PCA算法大讨论

机器学习与连续流连载系列丨机器学习:人工智能的驱动力

【名家案例】连续流工艺优化中的机器学习和人工智能

机器学习与连续流连载系列丨使用康宁反应器集成在线光谱,通过半监督机器学习识别化学反应式计量和动力学模型

欢迎关注康宁AFR公众号

参与评论

全部评论(0条)

相关产品推荐(★较多用户关注☆)
你可能还想看
  • 技术
  • 资讯
  • 百科
  • 应用
  • 全自动菌落计数器的算法应用和软件功能
    全自动菌落计数器已经得到越来越广泛的应用,全自动菌落计数器的特点包含有很多的自动化水平,可以核对分析的结果,可以留存样品的信息,其受到了科研院所、卫生疾控部门的青睐。
    2025-10-231212阅读
  • 视觉机器维修
    视觉机器的高效运行不仅提高了生产效率,还保证了产品的质量。随着使用时间的推移,这些机器也可能会出现不同程度的故障。因此,及时有效的维修工作对于保障生产线的稳定运行至关重要。本篇文章将深入探讨视觉机器维修的关键要素、常见故障类型以及维护策略,帮助企业提升设备的可靠性和工作效率。
    2025-10-1776阅读 机器视觉
  • 机器视觉检测原理
    本文将详细探讨机器视觉检测的基本原理、应用领域以及发展趋势,旨在为读者提供一个系统的了解,使其能够在实际应用中更好地理解和应用这一技术。
    2025-10-23157阅读 机器视觉
  • DNA提取常见问题(一)
    核酸提取仪核酸提取仪是应用配套的核酸提取试剂来使得样本核酸提取工作自动完成的仪器。其在环境微生物检测、食品安全检测、法医学鉴定、临床疾病诊断、生物学研究以及畜牧业等多种领域得到广泛地应用。
    2025-10-221837阅读
  • “揭秘库仑计核心算法:从电流积分到温度补偿,误差如何被降至0.1%以下?”
    库仑计作为电化学分析的核心计量工具,其测量精度直接决定了滴定终点判断、电量分析等实验的可靠性。在实验室科研、工业质检、材料表征等场景中,传统仪器因积分误差、温度漂移导致的0.5%以上系统误差已难以满足高精度需求。本文将深度解析库仑计的四大核心算法模块,并通过实测数据展示误差优化路径。
    2026-01-282阅读 库仑计
  • 查看更多
版权与免责声明

①本文由仪器网入驻的作者或注册的会员撰写并发布,观点仅代表作者本人,不代表仪器网立场。若内容侵犯到您的合法权益,请及时告诉,我们立即通知作者,并马上删除。

②凡本网注明"来源:仪器网"的所有作品,版权均属于仪器网,转载时须经本网同意,并请注明仪器网(www.yiqi.com)。

③本网转载并注明来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。

④若本站内容侵犯到您的合法权益,请及时告诉,我们马上修改或删除。邮箱:hezou_yiqi

热点文章
表面处理怎么用盐水喷雾试验法
振弦式应变计的监测系统搭档:从单点测量到全面感知
微量硅酸根分析仪基本工作原理
投入式水位计透水部件含有气泡会导致什么问题?如何避免?
长云科技电缆输送机900型详情介绍
超声波浓度计的构造和工作原理
洁净室究竟净化啥?
大鼠叉头框蛋白01(FoxO1)ELISA试剂盒实验使用说明书
ibidi-VITVO微流控3D动态培养:打通体外模型与体内生理的关键桥梁
霍尔效应测试仪在PEDOTPSS-离子液体中电特性性能测试的应用
近期话题
相关产品

在线留言

上传文档或图片,大小不超过10M
换一张?
取消