加权平均数是什么意思,统计学/机器学习中不明觉厉的专业术语

张强律师 法律头条 2022-11-02 10:10:42

导读:加权平均数是什么意思,统计学/在机器学习中不知所云专业术语很多学科都有一些虚张声势、难以理解的术语,主要有两个原因。第一,纪念这个理论的发明者;二是一些新的学科,很多理论

加权平均数是什么意思,统计学/在机器学习中不知所云专业术语

很多学科都有一些虚张声势、难以理解的术语,主要有两个原因。第一,纪念这个理论的发明者;二是一些新的学科,很多理论还是一堆论文组成的,还没有出现领军人物来总结。

像数学这样的学科已经出现了几千年,很多难懂的术语早已被驯化得通俗易懂。如果

圆周率称为祖冲之率。

,放

毕达哥拉斯定理叫做勾股定理。

,只能把简单的问题复杂化。但是在很多新学科中,术语不清晰给初学者理解造成了很大的障碍。

我感觉“统计学”是使用最模糊术语的学科之一,很多术语背后的思想都很简单。

极大似然估计

。最大似然估计,直译为“最有可能的估计”,一个猎人和一个没用过枪的普通人去打猎,一声枪响,一只兔子被打死了。谁杀兔子的概率更大?当然是猎人。

朴素贝叶斯

朴素贝叶斯,选择概率最高的决策。一个人平时喜欢帮助别人。你认为这个人是好人的概率大吗?还是坏人概率大?

马尔可夫链

。前天、昨天和今天的天气都会影响明天的天气,但影响最大的是

今天

天气

正态分布

:也称正态分布,正常:一种相对正常的态度,而不是异常的不正常。师范大学的英文是Normal University,意思是正常。

正常,严肃,为人师表。

回归分析

,回归分析,一个省的人平均身高100年几乎不变,假设是1.7米。即使有一个2.26米的姚明,姚明的后代也一定会有1.7米。

返回

不可能超过2.26米,即使姚明的女儿10岁的时候有1.7米。可以用引力来理解,物极必反。

物流回归

:最小二乘法用于计算回归线

推测的

。拉丁语:从过去来看,如果一个集合频繁出现(比如购物篮里的商品),那么它的子集也频繁出现。

德尔菲法

。德尔菲,加权平均意见。在市场调查中,对不同层次的专家赋予不同的权重,因为院士、教授、总经理、经理和普通员工在经验和知识上有很大的差异,从而避免了一人一票制的弊端。

神经网络

模拟人脑决策的人工神经网络分为几层神经元,每层神经元的权重不同。还有这个

德尔菲法

有点像调查企业对明年收益的看法。先调查经理级别,再调查总监级别,再调查总裁级别。每个层次的人的意见有不同的权重,最后得到一个结论。

欧几里得距离

,欧几里德距离,欧洲:欧几里德,二维空间两点间的距离= (x1-x2)2+ (y1-y2)2,然后平方。可以推广到N维空间。

曼哈顿距离

曼哈顿距离,两点之间的距离= |x1-x2|+|y1-y2|,因方便出租车司机计算A点到B点的街区距离而得名,因为A点到B点的路线一般不是直线。

决策图表

找相亲对象:有房吗?→你有车吗?→帅?1.8m以上?回答完才能继续。每个决策节点都有清晰的边界,可以清晰的对相亲对象进行分类。

假设检验

,

HYTHESIS TEST统计学中用来证明小概率事件不会发生的一套八股文方法不能保证绝对准确。

例:某公司开发了一种新药,假设其药效与旧药相同(

H0,你不想发生的事情

),找两组患者做疗效对照试验,发现新药有效的概率大于老药,拒绝H0假设(当然对照试验只能代表一批样本,不能代表全部,也有可能新药和老药的效果没有差别,但在目前的概率下,新药被认为是有效的)

支持向量机

支持向量机,寻找一个分割平面,使该平面附近的数据点与分割平面的距离最大,类似于最小二乘法(回归)。

k均值聚类

:根据数据点之间的(欧几里德)距离,将数据点分为K类。

KNN最近邻算法

当前位置离朱者赤最近的邻居是个黑人。一个人的认知水平与他最关注的K个人有关,可以归为最关注的人的水平。

一款新车型上市,应该划分到哪个细分市场?寻找与他竞争最强的K款车型(可以使用汽车网站上的车型对比数据),选择第一款竞品所在的细分市场。

张量

一维数据叫向量,二维数据叫矩阵,三维数据叫张量。

成本函数/成本函数/损失函数

,损失/成本函数,预测错了会受到惩罚,犯错的成本和代价,L(w,B)是W和B的函数,不为特征变量x。

梯度下降

,梯度下降,机器学习的本质,就像下山。找一个低点,走过去,四处看看,再找一个低点,一直下线,直到到达山脚。每一步都更靠近山脚,不是瞎走。

总结:以上内容是对机器学习中加权平均数是什么意思,统计学专业术语的详细介绍。文章内容部分转载自网络,希望对你了解什么是加权平均有帮助和价值。

版权声明

本站搜集来源于网络,如侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意。