马尔可夫性质是概率论中的一个概念,因为俄国数学家安德雷·马可夫得名。当一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态;换句话说,在给定现在状态时,它与过去状态是条件独立的,那么此随机过程即具有马尔可夫性质。具有马尔可夫性质的过程通常称之为马尔可夫过程。
,又名高斯分布、正规分布,是一个非常常见的概率分布。常态分布在统计学上十分重要,经常用在自然科学和社会科学来代表一个不明的随机变量。
,又名高斯分布、正规分布,是一个非常常见的概率分布。常态分布在统计学上十分重要,经常用在自然科学和社会科学来代表一个不明的随机变量。
,亦称 ,在统计学中指总体中量测到,可以描述总体性质的量测量,例如平均数或标准差。若总体依循一已知的特定分布,可以用这母数来完全的描述总体,也可以定义在此总体中样本可能有的概率分布。
麦克斯韦-玻尔兹曼分布是一个描述一定温度下微观粒子运动速度的概率分布,在物理学和化学中有应用。最常见的应用是统计力学的领域。任何物理系统的温度都是组成该系统的分子和原子的运动的结果。这些粒子有一个不同速度的范围,而任何单个粒子的速度都因与其它粒子的碰撞而不断变化。然而,对于大量粒子来说,处于一个特定的速度范围的粒子所占的比例却几乎不变,如果系统处于或接近处于平衡。麦克斯韦-玻尔兹曼分布具体说明了这个比例,对于任何速度范围,作为系统的温度的函数。它以詹姆斯·麦克斯韦和路德维希·玻尔兹曼命名。
梅特罗波利斯-黑斯廷斯算法是统计学与统计物理中的一种马尔科夫蒙特卡洛方法,用于在难以直接采样时从某一概率分布中抽取随机样本序列。得到的序列可用于估计该概率分布或计算积分等。梅特罗波利斯-黑斯廷斯或其他MCMC算法一般用于从多变量分布中采样。对于单变量分布而言,常会使用自适应判别采样等其他能抽取独立样本的方法,而不会出现MCMC中样本自相关的问题。
偏度,亦称歪度,在几率论和统计学中衡量实数随机变数概率分布的不对称性。偏度的值可以为正,可以为负或者甚至是无法定义。在数量上,偏度为负就意味着在概率密度函数左侧的尾部比右侧的长,绝大多数的值位于平均值的右侧。偏度为正就意味着在概率密度函数右侧的尾部比左侧的长,绝大多数的值位于平均值的左侧。偏度为零就表示数值相对均匀地分布在平均值的两侧,但不一定意味着其为对称分布。
伯努利分布,又名两点分布或者0-1分布,是一个概率分布,为纪念瑞士科学家雅各布·伯努利而命名。若伯努利试验成功,则伯努利随机变量取值为1。若伯努利试验失败,则伯努利随机变量取值为0。记其成功概率为
p
{\displaystyle p}
,失败概率为
q
=
1
−
p
{\displaystyle q=1-p}
。则
卡方检验是一种统计量的分布在零假设成立时近似服从卡方分布的假设检验。在没有其他的限定条件或说明时,卡方检验一般代指的是皮尔森卡方检定。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。
隐含狄利克雷分布,是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种非监督式学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。