统计分类 编辑
统计分类是机器学习非常重要的一个组成部分,它的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。分类是监督学习的一个实例,根据已知训练集、验证集和测试集提供的样本,通过计算选择特征参数,建立线性判别分析以对样本进行的分类。与之相对的是无监督学习,例如聚类分析
6
图片 0 图片
评论 0 评论
匿名用户 · [[ show_time(comment.timestamp) ]]
[[ nltobr(comment.content) ]]
相关
C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。该算法是对Ross Quinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的,因此该算法也可以用于统计分类
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。
C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。该算法是对Ross Quinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的,因此该算法也可以用于统计分类
梯度提升是一种用于回归分析和统计分类问题的机器学习技术,其产生的预测模型是弱预测模型的集成学习,如采用典型的决策树学习作为弱预测模型,这时则为梯度提升树。像其他提升方法一样,它以分阶段的方式构建模型,但它通过允许对任意可可微函数损失函数进行优化作为对一般提升方法的推广。
决策边界或决策面是统计分类问题中的一个超曲面,把向量空间划分为两个集合,分别对应两个分类。
Scikit-learn是用于Python编程语言的自由软件机器学习库。它的特征是具有各种统计分类、回归分析和聚类分析算法,包括支持向量机、随机森林、梯度提升技术、K-平均算法和DBSCAN,它被设计协同于Python数值和科学库NumPy和SciPy。
在机器学习中,径向基函数核,或称为RBF核,是一种常用的支持向量机。它是支持向量机统计分类中最为常用的核函数。
在计算机科学中,学习向量量化是一种基于原型的监督学习统计分类算法。 LVQ是向量量化的监督版本。
C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。该算法是对Ross Quinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的,因此该算法也可以用于统计分类
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。