非监督式学习 编辑
无监督学习,又称非监督式学习,是机器学习的一种方法,没有给定事先标记过的训练范例,自动对输入的资料进行分类或分群。无监督学习的主要运用包含:聚类分析、关联规则、维度缩减。它是监督式学习和强化学习等策略之外的一种选择。
1
相关
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。
BIRCH是一个非监督式学习聚类分析,于1996年由 Tian Zhang 提出。算法的优势在于能够利用有限的内存资源完成对大数据集的高质量的聚类。该算法通过构建聚类特征树,在接下来的聚类过程中,直接对聚类特征进行聚类,而无需对原始数据集进行聚类。因此在多数情况下只需要扫描一次数据库即可进行聚类,IO成本与数据集尺寸呈线性关系。
隐含狄利克雷分布,是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种非监督式学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。
隐含狄利克雷分布,是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种非监督式学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。
自组织映射或自组织特征映射是一种使用非监督式学习来产生训练样本的输入空间的一个低维离散化的表示的人工神经网络。自组织映射与其他人工神经网络的不同之处在于它使用一个邻近函数来保持输入空间的拓扑学性质。
自组织映射或自组织特征映射是一种使用非监督式学习来产生训练样本的输入空间的一个低维离散化的表示的人工神经网络。自组织映射与其他人工神经网络的不同之处在于它使用一个邻近函数来保持输入空间的拓扑学性质。
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。
生成对抗网络是非监督式学习的一种方法,通过让两个人工神经网络相互博弈论的方式进行学习。该方法由伊恩·古德费洛等人于2014年提出。
生成对抗网络由一个生成网络与一个判别网络组成。生成网络从潜在空间中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。
生成对抗网络非监督式学习的一种方法,通过让两个人工神经网络相互博弈论的方式进行学习。该方法由伊恩·古德费洛等人于2014年提出。
生成对抗网络由一个生成网络与一个判别网络组成。生成网络从潜在空间中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。