降维 编辑
机器学习统计学领域,降维是指在某些限定条件下,降低随机变量个数,得到一组“不相关”主变量的过程。 降维可进一步细分为特征选择特征提取两大方法。
1
相关
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。
分段聚合近似法是一种时间序列数据的降维方法,最早由埃蒙·基奥等人提出,用于建立时间序列索引。相比于离散傅里叶变换、离散小波变换、奇异值分解等降维方法,分段聚合近似法操作比较简便,适用于更多距离度量,例如加权欧几里得距离。并且分段聚合近似法还适用于索引长度和查询长度不同的情况。如今分段聚合近似法已经成为一种广泛应用的时间序列处理方法。
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。
约翰逊-林登斯特劳斯定理,又称约翰逊-林登斯特劳斯引理,是由William Johnson和Joram Lindenstrauss于1984年提出的一个关于降维的著名定理,在现代机器学习,尤其是压缩感知、降维、形状分析和分布学习等领域中有很重要的应用。
受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机神经网络生成模型神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴,但直到杰弗里·辛顿及其合作者在2000年代中叶发明快速学习算法后,受限玻兹曼机才变得知名。受限玻兹曼机在降维、统计分类、协同过滤、特征学习和主题建模中得到了应用。根据任务的不同,受限玻兹曼机可以使用监督学习或非监督式学习的方法进行训练。
信息瓶颈是信息论中的一种方法,由纳夫塔利·泰斯比、费尔南多·佩雷拉与威廉·比亚莱克于1999年提出。对于一随机变量



X


{\displaystyle X}

,假设已知其与观察变量



Y


{\displaystyle Y}

之间的联合概率分布



p



{\displaystyle p}

。此时,当需要概括



X


{\displaystyle X}

时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度。该方法的应用还包括分布聚类与降维等。此外,信息瓶颈也被用于分析深度学习的过程。