聚类分析亦称为分析,是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。
信息论是应用数学、电子学和计算机科学的一个分支,涉及信息的量化、存储和通信等。信息论是由克劳德·香农发展,用来找出信号处理与通信操作的基本限制,如数据压缩、可靠的存储和数据电信等。自创立以来,它已拓展应用到许多其他领域,包括统计推断、自然语言处理、密码学、神经生物学、进化论和分子编码的功能、生态学的模式选择、热物理、量子计算、语言学、剽窃检测、模式识别、异常检测和其他形式的数据分析。
赵南元 ,男,江苏省武进县人,生于云南昆明,中华人民共和国学者,清华大学自动化系退休教授,主要研究模式识别、认知科学、伦理学。
唐远炎,男,四川省成都市人,中国模式识别和图像分析领域专家,香港浸会大学计算机科学系名誉教授。
时间序列是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值,因此时间序列可以作为离散时间数据进行分析处理。时间序列广泛应用于数理统计、信号处理、模式识别、计量经济学、数学金融、天气预报、地震预测、脑电图、控制工程、航空学、通信工程以及绝大多数涉及到时间数据测量的应用科学与工程学。
胡启恒,女,祖籍陕西榆林,生于北京,中国模式识别专家。毕业于苏联莫斯科化工机械学院,获技术科学副博士学位。1994年当选中国工程院信息与电子工程学部院士。曾任中国科学院副院长、自动化研究所所长,中国科学技术协会副主席,中国互联网协会理事会首任理事长。2013年6月,她入选国际互联网协会第二批“互联网名人堂”名单,成为首个获此殊荣的中国人。其兄胡启立,曾任第十三届中共中央政治局常委、第九届全国政协副主席。
图像分析和图像处理关系密切,两者有一定程度的交叉,但是又有所不同。图像处理侧重于信号处理方面的研究,比如图像对比度的调节、图像编码、去噪以及各种滤波的研究。而图像分析更侧重于研究图像的内容,包括但不局限于使用图像处理的各种技术,它更倾向于对图像内容的分析、解释和识别。因而,图像分析和计算机科学领域中的模式识别、计算机视觉关系更密切一些。
时间序列是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值,因此时间序列可以作为离散时间数据进行分析处理。时间序列广泛应用于数理统计、信号处理、模式识别、计量经济学、数学金融、天气预报、地震预测、脑电图、控制工程、航空学、通信工程以及绝大多数涉及到时间数据测量的应用科学与工程学。
模糊数学,亦称弗晰数学或模糊性数学。1965年以后,在模糊集合、模糊逻辑的基础上发展起来的模糊拓扑、模糊测度论等数学领域的统称。是研究现实世界中许多界限不分明甚至是很模糊的问题的数学工具。在模式识别、人工智能等方面有广泛的应用。
线性判别分析 是对费舍尔的线性鉴别方法的归纳,这种方法使用统计学,模式识别和机器学习方法,试图找到两类物体或事件的特征的一个线性组合,以能够特征化或区分它们。所得的组合可用来作为一个线性分类器,或者,更常见的是,为后续的分类问题做降维处理。