隐含狄利克雷分布 编辑
隐含狄利克雷分布,是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种非监督式学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。
1