Mini wiki
隐含狄利克雷分布
编辑
隐含狄利克雷分布,是一种
主题模型
,它可以将文档集中每篇文档的主题按照
概率分布
的形式给出。同时它是一种
非监督式学习
算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。
1