语音算法 编辑
语音算法是根据发音来检索词的算法,一般用于英语
1
相关
Soundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字。在拼音文字中有时会有会念但不能拼出正确字的情形,可用Soundex做类似模糊匹配的效果。例如Knuth和Kant二个字符串,它们的Soundex值都是“K530”。其在计算机科学家高德纳名著《计算机程序设计艺术》都有详细的介绍。
Metaphone是一个语音算法,主要是用在英语单字或是辞汇发音的标引。Metaphone是由飞利浦、罗伦斯利用Soundex的缺陷来改善的算法。此算法是利用较大的英语发音规则,所以比Soundex更为精准。Metaphone也可作为内建式的工具,在PHP就有相关工具。后来原作者制作新版本的算法“Double metaphone”,比原本的算法还更加精准。该算法会转换相似的发音。