Mini wiki
编辑距离
编辑
编辑距离是针对二个
字符串
的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。编辑距离可以用在
自然语言处理
中,例如
拼写检查
可以根据一个拼错的字和其他正确的字的编辑距离,判断哪一个是比较可能的字。
去氧核糖核酸
也可以视为用A、C、G和T组成的字符串,因此编辑距离也用在
生物信息学
中,判断二个DNA的类似程度。
Unix
下的
Diff
及
Patch
即是利用编辑距离来进行文本编辑对比的例子。
1