文本相似度 Text Similarity

XY 共同的子序列长度 L 越长,两者越接近。

  • Longest Common Subsequence
    • L

Editing Distance

X 变成 Y 需要 n 个动作,n 越小,两者越接近。

  • Levenshtein Distance
    • 阈值 d < max(N, M)/2