Distância de Jaro-Winkler

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

A métrica de distância Jaro-Winkler [1] é a medida da similaridade entre duas strings. É uma variação da métrica Jaro distance [2] .

A métrica Jaro distance [3] estabelece que dadas duas strings s_1 and s_2, sua distância d_j é:

d_j = \frac{m}{3a} + \frac{m}{3b} + \frac{m-t}{3m}

onde:

  • m é o número de correlações entre caracteres;
  • a e b são os tamanhos de s_1 e s_2, respectivamente;
  • t é o número de transposições.

Referências

  1. WINKLER, 1999.
  2. JARO, 1989, 1995
  3. JARO, 1989, 1995

Ligações externas[editar | editar código-fonte]

Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.