Fonction levenshtein() de PHP

La fonction levenshtein() de PHP


PHP references des fonctions PHP

(PHP 4 >= 4.0.1, PHP 5)

levenshtein() — Calcule la distance levenshtein entre deux chaînes

La fonction levenshtein() de PHP

Définition et utilisation

La fonction levenshtein() renvoie la distance levenshtein entre deux chaînes.

La distance levenshtein est le nombre de caractères que vous devez remplacer, insérer ou supprimer pour transformer string1 en string2.

Par défaut ; dans sa forme la plus simple, la fonction levenshtein() va prendre uniquement deux chaînes de caractères comme paramètres, et calculer simplement le nombre d'insertions, de remplacements et d'effacements nécessaires pour transformer string1 en string2

La deuxième variante de la fonction prend trois paramètres supplémentaires qui représentent les coûts d'insertions, de remplacements et d'effacements. C'est une version plus générale de la première fonction, mais qui est un peu moins efficace.

Syntaxe : Sélectionner le code

              levenshtein (string1, string2, insertion, remplacement, suppression)
           
 
Paramètre Description

string1

Requis. Première chaîne à comparer

string2

Requis. Deuxième chaîne à comparer

insertion

Facultatif. Le coût d'insérer un caractère. Par défaut c’est 1

remplace

Facultatif. Le coût de remplacer un caractère. Par défaut c’est 1

suppression

Facultatif. Le coût de supprimer un caractère. Par défaut c’est 1


Notes :

Note 1 : La fonction levenshtein () renvoie -1 si une des chaînes dépasse 255 caractères.

Note 2 : La fonction levenshtein () ne distingue pas les majuscules et minuscules.

Note 3 : La fonction levenshtein () est plus rapide que la fonction similar_ text (). Cependant, similar_ text () donnera un résultat plus précis avec moins de modifications requises.


Exemple Sélectionner le code

              <html>
              <body>
              <?php
              // mot mal orthographié
              $input = 'bannane';
               
              // tableau de mots à vérifier
              $words  = array('pomme','prune','banane','orange','avocat','kiwi','mangue','habricot','citron');
              // aucune distance de trouvée pour le moment
              $shortest = -1;
              // boucle sur les des mots pour trouver le plus près
              foreach ($words as $word) {
                  // calcule la distance avec le mot mis en entrée,
                  // et le mot courant
                  $lev = levenshtein($input, $word);
               
                  // cherche une correspondance exacte
                  if ($lev == 0) {
                      // le mot le plus près est celui-ci (correspondance exacte)
                      $closest = $word;
                      $shortest = 0;
                      // on sort de la boucle ; nous avons trouvé une correspondance exacte
                      break;
                  }
                  // Si la distance est plus petite que la prochaine distance trouvée
                  // OU, si le prochain mot le plus près n'a pas encore été trouvé
                  if ($lev <= $shortest || $shortest < 0) {
                      // définition du mot le plus près ainsi que la distance
                      $closest  = $word;
                      $shortest = $lev;
                  }
              }
              echo "Mot entré : $input\n";
              if ($shortest == 0) {
                  echo "Correspondance exacte trouvée : $closest\n";
              } else {
                  echo "Vous voulez dire : $closest ?\n";
              }
               
              ?>
               
              </body>
              </html>
           
 


Par carabde 22 Aout 2014