Logiciel déduplication dédoublonnage : AmaDedup

Data management

Socle de la qualité de données, l’algorithme de comparaison de chaînes de caractères permet de rapprocher tout type d’information, en particulier raisons sociales, noms, services, adresses, codes postaux, villes, téléphones…

Dédoublonnage ou déduplication pour :

  • éviter tout doublon, triplon ou multiples dans les fichiers et bases de données
  • rapprocher des données entre elles pour les enrichir mutuellement

Ainsi le score de comparaison fournit un indice d’égalité floue entre deux valeurs données et permet de s’affranchir d’erreurs communes :
logiciel dédoublonnage déduplication assistant graphique de traitement

  • imperfection de la saisie :
    • erreurs de frappe
    • inversion, ajout, suppression de caractères
    • remplacement de caractères
  • utilisation de mauvais caractères :
    • O plutôt que 0 (zéro)
    • I plutôt que 1 (un)
  • mauvaise transcription d’écriture manuscrite
    • confusion U/V, N/M
    • collision de lettres
  • abréviations et troncatures
  • sigles, acronymes
  • traduction
  • équivalences
  • orthographe
  • variations spécifiques aux fichiers BtoB / BtoC
  • modification de l’ordre des éléments
  • etc.

Caractéristiques logiciel déduplication B2B / B2C

  • Algorithme de comparaison basé sur une triple analyse syntaxique, phonétique et sémantique
  • Création de scripts d’automatisation en mode shell ou graphique
  • Architecture Client-Serveur Multi-utilisateurs
  • Multi-thread, performances optimales, jusqu’à 800 millions d’adresses/heure sur octo-processeurs
  • Multi-OS Serveur et Multi-OS client

Logiciel déduplication pour :

  • AIX
  • HP/UX
  • Linux
  • MacOS X
  • Solaris
  • Unix
  • Windows

AmaNorm logiciel RNVP batch & AmaDedup logiciel de déduplication sont réunis en un seul logiciel AmaBatch

Amabis partenaire IBM

Menu