Déduplicateur de texte

Supprimer les doublons

Outil en ligne gratuit pour supprimer les lignes, mots ou paragraphes en double.

Outils associés

Pourquoi utiliser un déduplicateur de texte ?

Réduisez le bruit des listes, nettoyez des journaux collés ou retirez des phrases répétées avant analyse — sans envoyer vos données hors de votre machine.

Avantages

  • Données plus propres : moins de lignes ou jetons répétés.
  • Unités flexibles : lignes, mots ou paragraphes.
  • Règle de conservation : première ou dernière occurrence.
  • Aperçu rapide : la sortie suit vos modifications.
  • Privé : fonctionne localement dans le navigateur.

Fonctionnement de la déduplication

L’outil construit des clés de comparaison (texte trimé pour lignes/paragraphes ; mots en minuscules), supprime les doublons selon votre règle et reconstruit le texte avec les mêmes séparateurs (sauts de ligne, espaces ou doubles sauts).

Fonctionnalités

  • Mode lignes : une unité par ligne ; les lignes vides restent dans la liste découpée.
  • Mode mots : jetons découpés sur les espaces ; fusion des doublons sans casse.
  • Mode paragraphes : blocs séparés par une ou plusieurs lignes vides.
  • Premier/dernier : contrôle de l’instance conservée.
  • Copier : export du texte nettoyé où vous voulez.

Quand l’utiliser

Nettoyage d’import, préparation de listes d’URL uniques, suppression de puces répétées ou essais sur brouillons.

Cas d’usage idéaux

  • Listes : lignes uniques issues de tableurs ou journaux.
  • Mots : jetons uniques type vocabulaire depuis un bloc.
  • Paragraphes : sections répétées dans des notes.
  • Confidentialité : texte sensible ne quitte pas l’onglet.
  • Correctif rapide : sans formules tableur.

À savoir

Ce qu’il faut attendre.

Points clés

  • Déduplication structurelle, pas de correspondance floue ou sémantique.
  • Le mode mots sort des mots séparés par un seul espace — pas de conservation des sauts de ligne d’origine.
  • Les très grandes entrées peuvent être limitées par la mémoire du navigateur.
  • Chaque mode répond à une question différente ; choisissez l’unité qui correspond à vos données.
  • Relisez toujours avant publication ou modification destructrice.

Bonnes pratiques

De meilleurs résultats.

Qualité

  • Si la répétition est voulue (poésie, code), prévisualisez avec soin.
  • Code et données structurées : vérifiez manuellement après dédup.
  • Le mode paragraphe exige des blancs clairs entre blocs.
  • La comparaison après trim peut assimiler des variantes d’espacement.
  • Testez un petit échantillon sur de gros collages.

Quand ne pas l’utiliser

  • Quand les doublons portent des métadonnées différentes à conserver.
  • Pour la correspondance floue (quasi-doublons, fautes).
  • Quand seule une base ou un outil spécialisé définit l’unicité.

Limites et compatibilité

Heuristiques texte brut uniquement ; JavaScript requis. Règles de correspondance fixes (trim + casse comme ci-dessus) — pas de normaliseurs personnalisés.

Alimenté par un traitement côté client.

Questions fréquentes

Le déduplicateur est-il gratuit ?

Oui. Tout s’exécute dans votre navigateur. Pas d’inscription ni d’envoi de fichier.

Puis-je supprimer uniquement les lignes en double ?

Oui. Choisissez le mode lignes. Vous pouvez aussi dédupliquer les mots sur tout le texte ou les paragraphes entiers séparés par des lignes vides.

Que signifie conserver la première plutôt que la dernière ?

Pour une même ligne trimée (ou le même mot sans casse, ou le même paragraphe trimé), une seule copie reste : la plus ancienne (première) ou la plus récente (dernière), selon la case.

Mon texte est-il protégé ?

Oui. Le traitement reste sur votre appareil.

Comment les doublons sont-ils détectés ?

Lignes et paragraphes : espaces en début/fin ignorés pour la comparaison ; la ligne conservée garde son espacement original. Mots : comparaison insensible à la casse ; les mots en sortie sont espacés d’un seul espace.

Déduplicateur de texte — supprimer les doublons en ligne gratuit