Enum TextFormattingMode

Information

Définit différents modes qui peuvent être utilisés lors de la conversion d’un document PDF en texte. Voir la classe Documentize.TextExtractorOptions.

public enum TextFormattingMode

Champs

  • Flatten = 2: Représente le contenu PDF avec des fragments de texte positionnés par leurs coordonnées. C’est essentiellement similaire au mode “Raw”. Mais alors que “Raw” se concentre sur la préservation de la structure des fragments de texte (opérateurs) dans un document, “Flatten” se concentre sur le maintien du texte dans l’ordre dans lequel il est lu.
  • Pure = 0: Représente le contenu textuel PDF avec quelques routines de formatage. Cela inclut la prise en compte des positions relatives et l’ajout d’espaces supplémentaires pour aligner le texte avec la largeur de la page.
  • Raw = 1: Représente le contenu PDF tel quel, c’est-à-dire sans formatage.

Namespace: Documentize Assembly: Documentize.dll

 Français