Enum TextFormattingMode

Información

Define diferentes modos que se pueden usar al convertir un documento PDF en texto. Ver clase Documentize.TextExtractorOptions.

public enum TextFormattingMode

Campos

  • Flatten = 2: Representa el contenido PDF con fragmentos de texto posicionados por sus coordenadas. Es básicamente similar al modo “Raw”. Pero mientras “Raw” se centra en preservar la estructura de los fragmentos de texto (operadores) en un documento, “Flatten” se centra en mantener el texto en el orden en que se lee.
  • Pure = 0: Representa el contenido de texto PDF con unas pocas rutinas de formato. Esto incluye tener en cuenta las posiciones relativas y agregar espacios adicionales para alinear el texto al ancho de la página.
  • Raw = 1: Representa el contenido PDF tal como está, es decir, sin formato.

Namespace: Documentize Assembly: Documentize.dll

 Español