Enum TextFormattingMode

Informação

Define diferentes modos que podem ser usados ao converter um documento PDF em texto. Veja a classe Documentize.TextExtractorOptions.

public enum TextFormattingMode

Campos

  • Flatten = 2: Representa o conteúdo PDF com fragmentos de texto posicionados por suas coordenadas. É basicamente semelhante ao modo “Raw”. Mas enquanto “Raw” se concentra em preservar a estrutura dos fragmentos de texto (operadores) em um documento, “Flatten” se concentra em manter o texto na ordem em que é lido.
  • Pure = 0: Representa o conteúdo de texto PDF com algumas rotinas de formatação. Isso inclui levar em conta as posições relativas e adicionar espaços extras para alinhar o texto à largura da página.
  • Raw = 1: Representa o conteúdo PDF tal como está, ou seja, sem formatação.

Namespace: Documentize Assembly: Documentize.dll

12 de ago. de 2025
 Português