Enum TextFormattingMode

Информация

Определяет различные режимы, которые могут быть использованы при преобразовании PDF-документа в текст. См. класс Documentize.TextExtractorOptions.

public enum TextFormattingMode

Поля

  • Flatten = 2: Представляет содержание PDF с позиционированием текстовых фрагментов по их координатам. Это в основном аналогично “Raw” режиму. Но в то время как “Raw” сосредотачивается на сохранении структуры текстовых фрагментов (операторов) в документе, “Flatten” сосредотачивается на сохранении текста в порядке, в котором он читается.
  • Pure = 0: Представляет текстовое содержание PDF с несколькими форматированными процедурами. Это включает в себя учет относительных позиций и добавление дополнительных пробелов для выравнивания текста по ширине страницы.
  • Raw = 1: Представляет содержание PDF таким, какое оно есть, т.е. без форматирования.

Namespace: Documentize Assembly: Documentize.dll

 Русский