Enum TextFormattingMode

Информация

Определяет разные режимы, которые можно использовать при конвертации PDF документа в текст. См. класс Documentize.ExtractTextOptions.

public enum TextFormattingMode

Fields

  • Flatten = 2: Представляет содержимое PDF с расположением текстовых фрагментов по их координатам. Это в основном похоже на режим “Raw”. Но в то время как “Raw” фокусируется на сохранении структуры текстовых фрагментов (операторов) в документе, “Flatten” акцентирует внимание на сохранении текста в порядке, в котором он читается.
  • Pure = 0: Представляет текстовое содержимое PDF с несколькими форматирующими процедурами. Это включает в себя учет относительных позиций и добавление дополнительных пробелов для выравнивания текста по ширине страницы.
  • Raw = 1: Представляет содержимое PDF как есть, т.е. без форматирования.

Namespace: Documentize Assembly: Documentize.dll

13 окт. 2025 г.
 Русский