Enum TextFormattingMode

情報

PDFドキュメントをテキストに変換する際に使用できる異なるモードを定義します。Documentize.TextExtractorOptions クラスを参照してください。

public enum TextFormattingMode

フィールド

  • Flatten = 2: PDFコンテンツを座標によるテキストフラグメントで表現します。これは基本的に「Raw」モードに似ています。しかし、「Raw」がドキュメント内のテキストフラグメント(オペレーター)の構造を保持することに重点を置くのに対し、「Flatten」は読み取られる順序でテキストを保持することに重点を置いています。
  • Pure = 0: PDFテキストコンテンツをいくつかのフォーマットルーチンを用いて表現します。これには相対的な位置を考慮し、テキストをページの幅に合わせるために追加のスペースを加えることが含まれます。
  • Raw = 1: PDFコンテンツをそのまま表現します。つまり、フォーマットなしで表現します。

Namespace: Documentize Assembly: Documentize.dll

 日本語