Enum TextFormattingMode

Thông tin

Định nghĩa các chế độ khác nhau có thể được sử dụng khi chuyển đổi một tài liệu PDF thành văn bản. Xem lớp Documentize.TextExtractorOptions.

public enum TextFormattingMode

Fields

  • Flatten = 2: Đại diện cho nội dung PDF với các đoạn văn bản được định vị theo tọa độ của chúng. Nó cơ bản tương tự như chế độ “Raw”. Nhưng trong khi “Raw” tập trung vào việc bảo tồn cấu trúc của các đoạn văn bản (toán tử) trong một tài liệu, “Flatten” tập trung vào việc giữ văn bản theo thứ tự mà nó được đọc.
  • Pure = 0: Đại diện cho nội dung văn bản PDF với một số quy trình định dạng. Điều này bao gồm việc xem xét các vị trí tương đối và thêm khoảng trống bổ sung để căn chỉnh văn bản theo chiều rộng của trang.
  • Raw = 1: Đại diện cho nội dung PDF như nó là, tức là không có định dạng.

Namespace: Documentize Assembly: Documentize.dll

 Tiếng Việt