Kelas TextExtractorOptions

Info

Mewakili opsi ekstraksi teks untuk plugin Documentize.TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Pewarisan

objectPdfExtractorOptionsTextExtractorOptions

Mengimplementasikan

Anggota yang Dwarisi

Contoh

Contoh ini menunjukkan bagaimana cara mengekstrak konten teks dari dokumen PDF.

// buat objek TextExtractor untuk mengekstrak konten PDF
using (TextExtractor extractor = new TextExtractor())
{
    // buat objek TextExtractorOptions untuk mengatur TextFormattingMode (Pure, atau Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // tambahkan jalur file input ke sumber data
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // lakukan proses ekstraksi
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // ambil teks yang diekstrak dari objek ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Catatan

Objek Documentize.TextExtractorOptions digunakan untuk mengatur Documentize.TextExtractorOptions.TextFormattingMode dan opsi lain untuk operasi ekstraksi teks. Selain itu, ia mewarisi fungsi untuk menambahkan data (file, stream) yang mewakili dokumen PDF input.

Konstruktor

TextExtractorOptions(TextFormattingMode)

Menginisialisasi instance baru dari objek Documentize.TextExtractorOptions untuk mode format teks yang ditentukan.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parameter

TextExtractorOptions()

Menginisialisasi instance baru dari objek Documentize.TextExtractorOptions dengan mode format teks ‘Raw’ (default).

public TextExtractorOptions()

Properti

FormattingMode

Mendapatkan mode format.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Nilai Properti

TextExtractorOptions.TextFormattingMode

OperationName

Mengembalikan nama operasi.

public override string OperationName { get; }

Nilai Properti

string

Namespace: Documentize Assembly: Documentize.dll

 Indonesia