Kelas TextExtractorOptions
Mewakili opsi ekstraksi teks untuk plugin Documentize.TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Pewarisan
object ← PdfExtractorOptions ← TextExtractorOptions
Mengimplementasikan
Anggota yang Dwarisi
- PdfExtractorOptions.AddInput(IDataSource),
- PdfExtractorOptions.Inputs,
- PdfExtractorOptions.OperationName,
- object.GetType(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Contoh
Contoh ini menunjukkan bagaimana cara mengekstrak konten teks dari dokumen PDF.
// buat objek TextExtractor untuk mengekstrak konten PDF
using (TextExtractor extractor = new TextExtractor())
{
// buat objek TextExtractorOptions untuk mengatur TextFormattingMode (Pure, atau Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// tambahkan jalur file input ke sumber data
extractorOptions.AddInput(new FileDataSource(inputPath));
// lakukan proses ekstraksi
ResultContainer resultContainer = extractor.Process(extractorOptions);
// ambil teks yang diekstrak dari objek ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Catatan
Objek Documentize.TextExtractorOptions digunakan untuk mengatur Documentize.TextExtractorOptions.TextFormattingMode dan opsi lain untuk operasi ekstraksi teks. Selain itu, ia mewarisi fungsi untuk menambahkan data (file, stream) yang mewakili dokumen PDF input.
Konstruktor
TextExtractorOptions(TextFormattingMode)
Menginisialisasi instance baru dari objek Documentize.TextExtractorOptions untuk mode format teks yang ditentukan.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parameter
formattingMode
TextExtractorOptions.TextFormattingMode: Nilai mode format teks.
TextExtractorOptions()
Menginisialisasi instance baru dari objek Documentize.TextExtractorOptions dengan mode format teks ‘Raw’ (default).
public TextExtractorOptions()
Properti
FormattingMode
Mendapatkan mode format.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Nilai Properti
TextExtractorOptions.TextFormattingMode
OperationName
Mengembalikan nama operasi.
public override string OperationName { get; }
Nilai Properti
Namespace: Documentize Assembly: Documentize.dll