Class TextExtractor

Info

Mewakili plugin Documentize.TextExtractor. Digunakan untuk mengekstrak teks dari dokumen PDF.

public static class TextExtractor

Inheritance

objectTextExtractor

Inherited Members

Examples

Contoh ini menunjukkan cara mengekstrak konten teks dari dokumen PDF.

// Buat objek TextExtractorOptions untuk mengatur instruksi
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Lakukan proses
var results = TextExtractor.Process(options);
// Ambil teks yang diekstrak dari objek ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Methods

Process(TextExtractorOptions)

Ekstrak teks dari dokumen PDF.

public static ResultContainer Process(TextExtractorOptions options)

Parameters

Returns

ResultContainer : Sebuah objek yang berisi hasil ekstraksi.

Exceptions

ArgumentException

Jika opsi tidak diatur.

Namespace: Documentize Assembly: Documentize.dll

 Indonesia