Classe TextExtractor

Informazione

Rappresenta il plugin Documentize.TextExtractor. Usato per estrarre testo da documenti PDF.

public class TextExtractor : PdfExtractor, IDisposable

Ereditarietà

objectPdfExtractorTextExtractor

Implementa

Membri Ereditati

Esempi

L’esempio dimostra come estrarre il contenuto testuale di un documento PDF.

// creare oggetto TextExtractor per estrarre testo dai contenuti PDF
using (var plugin = new TextExtractor())
{
    // creare TextExtractorOptions
    var opt = new TextExtractorOptions();

    // aggiungere il percorso del file di input
    opt.AddInput(new FileDataSource(inputPath));

    // eseguire il processo di estrazione
    var resultContainer = plugin.Process(opt);

    // ottenere il testo estratto dall'oggetto ResultContainer
    var textExtracted = resultContainer.ResultCollection[0].ToString();
}

Costruttori

TextExtractor()

public TextExtractor()

Namespace: Documentize Assembly: Documentize.dll

 Italiano