Klasse TextExtractor

Info

Stellt das Documentize.TextExtractor-Plugin dar. Wird verwendet, um Text aus PDF-Dokumenten zu extrahieren.

public class TextExtractor : PdfExtractor, IDisposable

Vererbung

object ← PdfExtractor ← TextExtractor

Implementiert

IDisposable

Vererbte Mitglieder

Beispiele

Das Beispiel zeigt, wie man den Textinhalt eines PDF-Dokuments extrahiert.

// Erstellen Sie ein TextExtractor-Objekt, um Text aus PDF-Inhalten zu extrahieren
using (var plugin = new TextExtractor())
{
    // Erstellen Sie TextExtractorOptions
    var opt = new TextExtractorOptions();

    // Fügen Sie den Pfad zur Eingabedatei hinzu
    opt.AddInput(new FileDataSource(inputPath));

    // Führen Sie den Extraktionsprozess durch
    var resultContainer = plugin.Process(opt);

    // Holen Sie sich den extrahierten Text aus dem ResultContainer-Objekt
    var textExtracted = resultContainer.ResultCollection[0].ToString();
}

Konstruktoren

TextExtractor()

public TextExtractor()

Namespace: Documentize Assembly: Documentize.dll