Klasse TextExtractor
Info
Stellt das Documentize.TextExtractor-Plugin dar. Wird verwendet, um Text aus PDF-Dokumenten zu extrahieren.
public class TextExtractor : PdfExtractor, IDisposable
Vererbung
object ← PdfExtractor ← TextExtractor
Implementiert
Vererbte Mitglieder
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Beispiele
Das Beispiel zeigt, wie man den Textinhalt eines PDF-Dokuments extrahiert.
// Erstellen Sie ein TextExtractor-Objekt, um Text aus PDF-Inhalten zu extrahieren
using (var plugin = new TextExtractor())
{
// Erstellen Sie TextExtractorOptions
var opt = new TextExtractorOptions();
// Fügen Sie den Pfad zur Eingabedatei hinzu
opt.AddInput(new FileDataSource(inputPath));
// Führen Sie den Extraktionsprozess durch
var resultContainer = plugin.Process(opt);
// Holen Sie sich den extrahierten Text aus dem ResultContainer-Objekt
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Konstruktoren
TextExtractor()
public TextExtractor()
Namespace: Documentize Assembly: Documentize.dll