Klasa TextExtractor
Info
Reprezentuje wtyczkę Documentize.TextExtractor. Używana do ekstrakcji tekstu z dokumentów PDF.
public class TextExtractor : PdfExtractor, IDisposable
Dziedziczenie
object ←
PdfExtractor ←
TextExtractor
Implementuje
Członkowie dziedziczeni
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Przykłady
Przykład demonstruje sposób ekstrakcji treści tekstowej dokumentu PDF.
// utwórz obiekt TextExtractor do ekstrakcji tekstu w zawartości PDF
using (var plugin = new TextExtractor())
{
// utwórz TextExtractorOptions
var opt = new TextExtractorOptions();
// dodaj ścieżkę do pliku wejściowego
opt.AddInput(new FileDataSource(inputPath));
// przeprowadź proces ekstrakcji
var resultContainer = plugin.Process(opt);
// uzyskaj wyekstrahowany tekst z obiektu ResultContainer
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Konstruktory
TextExtractor()
public TextExtractor()
Namespace: Documentize
Assembly: Documentize.dll