Klasa TextExtractor

Info

Reprezentuje wtyczkę Documentize.TextExtractor. Używana do ekstrakcji tekstu z dokumentów PDF.

public class TextExtractor : PdfExtractor, IDisposable  

Dziedziczenie

object
PdfExtractor
TextExtractor

Implementuje

Członkowie dziedziczeni

Przykłady

Przykład demonstruje sposób ekstrakcji treści tekstowej dokumentu PDF.

// utwórz obiekt TextExtractor do ekstrakcji tekstu w zawartości PDF  
using (var plugin = new TextExtractor())  
{  
    // utwórz TextExtractorOptions  
    var opt = new TextExtractorOptions();  

    // dodaj ścieżkę do pliku wejściowego  
    opt.AddInput(new FileDataSource(inputPath));  

    // przeprowadź proces ekstrakcji  
    var resultContainer = plugin.Process(opt);  

    // uzyskaj wyekstrahowany tekst z obiektu ResultContainer  
    var textExtracted = resultContainer.ResultCollection[0].ToString();  
}  

Konstruktory

TextExtractor()

public TextExtractor()  

Namespace: Documentize
Assembly: Documentize.dll

 Polski