Klass TextExtractor

Info

Representerar Documentize.TextExtractor-plugin. Används för att extrahera text från PDF-dokument.

public class TextExtractor : PdfExtractor, IDisposable

Arv

objectPdfExtractorTextExtractor

Implementerar

Arvda medlemmar

Exempel

Exemplet demonstrerar hur man extraherar textinnehållet från ett PDF-dokument.

// skapa TextExtractor-objekt för att extrahera text i PDF-innehåll
using (var plugin = new TextExtractor())
{
    // skapa TextExtractorOptions
    var opt = new TextExtractorOptions();

    // lägg till sökväg för indatafil
    opt.AddInput(new FileDataSource(inputPath));

    // utför extraktionsprocess
    var resultContainer = plugin.Process(opt);

    // hämta den extraherade texten från ResultContainer-objektet
    var textExtracted = resultContainer.ResultCollection[0].ToString();
}

Konstruktorer

TextExtractor()

public TextExtractor()

Namespace: Documentize Assembly: Documentize.dll

 Svenska