Classe TextExtractor

Informação

Representa o plugin Documentize.TextExtractor. Usado para extrair texto de documentos PDF.

public class TextExtractor : PdfExtractor, IDisposable  

Herança

object
PdfExtractor
TextExtractor

Implementa

Membros Herdados

Exemplos

O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.

// criar objeto TextExtractor para extrair texto em conteúdos PDF  
using (var plugin = new TextExtractor())  
{  
    // criar TextExtractorOptions  
    var opt = new TextExtractorOptions();  
  
    // adicionar caminho do arquivo de entrada  
    opt.AddInput(new FileDataSource(inputPath));  
  
    // realizar o processo de extração  
    var resultContainer = plugin.Process(opt);  
  
    // obter o texto extraído do objeto ResultContainer  
    var textExtracted = resultContainer.ResultCollection[0].ToString();  
}  

Construtores

TextExtractor()

public TextExtractor()  

Namespace: Documentize
Assembly: Documentize.dll

 Português