Class TextExtractor

Informação

Representa o plugin Documentize.TextExtractor. Usado para extrair texto de documentos PDF.

public static class TextExtractor

Herança

objectTextExtractor

Membros Herdados

Exemplos

O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.

// Criar objeto TextExtractorOptions para definir instruções
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Adicionar caminho do arquivo de entrada
options.AddInput(new FileDataSource("caminho_para_seu_arquivo_pdf.pdf"));
// Realizar o processo
var results = TextExtractor.Process(options);
// Obter o texto extraído do objeto ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Métodos

Process(TextExtractorOptions)

Extrair texto de documento PDF.

public static ResultContainer Process(TextExtractorOptions options)

Parâmetros

Retorna

ResultContainer : Um objeto contendo o resultado da extração.

Exceções

ArgumentException

Se as opções não estiverem definidas.

Namespace: Documentize Assembly: Documentize.dll

 Português