Extractor de Texto de Clase

Información

Representa el complemento Documentize.TextExtractor. Se utiliza para extraer texto de documentos PDF.

public class TextExtractor : PdfExtractor, IDisposable

Herencia

objectPdfExtractorTextExtractor

Implementa

Miembros heredados

Ejemplos

El ejemplo demuestra cómo extraer el contenido textual de un documento PDF.

// crear objeto TextExtractor para extraer texto en contenidos PDF
using (var plugin = new TextExtractor())
{
    // crear TextExtractorOptions
    var opt = new TextExtractorOptions();

    // agregar ruta del archivo de entrada
    opt.AddInput(new FileDataSource(inputPath));

    // realizar el proceso de extracción
    var resultContainer = plugin.Process(opt);

    // obtener el texto extraído del objeto ResultContainer
    var textExtracted = resultContainer.ResultCollection[0].ToString();
}

Constructores

TextExtractor()

public TextExtractor()

Namespace: Documentize Assembly: Documentize.dll

 Español