Class TextExtractor
Información
Representa el plugin Documentize.TextExtractor. Se utiliza para extraer texto de documentos PDF.
public static class TextExtractor
Herencia
Miembros heredados
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Ejemplos
El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.
// Crear objeto TextExtractorOptions para establecer instrucciones
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Realizar el proceso
var results = TextExtractor.Process(options);
// Obtener el texto extraído del objeto ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
Métodos
Process(TextExtractorOptions)
Extraer texto de un documento PDF.
public static ResultContainer Process(TextExtractorOptions options)
Parámetros
options
TextExtractorOptions: Un objeto de opciones que contiene instrucciones para la operación.
Retorna
ResultContainer : Un objeto que contiene el resultado de la extracción.
Excepciones
Si las opciones no están configuradas.
Namespace: Documentize Assembly: Documentize.dll