Extractor de Texto de Clase
Información
Representa el complemento Documentize.TextExtractor. Se utiliza para extraer texto de documentos PDF.
public class TextExtractor : PdfExtractor, IDisposable
Herencia
object ← PdfExtractor ← TextExtractor
Implementa
Miembros heredados
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Ejemplos
El ejemplo demuestra cómo extraer el contenido textual de un documento PDF.
// crear objeto TextExtractor para extraer texto en contenidos PDF
using (var plugin = new TextExtractor())
{
// crear TextExtractorOptions
var opt = new TextExtractorOptions();
// agregar ruta del archivo de entrada
opt.AddInput(new FileDataSource(inputPath));
// realizar el proceso de extracción
var resultContainer = plugin.Process(opt);
// obtener el texto extraído del objeto ResultContainer
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Constructores
TextExtractor()
public TextExtractor()
Namespace: Documentize Assembly: Documentize.dll