Classe TextExtractor
Informação
Representa o plugin Documentize.TextExtractor. Usado para extrair texto de documentos PDF.
public class TextExtractor : PdfExtractor, IDisposable
Herança
object ←
PdfExtractor ←
TextExtractor
Implementa
Membros Herdados
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Exemplos
O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.
// criar objeto TextExtractor para extrair texto em conteúdos PDF
using (var plugin = new TextExtractor())
{
// criar TextExtractorOptions
var opt = new TextExtractorOptions();
// adicionar caminho do arquivo de entrada
opt.AddInput(new FileDataSource(inputPath));
// realizar o processo de extração
var resultContainer = plugin.Process(opt);
// obter o texto extraído do objeto ResultContainer
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Construtores
TextExtractor()
public TextExtractor()
Namespace: Documentize
Assembly: Documentize.dll