Classe TextExtractor
Informazione
Rappresenta il plugin Documentize.TextExtractor. Usato per estrarre testo da documenti PDF.
public class TextExtractor : PdfExtractor, IDisposable
Ereditarietà
object ← PdfExtractor ← TextExtractor
Implementa
Membri Ereditati
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Esempi
L’esempio dimostra come estrarre il contenuto testuale di un documento PDF.
// creare oggetto TextExtractor per estrarre testo dai contenuti PDF
using (var plugin = new TextExtractor())
{
// creare TextExtractorOptions
var opt = new TextExtractorOptions();
// aggiungere il percorso del file di input
opt.AddInput(new FileDataSource(inputPath));
// eseguire il processo di estrazione
var resultContainer = plugin.Process(opt);
// ottenere il testo estratto dall'oggetto ResultContainer
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Costruttori
TextExtractor()
public TextExtractor()
Namespace: Documentize Assembly: Documentize.dll