Classe TextExtractor
Information
Représente le plugin Documentize.TextExtractor. Utilisé pour extraire du texte des documents PDF.
public class TextExtractor : PdfExtractor, IDisposable
Héritage
object ←
PdfExtractor ←
TextExtractor
Implémente
Membres hérités
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Exemples
L’exemple démontre comment extraire le contenu texte d’un document PDF.
// créer un objet TextExtractor pour extraire le texte dans le contenu PDF
using (var plugin = new TextExtractor())
{
// créer TextExtractorOptions
var opt = new TextExtractorOptions();
// ajouter le chemin du fichier d'entrée
opt.AddInput(new FileDataSource(inputPath));
// effectuer le processus d'extraction
var resultContainer = plugin.Process(opt);
// obtenir le texte extrait de l'objet ResultContainer
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Constructeurs
TextExtractor()
public TextExtractor()
Namespace: Documentize
Assembly: Documentize.dll