Class TextExtractor
Information
Représente le plugin Documentize.TextExtractor. Utilisé pour extraire du texte des documents PDF.
public static class TextExtractor
Héritage
Membres Hérités
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Exemples
L’exemple démontre comment extraire le contenu textuel d’un document PDF.
// Créer un objet TextExtractorOptions pour définir les instructions
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Ajouter le chemin du fichier d'entrée
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Effectuer le processus
var results = TextExtractor.Process(options);
// Obtenir le texte extrait de l'objet ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
Méthodes
Process(TextExtractorOptions)
Extraire du texte d’un document PDF.
public static ResultContainer Process(TextExtractorOptions options)
Paramètres
options
TextExtractorOptions: Un objet d’options contenant des instructions pour l’opération.
Retourne
ResultContainer : Un objet contenant le résultat de l’extraction.
Exceptions
Si les options ne sont pas définies.
Namespace: Documentize Assembly: Documentize.dll