Class TextExtractor

Information

Représente le plugin Documentize.TextExtractor. Utilisé pour extraire du texte des documents PDF.

public static class TextExtractor

Héritage

objectTextExtractor

Membres Hérités

Exemples

L’exemple démontre comment extraire le contenu textuel d’un document PDF.

// Créer un objet TextExtractorOptions pour définir les instructions
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Ajouter le chemin du fichier d'entrée
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Effectuer le processus
var results = TextExtractor.Process(options);
// Obtenir le texte extrait de l'objet ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Méthodes

Process(TextExtractorOptions)

Extraire du texte d’un document PDF.

public static ResultContainer Process(TextExtractorOptions options)

Paramètres

Retourne

ResultContainer : Un objet contenant le résultat de l’extraction.

Exceptions

ArgumentException

Si les options ne sont pas définies.

Namespace: Documentize Assembly: Documentize.dll

 Français