Classe TextExtractor

Information

Représente le plugin Documentize.TextExtractor. Utilisé pour extraire du texte des documents PDF.

public class TextExtractor : PdfExtractor, IDisposable  

Héritage

object
PdfExtractor
TextExtractor

Implémente

Membres hérités

Exemples

L’exemple démontre comment extraire le contenu texte d’un document PDF.

// créer un objet TextExtractor pour extraire le texte dans le contenu PDF  
using (var plugin = new TextExtractor())  
{  
    // créer TextExtractorOptions  
    var opt = new TextExtractorOptions();  

    // ajouter le chemin du fichier d'entrée  
    opt.AddInput(new FileDataSource(inputPath));  

    // effectuer le processus d'extraction  
    var resultContainer = plugin.Process(opt);  

    // obtenir le texte extrait de l'objet ResultContainer  
    var textExtracted = resultContainer.ResultCollection[0].ToString();  
}  

Constructeurs

TextExtractor()

public TextExtractor()  

Namespace: Documentize
Assembly: Documentize.dll

 Français