Κλάση PdfExtractor

Info

Αντιπροσωπεύει τη βασική λειτουργικότητα για την εξαγωγή κειμένου, εικόνων και άλλων τύπων περιεχομένου που μπορεί να εμφανίζονται στις σελίδες εγγράφων PDF.

public abstract class PdfExtractor : IDisposable

Κληρονομιά

object ←
PdfExtractor

Παράγωγες

Υλοποιεί

IDisposable

Κληρονομούμενα Μέλη

Παραδείγματα

Το παράδειγμα δείχνει πώς να εξάγετε το κειμενικό περιεχόμενο ενός εγγράφου PDF.

// δημιουργία αντικειμένου TextExtractor για την εξαγωγή περιεχομένου PDF  
using (TextExtractor extractor = new TextExtractor())  
{  
    // δημιουργία αντικειμένου TextExtractorOptions για ρύθμιση οδηγιών  
    textExtractorOptions = new TextExtractorOptions();  

    // προσθήκη διαδρομής εισόδου  
    textExtractorOptions.AddInput(new FileDataSource(inputPath));  

    // εκτέλεση διαδικασίας εξαγωγής  
    ResultContainer resultContainer = extractor.Process(textExtractorOptions);  

    // λήψη του εξαγόμενου κειμένου από το αντικείμενο ResultContainer  
    string textExtracted = resultContainer.ResultCollection[0].ToString();  
}

Παρατηρήσεις

Το αντικείμενο Documentize.TextExtractor χρησιμοποιείται για την εξαγωγή κειμένου, ή το Documentize.ImageExtractor για την εξαγωγή εικόνων.

Κατασκευαστές

PdfExtractor()

protected PdfExtractor()

Μέθοδοι

Dispose()

Υλοποίηση του IDisposable. Στην πραγματικότητα, δεν είναι απαραίτητο για το PdfExtractor.

public void Dispose()

Process(IPluginOptions)

Αρχίζει τη διαδικασία PdfExtractor με τις καθορισμένες παραμέτρους.

public ResultContainer Process(IPluginOptions pdfExtractorOptions)

Παράμετροι

pdfExtractorOptions IPluginOptions: Ένα αντικείμενο επιλογών που περιέχει οδηγίες για το PdfExtractor.

Επιστρέφει

ResultContainer : Ένα αντικείμενο ResultContainer που περιέχει το αποτέλεσμα της εξαγωγής.

Namespace: Documentize
Assembly: Documentize.dll