Κλάση PdfExtractor
Info
Αντιπροσωπεύει τη βασική λειτουργικότητα για την εξαγωγή κειμένου, εικόνων και άλλων τύπων περιεχομένου που μπορεί να εμφανίζονται στις σελίδες εγγράφων PDF.
public abstract class PdfExtractor : IDisposable
Κληρονομιά
Παράγωγες
Υλοποιεί
Κληρονομούμενα Μέλη
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Παραδείγματα
Το παράδειγμα δείχνει πώς να εξάγετε το κειμενικό περιεχόμενο ενός εγγράφου PDF.
// δημιουργία αντικειμένου TextExtractor για την εξαγωγή περιεχομένου PDF
using (TextExtractor extractor = new TextExtractor())
{
// δημιουργία αντικειμένου TextExtractorOptions για ρύθμιση οδηγιών
textExtractorOptions = new TextExtractorOptions();
// προσθήκη διαδρομής εισόδου
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// εκτέλεση διαδικασίας εξαγωγής
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// λήψη του εξαγόμενου κειμένου από το αντικείμενο ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Παρατηρήσεις
Το αντικείμενο Documentize.TextExtractor χρησιμοποιείται για την εξαγωγή κειμένου, ή το Documentize.ImageExtractor για την εξαγωγή εικόνων.
Κατασκευαστές
PdfExtractor()
protected PdfExtractor()
Μέθοδοι
Dispose()
Υλοποίηση του IDisposable. Στην πραγματικότητα, δεν είναι απαραίτητο για το PdfExtractor.
public void Dispose()
Process(IPluginOptions)
Αρχίζει τη διαδικασία PdfExtractor με τις καθορισμένες παραμέτρους.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Παράμετροι
pdfExtractorOptions
IPluginOptions: Ένα αντικείμενο επιλογών που περιέχει οδηγίες για το PdfExtractor.
Επιστρέφει
ResultContainer : Ένα αντικείμενο ResultContainer που περιέχει το αποτέλεσμα της εξαγωγής.
Namespace: Documentize
Assembly: Documentize.dll