Class TextExtractor

معلومات

يمثل مكون Documentize.TextExtractor. يُستخدم لاستخراج النص من مستندات PDF.

public static class TextExtractor

الوراثة

objectTextExtractor

الأعضاء الموروثة

أمثلة

يوضح المثال كيفية استخراج محتوى النص من مستند PDF.

// إنشاء كائن TextExtractorOptions لتحديد التعليمات
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// إضافة مسار الملف المدخل
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// تنفيذ العملية
var results = TextExtractor.Process(options);
// الحصول على النص المستخرج من كائن ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

الطرق

Process(TextExtractorOptions)

استخراج النص من مستند PDF.

public static ResultContainer Process(TextExtractorOptions options)

المعلمات

  • options TextExtractorOptions: كائن خيارات يحتوي على تعليمات العملية.

العائدات

ResultContainer : كائن يحتوي على نتيجة الاستخراج.

الاستثناءات

ArgumentException

إذا لم يتم تعيين الخيارات.

Namespace: Documentize Assembly: Documentize.dll

 عربي