Class TextExtractor
معلومات
يمثل مكون Documentize.TextExtractor. يُستخدم لاستخراج النص من مستندات PDF.
public static class TextExtractor
الوراثة
الأعضاء الموروثة
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
أمثلة
يوضح المثال كيفية استخراج محتوى النص من مستند PDF.
// إنشاء كائن TextExtractorOptions لتحديد التعليمات
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// إضافة مسار الملف المدخل
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// تنفيذ العملية
var results = TextExtractor.Process(options);
// الحصول على النص المستخرج من كائن ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
الطرق
Process(TextExtractorOptions)
استخراج النص من مستند PDF.
public static ResultContainer Process(TextExtractorOptions options)
المعلمات
options
TextExtractorOptions: كائن خيارات يحتوي على تعليمات العملية.
العائدات
ResultContainer : كائن يحتوي على نتيجة الاستخراج.
الاستثناءات
إذا لم يتم تعيين الخيارات.
Namespace: Documentize Assembly: Documentize.dll