مستخرج النص فئة
معلومات
يمثل ملحق Documentize.TextExtractor. يُستخدم لاستخراج النص من مستندات PDF.
public class TextExtractor : PdfExtractor, IDisposable
الوراثة
object ←
PdfExtractor ←
TextExtractor
ينفذ
الأعضاء الموروثة
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
أمثلة
المثال يوضح كيفية استخراج محتوى النص من مستند PDF.
// إنشاء كائن TextExtractor لاستخراج النص في محتويات PDF
using (var plugin = new TextExtractor())
{
// إنشاء TextExtractorOptions
var opt = new TextExtractorOptions();
// إضافة مسار الملف الإدخالي
opt.AddInput(new FileDataSource(inputPath));
// تنفيذ عملية الاستخراج
var resultContainer = plugin.Process(opt);
// الحصول على النص المُستخرج من كائن ResultContainer
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
المُنشئات
TextExtractor()
public TextExtractor()
المساحة الاسمية: Documentize
Assembly: Documentize.dll