کلاس TextExtractorOptions
نماد گزینههای استخراج متن برای پلاگین Documentize.TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
وراثت
object ← PdfExtractorOptions ← TextExtractorOptions
پیادهسازیها
اعضای وارثتیافته
- PdfExtractorOptions.AddInput(IDataSource),
- PdfExtractorOptions.Inputs,
- PdfExtractorOptions.OperationName,
- object.GetType(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
مثالها
این مثال نشان میدهد که چگونه محتویات متن سند PDF را استخراج کنیم.
// ایجاد شی TextExtractor برای استخراج محتویات PDF
using (TextExtractor extractor = new TextExtractor())
{
// ایجاد شی TextExtractorOptions برای تنظیم TextFormattingMode (خالص یا خام - پیشفرض)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// افزودن مسیری به فایل ورودی به منابع داده
extractorOptions.AddInput(new FileDataSource(inputPath));
// انجام فرایند استخراج
ResultContainer resultContainer = extractor.Process(extractorOptions);
// دریافت متن استخراجشده از شی ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
توضیحات
شی Documentize.TextExtractorOptions برای تنظیم Documentize.TextExtractorOptions.TextFormattingMode و گزینههای دیگر برای عملیات استخراج متن استفاده میشود. همچنین، عملکردهایی برای افزودن دادهها (فایلها، جریانها) که نمایانگر اسناد PDF ورودی هستند، به ارث میبرد.
سازندهها
TextExtractorOptions(TextFormattingMode)
یک نمونه جدید از شی Documentize.TextExtractorOptions را برای حالت فرمت متن مشخص شده، راهاندازی میکند.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
پارامترها
formattingMode
TextExtractorOptions.TextFormattingMode: مقدار حالت فرمت متن.
TextExtractorOptions()
یک نمونه جدید از شی Documentize.TextExtractorOptions را با حالت فرمت متن ‘خام’ (پیشفرض) راهاندازی میکند.
public TextExtractorOptions()
خواص
FormattingMode
حالت فرمت را دریافت میکند.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
مقدار خاصیت
TextExtractorOptions.TextFormattingMode
OperationName
نام عملیات را برمیگرداند.
public override string OperationName { get; }
مقدار خاصیت
فضا نام: Documentize کتابخانه: Documentize.dll