کلاس TextExtractorOptions

Info

نماد گزینه‌های استخراج متن برای پلاگین Documentize.TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

وراثت

objectPdfExtractorOptionsTextExtractorOptions

پیاده‌سازی‌ها

اعضای وارثت‌یافته

مثال‌ها

این مثال نشان می‌دهد که چگونه محتویات متن سند PDF را استخراج کنیم.

// ایجاد شی TextExtractor برای استخراج محتویات PDF
using (TextExtractor extractor = new TextExtractor())
{
    // ایجاد شی TextExtractorOptions برای تنظیم TextFormattingMode (خالص یا خام - پیش‌فرض)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // افزودن مسیری به فایل ورودی به منابع داده
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // انجام فرایند استخراج
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // دریافت متن استخراج‌شده از شی ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

توضیحات

شی Documentize.TextExtractorOptions برای تنظیم Documentize.TextExtractorOptions.TextFormattingMode و گزینه‌های دیگر برای عملیات استخراج متن استفاده می‌شود. همچنین، عملکردهایی برای افزودن داده‌ها (فایل‌ها، جریان‌ها) که نمایانگر اسناد PDF ورودی هستند، به ارث می‌برد.

سازنده‌ها

TextExtractorOptions(TextFormattingMode)

یک نمونه جدید از شی Documentize.TextExtractorOptions را برای حالت فرمت متن مشخص شده، راه‌اندازی می‌کند.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

پارامترها

TextExtractorOptions()

یک نمونه جدید از شی Documentize.TextExtractorOptions را با حالت فرمت متن ‘خام’ (پیش‌فرض) راه‌اندازی می‌کند.

public TextExtractorOptions()

خواص

FormattingMode

حالت فرمت را دریافت می‌کند.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

مقدار خاصیت

TextExtractorOptions.TextFormattingMode

OperationName

نام عملیات را برمی‌گرداند.

public override string OperationName { get; }

مقدار خاصیت

string

فضا نام: Documentize کتابخانه: Documentize.dll

 فارسی