Sınıf TextExtractorOptions

Bilgi

Documentize.TextExtractor eklentisi için metin çıkarma seçeneklerini temsil eder.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions  

Inheritance

object
PdfExtractorOptions
TextExtractorOptions

Implements

Inherited Members

Examples

Örnek, PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.

// PDF içeriklerini çıkarmak için TextExtractor nesnesi oluştur  
using (TextExtractor extractor = new TextExtractor())  
{  
    // Metin Biçimlendirme Modunu (Saf, veya Ham - varsayılan) ayarlamak için TextExtractorOptions nesnesi oluştur  
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);  

    // veri kaynaklarına girdi dosyası yolunu ekle  
    extractorOptions.AddInput(new FileDataSource(inputPath));  

    // çıkarım işlemini gerçekleştirin  
    ResultContainer resultContainer = extractor.Process(extractorOptions);  

    // ResultContainer nesnesinden çıkarılan metni al  
    string textExtracted = resultContainer.ResultCollection[0].ToString();  
}  

Remarks

Documentize.TextExtractorOptions nesnesi, Documentize.TextExtractorOptions.TextFormattingMode ve metin çıkarma işlemi için diğer seçenekleri ayarlamak için kullanılır.
Ayrıca, girdi PDF belgelerini temsil eden verileri (dosyalar, akışlar) ekleme işlevlerini miras alır.

Constructors

TextExtractorOptions(TextFormattingMode)

Belirtilen metin biçimlendirme modu için yeni bir Documentize.TextExtractorOptions nesnesi başlatır.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)  

Parameters

TextExtractorOptions()

‘Raw’ (varsayılan) metin biçimlendirme moduyla yeni bir Documentize.TextExtractorOptions nesnesi başlatır.

public TextExtractorOptions()  

Properties

FormattingMode

Biçimlendirme modunu alır.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }  

Property Value

TextExtractorOptions.TextFormattingMode

OperationName

İşlemin adını döndürür.

public override string OperationName { get; }  

Property Value

string

Namespace: Documentize
Assembly: Documentize.dll

 Türkçe