Sınıf TextExtractorOptions
Documentize.TextExtractor eklentisi için metin çıkarma seçeneklerini temsil eder.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Inheritance
object ←
PdfExtractorOptions ←
TextExtractorOptions
Implements
Inherited Members
- PdfExtractorOptions.AddInput(IDataSource),
- PdfExtractorOptions.Inputs,
- PdfExtractorOptions.OperationName,
- object.GetType(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Examples
Örnek, PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.
// PDF içeriklerini çıkarmak için TextExtractor nesnesi oluştur
using (TextExtractor extractor = new TextExtractor())
{
// Metin Biçimlendirme Modunu (Saf, veya Ham - varsayılan) ayarlamak için TextExtractorOptions nesnesi oluştur
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// veri kaynaklarına girdi dosyası yolunu ekle
extractorOptions.AddInput(new FileDataSource(inputPath));
// çıkarım işlemini gerçekleştirin
ResultContainer resultContainer = extractor.Process(extractorOptions);
// ResultContainer nesnesinden çıkarılan metni al
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarks
Documentize.TextExtractorOptions nesnesi, Documentize.TextExtractorOptions.TextFormattingMode ve metin çıkarma işlemi için diğer seçenekleri ayarlamak için kullanılır.
Ayrıca, girdi PDF belgelerini temsil eden verileri (dosyalar, akışlar) ekleme işlevlerini miras alır.
Constructors
TextExtractorOptions(TextFormattingMode)
Belirtilen metin biçimlendirme modu için yeni bir Documentize.TextExtractorOptions nesnesi başlatır.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parameters
formattingMode
TextExtractorOptions.TextFormattingMode: Metin biçimlendirme modu değeri.
TextExtractorOptions()
‘Raw’ (varsayılan) metin biçimlendirme moduyla yeni bir Documentize.TextExtractorOptions nesnesi başlatır.
public TextExtractorOptions()
Properties
FormattingMode
Biçimlendirme modunu alır.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Property Value
TextExtractorOptions.TextFormattingMode
OperationName
İşlemin adını döndürür.
public override string OperationName { get; }
Property Value
Namespace: Documentize
Assembly: Documentize.dll