Sınıf Metin Çıkarıcı
Bilgi
Documentize.TextExtractor eklentisini temsil eder. PDF belgelerinden metin çıkarmak için kullanılır.
public class TextExtractor : PdfExtractor, IDisposable
Miras
object ←
PdfExtractor ←
TextExtractor
Uygulamalar
Miras Alınan Üyeler
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Örnekler
Örnek, bir PDF belgesinin metin içeriğini nasıl çıkaracağınızı gösterir.
// PDF içeriğindeki metni çıkarmak için TextExtractor nesnesi oluştur
using (var plugin = new TextExtractor())
{
// TextExtractorOptions oluştur
var opt = new TextExtractorOptions();
// girdi dosyası yolunu ekle
opt.AddInput(new FileDataSource(inputPath));
// çıkarım işlemini gerçekleştir
var resultContainer = plugin.Process(opt);
// ResultContainer nesnesinden çıkarılan metni al
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Yapıcılar
TextExtractor()
public TextExtractor()
Namespace: Documentize
Assembly: Documentize.dll