Класс TextExtractor
Информация
Представляет плагин Documentize.TextExtractor. Используется для извлечения текста из PDF-документов.
public class TextExtractor : PdfExtractor, IDisposable
Наследование
object ← PdfExtractor ← TextExtractor
Реализует
Унаследованные члены
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Примеры
Пример демонстрирует, как извлечь текстовое содержимое PDF-документа.
// create TextExtractor object to extract text in PDF contents
using (var plugin = new TextExtractor())
{
// create TextExtractorOptions
var opt = new TextExtractorOptions();
// add input file path
opt.AddInput(new FileDataSource(inputPath));
// perform extraction process
var resultContainer = plugin.Process(opt);
// get the extracted text from the ResultContainer object
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Конструкторы
TextExtractor()
public TextExtractor()
Пространство имен: Documentize Сборка: Documentize.dll