Класс TextExtractor

Информация

Представляет плагин Documentize.TextExtractor. Используется для извлечения текста из PDF-документов.

public class TextExtractor : PdfExtractor, IDisposable

Наследование

objectPdfExtractorTextExtractor

Реализует

Унаследованные члены

Примеры

Пример демонстрирует, как извлечь текстовое содержимое PDF-документа.

// create TextExtractor object to extract text in PDF contents
using (var plugin = new TextExtractor())
{
    // create TextExtractorOptions
    var opt = new TextExtractorOptions();

    // add input file path
    opt.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    var resultContainer = plugin.Process(opt);

    // get the extracted text from the ResultContainer object
    var textExtracted = resultContainer.ResultCollection[0].ToString();
}

Конструкторы

TextExtractor()

public TextExtractor()

Пространство имен: Documentize Сборка: Documentize.dll

 Русский