クラス テキストエクストラクター

情報

Documentize.TextExtractor プラグインを表します。PDF ドキュメントからテキストを抽出するために使用されます。

public class TextExtractor : PdfExtractor, IDisposable

継承

objectPdfExtractorTextExtractor

実装

継承メンバー

この例は、PDF ドキュメントのテキストコンテンツを抽出する方法を示しています。

// create TextExtractor object to extract text in PDF contents
using (var plugin = new TextExtractor())
{
    // create TextExtractorOptions
    var opt = new TextExtractorOptions();

    // add input file path
    opt.AddInput(new FileDataSource(inputPath));

    // perform extraction process
    var resultContainer = plugin.Process(opt);

    // get the extracted text from the ResultContainer object
    var textExtracted = resultContainer.ResultCollection[0].ToString();
}

コンストラクター

TextExtractor()

public TextExtractor()

Namespace: Documentize Assembly: Documentize.dll

 日本語