Class TextExtractor

情報

Documentize.TextExtractorプラグインを表します。PDF文書からテキストを抽出するために使用されます。

public static class TextExtractor

継承

objectTextExtractor

引き継がれたメンバー

この例は、PDF文書のテキストコンテンツを抽出する方法を示しています。

// 手順を設定するためのTextExtractorOptionsオブジェクトを作成
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 処理を実行
var results = TextExtractor.Process(options);
// ResultContainerオブジェクトから抽出されたテキストを取得
var textExtracted = results.ResultCollection[0].ToString();

メソッド

Process(TextExtractorOptions)

PDF文書からテキストを抽出します。

public static ResultContainer Process(TextExtractorOptions options)

パラメータ

  • options TextExtractorOptions: 操作のための指示を含むオプションオブジェクトです。

戻り値

ResultContainer : 抽出の結果を含むオブジェクトです。

例外

ArgumentException

オプションが設定されていない場合。

Namespace: Documentize Assembly: Documentize.dll

 日本語