Class TextExtractor
情報
Documentize.TextExtractorプラグインを表します。PDF文書からテキストを抽出するために使用されます。
public static class TextExtractor
継承
引き継がれたメンバー
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
例
この例は、PDF文書のテキストコンテンツを抽出する方法を示しています。
// 手順を設定するためのTextExtractorOptionsオブジェクトを作成
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 処理を実行
var results = TextExtractor.Process(options);
// ResultContainerオブジェクトから抽出されたテキストを取得
var textExtracted = results.ResultCollection[0].ToString();
メソッド
Process(TextExtractorOptions)
PDF文書からテキストを抽出します。
public static ResultContainer Process(TextExtractorOptions options)
パラメータ
options
TextExtractorOptions: 操作のための指示を含むオプションオブジェクトです。
戻り値
ResultContainer : 抽出の結果を含むオブジェクトです。
例外
オプションが設定されていない場合。
Namespace: Documentize Assembly: Documentize.dll