类 TextExtractor

信息

表示 Documentize.TextExtractor 插件。用于从 PDF 文档中提取文本。

public class TextExtractor : PdfExtractor, IDisposable

继承

objectPdfExtractorTextExtractor

实现

继承成员

示例

这个示例演示了如何提取 PDF 文档的文本内容。

// 创建 TextExtractor 对象以提取 PDF 内容中的文本
using (var plugin = new TextExtractor())
{
    // 创建 TextExtractorOptions
    var opt = new TextExtractorOptions();

    // 添加输入文件路径
    opt.AddInput(new FileDataSource(inputPath));

    // 执行提取过程
    var resultContainer = plugin.Process(opt);

    // 从 ResultContainer 对象获取提取的文本
    var textExtracted = resultContainer.ResultCollection[0].ToString();
}

构造函数

TextExtractor()

public TextExtractor()

命名空间: Documentize 程序集: Documentize.dll

 中文