类 TextExtractor
信息
表示 Documentize.TextExtractor 插件。用于从 PDF 文档中提取文本。
public class TextExtractor : PdfExtractor, IDisposable
继承
object ← PdfExtractor ← TextExtractor
实现
继承成员
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
示例
这个示例演示了如何提取 PDF 文档的文本内容。
// 创建 TextExtractor 对象以提取 PDF 内容中的文本
using (var plugin = new TextExtractor())
{
// 创建 TextExtractorOptions
var opt = new TextExtractorOptions();
// 添加输入文件路径
opt.AddInput(new FileDataSource(inputPath));
// 执行提取过程
var resultContainer = plugin.Process(opt);
// 从 ResultContainer 对象获取提取的文本
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
构造函数
TextExtractor()
public TextExtractor()
命名空间: Documentize 程序集: Documentize.dll