클래스 텍스트 추출기
참고
Documentize.TextExtractor 플러그인을 나타냅니다. PDF 문서에서 텍스트를 추출하는 데 사용됩니다.
public class TextExtractor : PdfExtractor, IDisposable
상속
object ←
PdfExtractor ←
TextExtractor
구현
상속된 멤버
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
예시
이 예시는 PDF 문서의 텍스트 내용을 추출하는 방법을 보여줍니다.
// PDF 내용에서 텍스트를 추출하기 위해 TextExtractor 객체를 생성합니다.
using (var plugin = new TextExtractor())
{
// TextExtractorOptions 생성
var opt = new TextExtractorOptions();
// 입력 파일 경로 추가
opt.AddInput(new FileDataSource(inputPath));
// 추출 프로세스 수행
var resultContainer = plugin.Process(opt);
// ResultContainer 객체에서 추출된 텍스트 가져오기
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
생성자
TextExtractor()
public TextExtractor()
네임스페이스: Documentize
어셈블리: Documentize.dll