Klass TextExtractor
Info
Representerar Documentize.TextExtractor-plugin. Används för att extrahera text från PDF-dokument.
public class TextExtractor : PdfExtractor, IDisposable
Arv
object ← PdfExtractor ← TextExtractor
Implementerar
Arvda medlemmar
- PdfExtractor.Process(IPluginOptions),
- PdfExtractor.Dispose(),
- object.GetType(),
- object.MemberwiseClone(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Exempel
Exemplet demonstrerar hur man extraherar textinnehållet från ett PDF-dokument.
// skapa TextExtractor-objekt för att extrahera text i PDF-innehåll
using (var plugin = new TextExtractor())
{
// skapa TextExtractorOptions
var opt = new TextExtractorOptions();
// lägg till sökväg för indatafil
opt.AddInput(new FileDataSource(inputPath));
// utför extraktionsprocess
var resultContainer = plugin.Process(opt);
// hämta den extraherade texten från ResultContainer-objektet
var textExtracted = resultContainer.ResultCollection[0].ToString();
}
Konstruktorer
TextExtractor()
public TextExtractor()
Namespace: Documentize Assembly: Documentize.dll