Opzioni TextExtractor della Classe
Rappresenta le opzioni di estrazione del testo per il plugin Documentize.TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Ereditarietà
object ← PdfExtractorOptions ← TextExtractorOptions
Implementa
Membri Ereditati
- PdfExtractorOptions.AddInput(IDataSource),
- PdfExtractorOptions.Inputs,
- PdfExtractorOptions.OperationName,
- object.GetType(),
- object.ToString(),
- object.Equals(object?),
- object.Equals(object?, object?),
- object.ReferenceEquals(object?, object?),
- object.GetHashCode()
Esempi
L’esempio dimostra come estrarre il contenuto di testo di un documento PDF.
// creare un oggetto TextExtractor per estrarre i contenuti PDF
using (TextExtractor extractor = new TextExtractor())
{
// creare un oggetto TextExtractorOptions per impostare TextFormattingMode (Puro, o Raw - predefinito)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// aggiungere il percorso del file di input alle sorgenti di dati
extractorOptions.AddInput(new FileDataSource(inputPath));
// eseguire il processo di estrazione
ResultContainer resultContainer = extractor.Process(extractorOptions);
// ottenere il testo estratto dall'oggetto ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Osservazioni
L’oggetto Documentize.TextExtractorOptions viene utilizzato per impostare Documentize.TextExtractorOptions.TextFormattingMode e altre opzioni per l’operazione di estrazione del testo. Inoltre, eredita funzioni per aggiungere dati (file, stream) che rappresentano i documenti PDF di input.
Costruttori
TextExtractorOptions(TextFormattingMode)
Inizializza una nuova istanza dell’oggetto Documentize.TextExtractorOptions per la modalità di formattazione del testo specificata.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parametri
formattingMode
TextExtractorOptions.TextFormattingMode: Valore della modalità di formattazione del testo.
TextExtractorOptions()
Inizializza una nuova istanza dell’oggetto Documentize.TextExtractorOptions con modalità di formattazione del testo ‘Raw’ (predefinito).
public TextExtractorOptions()
Proprietà
FormattingMode
Ottiene la modalità di formattazione.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Valore della Proprietà
TextExtractorOptions.TextFormattingMode
OperationName
Restituisce il nome dell’operazione.
public override string OperationName { get; }
Valore della Proprietà
Namespace: Documentize Assembly: Documentize.dll