Opzioni TextExtractor della Classe

Informazione

Rappresenta le opzioni di estrazione del testo per il plugin Documentize.TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Ereditarietà

objectPdfExtractorOptionsTextExtractorOptions

Implementa

Membri Ereditati

Esempi

L’esempio dimostra come estrarre il contenuto di testo di un documento PDF.

// creare un oggetto TextExtractor per estrarre i contenuti PDF
using (TextExtractor extractor = new TextExtractor())
{
    // creare un oggetto TextExtractorOptions per impostare TextFormattingMode (Puro, o Raw - predefinito)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // aggiungere il percorso del file di input alle sorgenti di dati
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // eseguire il processo di estrazione
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // ottenere il testo estratto dall'oggetto ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Osservazioni

L’oggetto Documentize.TextExtractorOptions viene utilizzato per impostare Documentize.TextExtractorOptions.TextFormattingMode e altre opzioni per l’operazione di estrazione del testo. Inoltre, eredita funzioni per aggiungere dati (file, stream) che rappresentano i documenti PDF di input.

Costruttori

TextExtractorOptions(TextFormattingMode)

Inizializza una nuova istanza dell’oggetto Documentize.TextExtractorOptions per la modalità di formattazione del testo specificata.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parametri

TextExtractorOptions()

Inizializza una nuova istanza dell’oggetto Documentize.TextExtractorOptions con modalità di formattazione del testo ‘Raw’ (predefinito).

public TextExtractorOptions()

Proprietà

FormattingMode

Ottiene la modalità di formattazione.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Valore della Proprietà

TextExtractorOptions.TextFormattingMode

OperationName

Restituisce il nome dell’operazione.

public override string OperationName { get; }

Valore della Proprietà

string

Namespace: Documentize Assembly: Documentize.dll

 Italiano