Spesso abbiamo bisogno di convertire PDF in file di testo per l’uso nell’analisi dei dati, nell’indicizzazione della ricerca o nel ripristino dei contenuti. Inoltre, se vuoi costruire un convertitore da PDF a testo, automatizzare l’OCR online, o copiare testo da documenti PDF per ulteriori elaborazioni, la nostra REST API fornisce una soluzione affidabile e adatta agli sviluppatori.
- API di conversione PDF
- Conversione da PDF a testo utilizzando C# .NET
- Convertire PDF in file TXT utilizzando cURL
API di conversione PDF
L’ Aspose.PDF Cloud SDK for .NET è un’API basata su cloud che semplifica l’estrazione del testo dai documenti e l’elaborazione dei PDF. Gestisce in modo intelligente sia i PDF basati su testo che quelli basati su immagini, fornendo output accurati e strutturati in formato TXT.
Le caratteristiche principali includono:
- Estrazione di file PDF in TXT con alta precisione.
- API REST cross-platform - funziona senza problemi in C#, .NET Core o in qualsiasi ambiente con supporto HTTP.
- Supporto per estrazione parziale — definire regioni ed estrarre testo da aree specifiche.
Per iniziare, aggiungi l’SDK al tuo progetto .NET utilizzando NuGet:
Install-Package Aspose.PDF-Cloud
Poi, visita il Aspose Cloud Dashboard per ottenere le tue credenziali Client ID e Client Secret.
Conversione da PDF a testo utilizzando C# .NET
Guardiamo come convertire un PDF in un file di testo in C# utilizzando l’API REST .NET.
Passo 1. - Crea un’istanza della classe PdfApi
utilizzando le credenziali del cliente.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Passo 2. - Leggi il file PDF di input e caricalo nel cloud storage.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
Passo 3. - Specificare la regione rettangolare in PDF ed estrarre il testo usando il metodo GetText(...)
.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
Step 4. - Iterare attraverso l’elenco contenente occorrenze di testo e salvarlo nell’unità locale.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// Per esempi completi e file di dati, si prega di andare su https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet
// Ottieni le credenziali del cliente da https://dashboard.aspose.cloud/
// Crea un'istanza della classe PdfApi
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// Carica il PDF su un'archiviazione cloud
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// Salva il testo estratto localmente
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
Convertire PDF in file TXT utilizzando cURL
Per gli sviluppatori che preferiscono un flusso di lavoro di scripting o multipiattaforma, l’API REST di Aspose.PDF Cloud può essere accessibile anche utilizzando comandi cURL.
Passo 1. – Genera un Token di Accesso:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Passo 2. – Estrai testo da PDF Una volta generato il token JWT, si prega di eseguire il comando seguente per estrarre il testo dal documento PDF.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
Questo comando cURL recupera il contenuto testuale dal tuo file PDF e lo memorizza in un file .txt, rendendolo un metodo ideale per la conversione da PDF a file di testo in ambienti automatizzati.
Prova il convertitore da PDF a testo gratuito
Stai cercando una conversione da PDF a TXT senza codice? Prova il nostro gratuito Online PDF to Text Converter — alimentato da Aspose.PDF Cloud. Basta caricare il tuo PDF e scaricare il file di testo estratto in pochi secondi.

Conclusione
In questo articolo, abbiamo appreso che la conversione da PDF a testo è essenziale per estrarre e riutilizzare le informazioni in modo efficiente. Con Aspose.PDF Cloud, puoi automatizzare il processo di copia del testo dai PDF, gestendo file scansionati utilizzando OCR online ed esportando dati come testo strutturato per analisi o indicizzazione della ricerca.
Domande Frequenti (FAQ)
-
Can I copy text from PDF programmatically? Assolutamente. L’API ti consente di copiare testo da file PDF recuperando tutte le occorrenze di testo o estraendo da regioni specifiche utilizzando le coordinate.
-
Qual è la differenza tra PDF in testo e testo in PDF? PDF to text estrae dati testuali dai documenti, mentre text to PDF crea un nuovo documento PDF da input di testo semplice. Aspose.PDF Cloud supporta entrambe le operazioni.
-
Do I need Adobe Acrobat installed? No. L’SDK Aspose.PDF Cloud opera indipendentemente da Adobe Acrobat o da qualsiasi altro software. Tutte le operazioni di conversione da PDF a testo avvengono nel cloud.
-
Is the extracted text accurate for complex layouts? Sì. L’API può estrarre con precisione il testo da layout a più colonne, tabelle e PDF con contenuti misti, mantenendo una struttura pulita e leggibile nel file TXT risultante.
Link utili
Articoli Correlati
Vi raccomandiamo vivamente di visitare i seguenti blog: