Nous avons souvent besoin de convertir PDF en fichiers texte pour une utilisation dans l’analyse de données, l’indexation de recherche ou la réutilisation de contenu. De plus, si vous souhaitez créer un convertisseur de PDF en texte, automatiser l’OCR en ligne, ou copier du texte à partir de documents PDF pour un traitement ultérieur, notre API REST fournit une solution fiable et conviviale pour les développeurs.
- API de conversion PDF
- Conversion de PDF en texte en utilisant C# .NET
- Convertir un fichier PDF en fichier TXT à l’aide de cURL
API de conversion PDF
Le Aspose.PDF Cloud SDK for .NET est une API basée sur le cloud qui simplifie l’extraction de texte des documents et le traitement des PDF. Elle gère intelligemment à la fois les PDF basés sur le texte et ceux basés sur l’image, fournissant une sortie précise et structurée au format TXT.
Les caractéristiques clés comprennent :
- Extraction de fichiers PDF à TXT avec une haute précision.
- API REST multiplateforme — fonctionne parfaitement dans C#, .NET Core ou tout environnement avec support HTTP.
- Support pour l’extraction partielle — définissez des régions et extrayez du texte à partir de zones spécifiques.
Pour commencer, ajoutez le SDK à votre projet .NET en utilisant NuGet :
Install-Package Aspose.PDF-Cloud
Ensuite, visitez le Aspose Cloud Dashboard pour obtenir vos identifiants Client ID et Client Secret.
Conversion de PDF en texte à l’aide de C# .NET
Regardons comment convertir un PDF en fichier texte en C# en utilisant l’API REST .NET.
Étape 1. - Créez une instance de la classe PdfApi
en utilisant les identifiants du client.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Étape 2. - Lire le fichier PDF d’entrée et le télécharger sur le stockage cloud.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
Étape 3. - Spécifiez la région rectangulaire dans le PDF et extrayez le texte à l’aide de la méthode GetText(...)
.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
Étape 4. - Itérer à travers la liste contenant les occurrences de texte et les enregistrer sur le disque local.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// Pour des exemples complets et des fichiers de données, veuillez vous rendre sur https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet
// Obtenez les identifiants de client à partir de https://dashboard.aspose.cloud/
// Créez une instance de la classe PdfApi.
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// Téléchargez le PDF sur le stockage cloud
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// Enregistrez le texte extrait localement
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
Convertir un fichier PDF en fichier TXT en utilisant cURL
Pour les développeurs qui préfèrent un flux de travail de script ou multi-plateforme, l’API REST Aspose.PDF Cloud peut également être accessible en utilisant des commandes cURL.
Étape 1. – Générer un jeton d’accès :
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Étape 2. – Extraire le texte du PDF Une fois que le jeton JWT a été généré, veuillez exécuter la commande suivante pour extraire le texte du document PDF.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
Cette commande cURL récupère le contenu textuel de votre fichier PDF et le stocke dans un fichier .txt, ce qui en fait une méthode idéale pour la conversion de PDF en fichier texte dans des environnements automatisés.
Essayez le convertisseur PDF en texte gratuit
Are you looking for PDF to TXT conversion without coding? Essayez notre convertisseur gratuit en ligne PDF vers texte — powered by Aspose.PDF Cloud. Il vous suffit de télécharger votre PDF et de télécharger le fichier texte extrait en quelques secondes.

Conclusion
Dans cet article, nous avons appris que la conversion de PDF en texte est essentielle pour extraire et réutiliser les informations de manière efficace. Avec Aspose.PDF Cloud, vous pouvez automatiser le processus de copie de texte à partir de fichiers PDF, traiter des fichiers numérisés en utilisant la reconnaissance optique de caractères (OCR) en ligne, et exporter des données sous forme de texte structuré pour l’analyse ou l’indexation de recherche.
Questions Fréquemment Posées (FAQ)
-
Can I copy text from PDF programmatically? Absolument. L’API vous permet de copier du texte à partir de fichiers PDF en récupérant toutes les occurrences de texte ou en extrayant des régions spécifiques à l’aide de coordonnées.
-
Quelle est la différence entre PDF en texte et texte en PDF ? PDF vers texte extrait des données textuelles des documents, tandis que texte vers PDF crée un nouveau document PDF à partir d’une entrée de texte brut. Aspose.PDF Cloud prend en charge les deux opérations.
-
Do I need Adobe Acrobat installed? Non. Le SDK Aspose.PDF Cloud fonctionne indépendamment d’Adobe Acrobat ou de tout autre logiciel. Toutes les opérations de conversion de PDF en texte se déroulent dans le cloud.
-
Is the extracted text accurate for complex layouts? Oui. L’API peut extraire avec précision du texte à partir de mises en page à plusieurs colonnes, de tableaux et de PDF contenant un mélange de contenu, tout en maintenant une structure propre et lisible dans le fichier TXT résultant.
Liens utiles
Articles connexes
Nous recommandons vivement de visiter les blogs suivants :