Vi har ofte brug for at konvertere PDF til tekstfiler til brug i dataanalyse, søgeindeksering eller genbrug af indhold. Hvis du også ønsker at bygge en PDF til tekst konverter, automatisere OCR online, eller kopiere tekst fra PDF-dokumenter til videre behandling, giver vores REST API en pålidelig og udviklervenlig løsning.
- PDF Conversion API
- PDF til tekst konvertering ved hjælp af C# .NET
- Convert PDF to TXT File using cURL
PDF Conversion API
The Aspose.PDF Cloud SDK for .NET er en cloud-baseret API, der forenkler dokumenttekstudtræk og PDF-behandling. Den håndterer intelligent både tekstbaserede og billedebaserede PDF’er og giver præcis og struktureret output i TXT-format.
Nøglefunktioner inkluderer:
- PDF til TXT filudtrækning med høj nøjagtighed.
- Cross-platform REST API — fungerer problemfrit i C#, .NET Core eller ethvert miljø med HTTP-support.
- Support for partial extraction — define regions and extract text from specific areas.
For at komme i gang, skal du tilføje SDK’en til dit .NET-projekt ved hjælp af NuGet:
Install-Package Aspose.PDF-Cloud
Så besøg Aspose Cloud Dashboard for at få din klient-ID og klienthemmelighed.
PDF til tekst konvertering ved hjælp af C# .NET
Lad os se på, hvordan man konverterer en PDF til tekstfil i C# ved hjælp af .NET REST API’en.
Trin 1. - Opret en instans af PdfApi
klassen ved hjælp af klientlegitimationsoplysninger.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Step 2. - Læs input PDF-fil og upload til cloud-lagring.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
Trin 3. - Angiv det rektangulære område i PDFen og udtræk tekst ved hjælp af
GetText(…)` metoden.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
Step 4. - Iterer gennem listen, der indeholder tekstforekomster, og gem den på den lokale drev.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// For complete examples and data files, please go to https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet
// Obtain client credentials from https://dashboard.aspose.cloud/
// Opret en instans af PdfApi-klassen
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// Upload the PDF til cloud storage
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// Save the extracted text locally
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
Konverter PDF til TXT-fil ved hjælp af cURL
For udviklere, der foretrækker et scripting- eller tværplatformsarbejdsgang, kan Aspose.PDF Cloud REST API’en også tilgås ved hjælp af cURL-kommandoer.
Trin 1. – Generer en adgangstoken:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Step 2. – Ekstraher tekst fra PDF Når JWT-tokenet er genereret, skal du udføre følgende kommando for at hente teksten fra PDF-dokumentet.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
Denne cURL-kommando henter tekstindhold fra din PDF-fil og gemmer det i en .txt-fil, hvilket gør det til en ideel metode til konvertering af PDF til tekstfiler i automatiserede miljøer.
Prøv gratis PDF til tekst konverter.
Are you looking for PDF to TXT conversion without coding? Prøv vores gratis Online PDF til Tekst Converter — drevet af Aspose.PDF Cloud. Oplad ganske enkelt din PDF og download den udtrukne tekstfil på sekunder.

Konklusion
I denne artikel har vi lært, at konvertering af PDF til tekst er vigtig for effektivt at udtrække og genbruge information. Med Aspose.PDF Cloud kan du automatisere processen med at kopiere tekst fra PDF-filer, håndtere scannede filer ved hjælp af OCR online og eksportere data som struktureret tekst til analyser eller søgeindeksering.
Ofte stillede spørgsmål (FAQs)
-
Can I copy text from PDF programmatically? Absolut. API’en giver dig mulighed for at kopiere tekst fra PDF-filer ved at hente alle tekstforekomster eller udtrække fra specifikke områder ved hjælp af koordinater.
-
Hvad er forskellen mellem PDF til tekst og tekst til PDF? PDF til tekst udtrækker tekstdata fra dokumenter, mens tekst til PDF opretter et nyt PDF-dokument fra almindelig tekstinddata. Aspose.PDF Cloud understøtter begge operationer.
-
Do I need Adobe Acrobat installed? Nej. Aspose.PDF Cloud SDK fungerer uafhængigt af Adobe Acrobat eller anden software. Alle PDF til tekst konverteringsoperationer foregår i skyen.
-
Er den udtrukne tekst præcis for komplekse layouter? Ja. API’en kan nøjagtigt udtrække tekst fra multilæsningslayouts, tabeller og blandede indhold PDF’er, og bevare en ren og læsbar struktur i den resulterende TXT-fil.
Nyttige links
Relaterede artikler
Vi anbefaler stærkt at besøge følgende blogs: