ჩვენ ხშირად გვჭირდება PDF კონვერტაცია ტექსტური ფაილებისთვის მონაცემთა ანალიზში, ძიების ინდექსირებაში ან შინაარსის გადამუშავებისთვის. ასევე, თუ გსურთ PDF-იდან ტექსტური საკონვერტერო მოწყობილობის შექმნა, ავტომატიზირებული OCR ონლაინ რეჟიმში, ან PDF დოკუმენტებიდან ტექსტის კოპირება შემდგომი პროცესისთვის, ჩვენი REST API გთავაზობთ სანდო და დეველოპერების მიერ მეგობრულ გადაწყვეტილებას.
- PDF გადაკეთების API
- PDF to Text Conversion using C# .NET
- PDF ფაილის TXT ფაილში გარდაქმნა cURL-ის გამოყენებით
PDF გადაქცევის API
The Aspose.PDF Cloud SDK for .NET არის ღრუბლიანი API, რომელიც ამარტივებს დოკუმენტების ტექსტის ამოღებას და PDF პროცესირებას. ის ჭკვიანურად უვლის როგორც ტექსტზე, כך ook სურათებზე დაფუძნებულ PDF ფაილებს, უზრუნველყოფს ზუსტ და სტრუქტურირებულ გამოხატულებას TXT ფორმატში.
მთავარი მახასიათებლები მოიცავს:
- PDF to TXT فایلების ამოღება მაღალი სიზუსტით.
- პლატფორმებს შორის REST API — მუშაობს შეუფერხებლად C#, .NET Core-ს ან ისეთ გარემოში, რომელიც HTTP მხარდაჭერას უზრუნველყოფს.
- კერძო ამოღების მხარდაჭერა — განსაზღვრეთ რეგიონები და ამოიღეთ ტექსტი კონკრეტული არეალებიდან.
საწყისისთვის, დაამატეთ SDK თქვენს .NET პროექტში NuGet-ის საშუალებით:
Install-Package Aspose.PDF-Cloud
შემდეგ, ეწვიოთ Aspose Cloud Dashboard, რათა მოიპოვოთ თქვენი Client ID და Client Secret სერთიფიკატები.
PDF to Text Conversion using C# .NET
მოი_clients’ რა გადახედოთ როგორ გადავიტანოთ PDF ტექსტურ ფაილში C# ს გამოყენებით .NET REST API.
ყოველი 1. - შექმნათ PdfApi
კლასის ინსტანცია მომხმარებლის სერტიფიკატების გამოყენებით.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
ორე ნაბიჯი. - წაიკითხეთ შესავალ PDF ფაილი და ატვირთეთ ღრუბელ 저장시스템에.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
Step 3. - განსაზღვრეთ სწორკუთხოვანი რეჟიმი PDF თარეშზე და აგვიტანეთ ტექსტი GetText(...)
მეთოდის გამოყენებით.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
Step 4. - ჩაიარეთ ტექსტური შემთხვევების სია და შეინახეთ იგი ადგილობრივ დისკზე.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// पूर्ण उदाहरणों और डेटा फ़ाइलों के लिए, कृपया जाएं https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet
// Obtain client credentials from https://dashboard.aspose.cloud/
// PdfApi კლასის instance შექმნა
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// PDF ღრუბელ შენახვაში ატვირთეთ
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// გაიზარდე ამოღებული ტექსტი ადგილობრივად
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
PDF ფაილის TXT ფორმატში გადაყვანა cURL-ის გამოყენებით
დეველოპერებისთვის, quienes предпочитают скриптовый или кросс-платформенный рабочий процесс, Aspose.PDF Cloud REST API ასევე ხელმისაწვდომია cURL ბრძანებების გამოყენებით.
Step 1. – გენერირება წვდომის ტოკენის:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Step 2. – გარდაქმნეთ ტექსტი PDF-დან მჟღავნდება JWT ტოკენი, გთხოვთ, შეასრულოთ შემდეგი ბრძანება PDF დოკუმენტიდან ტექსტის ამოსაყვანად.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
ეს cURL ბრძანება იღებს ტექსტურ შეტყობინებებს თქვენი PDF ფაილიდან და ინახავს მათ .txt ფაილში, რაც იდეალური მეთოდია PDF-დან ტექსტურ ფაილზე გადაქცევისთვის ავტომატიზებულ გარემოში.
Try Free PDF to Text Converter
თქვენ ეძებთ PDF ფაილების TXT ფორმატში გადარჩენის საშუალებას კოდის გარეშე? ჩვენი უფასო Online PDF to Text Converter სცადეთ — რომელიც მუშაობს Aspose.PDF Cloud-ით. უბრალოდ ატვირთეთ თქვენი PDF და წამებში ჩამოტვირთეთ გამოხატული ტექსტური ფაილი.

შესაბამისი
ამ სტატიის საშუალებით, ჩვენ მივიღეთ ინფორმაცია, რომ PDF-დან ტექსტში კონვერტაცია მნიშვნელოვანია ინფორმაციის ეფექტურად მიღებისა და გადამუშავებისთვის. Aspose.PDF Cloud-ის საშუალებით, შეგიძლიათ ავტომატიზირდეთ PDF-დან ტექსტის ასლების კოპირების პროცესი, სკანირებული ფაილების მუშაობა OCR ონლაინ საშუალებით და მონაცემების ექსპორტირება ისეთი სტრუქტურირებული ტექსტის სახით, რომელიც ანალიტიკის ან ძიების ინდექსინგისთვისაა განკუთვნილი.
ხშირად დასმული კითხვები (FAQs)
-
Can I copy text from PDF programmatically? აბსოლუტურად. API საშუალებას გაწვდოს გამოსახულების ტექსტი PDF ფაილებიდან, ყველა ტექსტური გამოჩენის დაბრუნებით ან სპეციფიური რეგიონის ჩანაწერით კოორდინატების გამოყენებით.
-
PDF-დან ტექსტში და ტექსტიდან PDF-ზე რა განსხვავებაა? PDF to text extracts textual data from documents, while text to PDF creates a new PDF document from plain text input. Aspose.PDF Cloud supports both operations.
-
მჭირდება Adobe Acrobat-ის ინსტალაცია? არა. Aspose.PDF Cloud SDK მოქმედებს დამოუკიდებლად Adobe Acrobat-დან ან ნებისმიერი სხვა პროგრამიდან. ყველა PDF-დან ტექსტად გადაქცევის პროცესი ხდება ღრუბელში.
-
კომპლექსური განლაგებებისათვის აღმოჩენილი ტექსტი ზუსტი არის? დიახ. API-ის საშუალებით შესაძლებელია ტექსტის ზუსტი ამოსავალი მრავალსვეტიანი კომბინაციების, მაგიდებისა და შერეული შინაარსის PDF-ებიდან, რაც უზრუნველყოფს შედეგების TXT ფაილის სუფთა და მიმზიდველი სტრუქტურის შენარჩუნებას.
გასაგები ლინკები
კავშირებული სტატეები
ჩვენ ურჩევთ შემდეგ ბლოგებზე სტუმრობას: