ما معمولاً نیاز به تبدیل PDF به فایلهای متنی برای استفاده در تحلیل دادهها، فهرستگذاری جستجو یا بازاستفاده از محتوا داریم. همچنین، اگر میخواهید یک مبدل PDF به متن بسازید، OCR آنلاین را خودکار کنید، یا متن را از اسناد PDF برای پردازش بیشتر کپی کنید، API REST ما یک راه حل مطمئن و مبتنی بر توسعهدهنده ارائه میدهد.
- API تبدیل PDF
- تبدیل PDF به متن با استفاده از C# .NET
- فایل PDF را با استفاده از cURL به فایل TXT تبدیل کنید
API تبدیل PDF
SDK ابری Aspose.PDF Cloud SDK for .NET یک API ابری است که استخراج متن از اسناد و پردازش PDF را ساده میکند. این SDK بهطور هوشمندانه هر دو نوع PDF مبتنی بر متن و تصویر را مدیریت کرده و خروجی دقیق و ساختار یافتهای در فرمت TXT ارائه میدهد.
ویژگیهای کلیدی شامل:
- استخراج فایل PDF به TXT با دقت بالا.
- API REST چند پلتفرمی — به طور یکپارچه در C#، .NET Core یا هر محیطی با پشتیبانی HTTP کار میکند.
- پشتیبانی از استخراج جزئی — تعریف نواحی و استخراج متن از مناطق خاص.
برای شروع، SDK را به پروژه .NET خود با استفاده از NuGet اضافه کنید:
Install-Package Aspose.PDF-Cloud
سپس به Aspose Cloud Dashboard مراجعه کنید تا شناسه مشتری و نیروهای مخفی مشتری خود را دریافت کنید.
تبدیل PDF به متن با استفاده از C# .NET
بیایید نگاهی بیندازیم به اینکه چگونه یک PDF را به فایل متنی در C# با استفاده از API REST .NET تبدیل کنیم.
مرحله ۱. - یک نمونه از کلاس PdfApi
ایجاد کنید با استفاده از اعتبارنامههای مشتری.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
مرحله ۲. - فایل PDF ورودی را بخوانید و به فضای ذخیرهسازی ابری بارگذاری کنید.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
مرحله ۳. - ناحیه مستطیلی را در PDF مشخص کنید و متن را با استفاده از متد GetText(...)
استخراج کنید.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
مرحله ۴. - از لیست حاوی وقوع متن عبور کنید و آن را در درایو محلی ذخیره کنید.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// برای مثالها و فایلهای داده کامل، لطفاً به https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet بروید.
// اعتبارنامههای کاربری را از https://dashboard.aspose.cloud/ دریافت کنید.
// یک نمونه از کلاس PdfApi ایجاد کنید
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// فایل PDF را به فضای ابری بارگذاری کنید
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// متن استخراج شده را به صورت محلی ذخیره کنید
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
فایل PDF را با استفاده از cURL به فایل TXT تبدیل کنید
برای توسعهدهندگانی که یک روش کار اسکریپتی یا چندسکویی را ترجیح میدهند، API REST ابری Aspose.PDF نیز میتواند با استفاده از دستورات cURL دسترسی پیدا کند.
مرحله ۱. – یک توکن دسترسی تولید کنید:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
مرحله ۲. – استخراج متن از PDF هنگامی که توکن JWT تولید شد، لطفاً دستور زیر را برای کشیدن متن از سند PDF اجرا کنید.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
این دستور cURL محتوای متنی را از فایل PDF شما استخراج کرده و در یک فایل .txt ذخیره میکند، که آن را به روشی ایدهآل برای تبدیل PDF به فایل متنی در محیطهای خودکار تبدیل میکند.
تبدیل کننده رایگان PDF به متن را امتحان کنید
آیا به دنبال تبدیل PDF به TXT بدون کد نویسی هستید؟ تایپ کنید کن converter PDF به متن آنلاین رایگان — با قدرت Aspose.PDF Cloud. به سادگی PDF خود را بارگذاری کرده و فایل متن استخراج شده را در چند ثانیه دانلود کنید.

نتیجه گیری
در این مقاله، ما آموختهایم که تبدیل PDF به متن برای استخراج و استفاده مجدد از اطلاعات به طور مؤثر ضروری است. با Aspose.PDF Cloud، میتوانید فرآیند کپی کردن متن از PDF ها را خودکار کنید، فایلهای اسکن شده را با استفاده از OCR آنلاین مدیریت کنید و دادهها را به عنوان متن ساختاریافته برای تجزیه و تحلیل یا نمایهسازی جستجو صادر کنید.
سوالات متداول (FAQs)
-
آیا میتوانم به صورت برنامهنویسی متن را از PDF کپی کنم؟ کاملاً. API به شما اجازه میدهد تا متن را از فایلهای PDF کپی کنید، با بازیابی همهی موارد متنی یا استخراج از نواحی خاص با استفاده از مختصات.
-
تفاوت بین PDF به متن و متن به PDF چیست؟ استخراج دادههای متنی از اسناد با PDF به متن انجام میشود، در حالی که متن به PDF یک سند PDF جدید از ورودی متنی ساده ایجاد میکند. Aspose.PDF Cloud از هر دو عملیات پشتیبانی میکند.
-
آیا به نصب Adobe Acrobat نیاز دارم؟ خیر. Aspose.PDF Cloud SDK به طور مستقل از Adobe Acrobat یا هر نرمافزار دیگری کار میکند. همه عملیات تبدیل PDF به متن در Cloud انجام میشود.
-
آیا متن استخراج شده برای طرحهای پیچیده دقیق است؟ بله. API میتواند به دقت متن را از قالبهای چند ستونه، جداول و PDFهای محتوی مخلوط استخراج کند و ساختار تمیز و قابل خواندنی را در فایل TXT نتیجهای حفظ کند.
لینکهای مفید
مقالات مرتبط
ما به شدت بازدید از وبلاگهای زیر را پیشنهاد میکنیم: