ما معمولاً نیاز به تبدیل PDF به فایل‌های متنی برای استفاده در تحلیل داده‌ها، فهرست‌گذاری جستجو یا بازاستفاده از محتوا داریم. همچنین، اگر می‌خواهید یک مبدل PDF به متن بسازید، OCR آنلاین را خودکار کنید، یا متن را از اسناد PDF برای پردازش بیشتر کپی کنید، API REST ما یک راه حل مطمئن و مبتنی بر توسعه‌دهنده ارائه می‌دهد.

API تبدیل PDF

SDK ابری Aspose.PDF Cloud SDK for .NET یک API ابری است که استخراج متن از اسناد و پردازش PDF را ساده می‌کند. این SDK به‌طور هوشمندانه هر دو نوع PDF مبتنی بر متن و تصویر را مدیریت کرده و خروجی دقیق و ساختار یافته‌ای در فرمت TXT ارائه می‌دهد.

ویژگی‌های کلیدی شامل:

  • استخراج فایل PDF به TXT با دقت بالا.
  • API REST چند پلتفرمی — به طور یکپارچه در C#، .NET Core یا هر محیطی با پشتیبانی HTTP کار می‌کند.
  • پشتیبانی از استخراج جزئی — تعریف نواحی و استخراج متن از مناطق خاص.

برای شروع، SDK را به پروژه .NET خود با استفاده از NuGet اضافه کنید:

Install-Package Aspose.PDF-Cloud

سپس به Aspose Cloud Dashboard مراجعه کنید تا شناسه مشتری و نیروهای مخفی مشتری خود را دریافت کنید.

تبدیل PDF به متن با استفاده از C# .NET

بیایید نگاهی بیندازیم به اینکه چگونه یک PDF را به فایل متنی در C# با استفاده از API REST .NET تبدیل کنیم.

مرحله ۱. - یک نمونه از کلاس PdfApi ایجاد کنید با استفاده از اعتبارنامه‌های مشتری.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

مرحله ۲. - فایل PDF ورودی را بخوانید و به فضای ذخیره‌سازی ابری بارگذاری کنید.

var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);

مرحله ۳. - ناحیه مستطیلی را در PDF مشخص کنید و متن را با استفاده از متد GetText(...) استخراج کنید.

TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);

مرحله ۴. - از لیست حاوی وقوع متن عبور کنید و آن را در درایو محلی ذخیره کنید.

foreach (var textFragment in response.TextOccurrences.List)
{
    output.WriteLine(textFragment.Text);
}
// برای مثال‌ها و فایل‌های داده کامل، لطفاً به https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet بروید.
// اعتبارنامه‌های کاربری را از https://dashboard.aspose.cloud/ دریافت کنید.

// یک نمونه از کلاس PdfApi ایجاد کنید
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");

// فایل PDF را به فضای ابری بارگذاری کنید
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
    pdfApi.UploadFile("inputPDF.pdf", fileStream);
}

// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);

// متن استخراج شده را به صورت محلی ذخیره کنید
using (StreamWriter output = new StreamWriter("output.txt"))
{
    foreach (var textFragment in response.TextOccurrences.List)
    {
        output.WriteLine(textFragment.Text);
    }
}
Console.WriteLine("PDF to text conversion completed successfully!");

فایل PDF را با استفاده از cURL به فایل TXT تبدیل کنید

برای توسعه‌دهندگانی که یک روش کار اسکریپتی یا چندسکویی را ترجیح می‌دهند، API REST ابری Aspose.PDF نیز می‌تواند با استفاده از دستورات cURL دسترسی پیدا کند.

مرحله ۱. – یک توکن دسترسی تولید کنید:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

مرحله ۲. – استخراج متن از PDF هنگامی که توکن JWT تولید شد، لطفاً دستور زیر را برای کشیدن متن از سند PDF اجرا کنید.

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"

این دستور cURL محتوای متنی را از فایل PDF شما استخراج کرده و در یک فایل .txt ذخیره می‌کند، که آن را به روشی ایده‌آل برای تبدیل PDF به فایل متنی در محیط‌های خودکار تبدیل می‌کند.

تبدیل کننده رایگان PDF به متن را امتحان کنید

آیا به دنبال تبدیل PDF به TXT بدون کد نویسی هستید؟ تایپ کنید کن converter PDF به متن آنلاین رایگان — با قدرت Aspose.PDF Cloud. به سادگی PDF خود را بارگذاری کرده و فایل متن استخراج شده را در چند ثانیه دانلود کنید.

متن را از PDF استخراج کنید

نتیجه گیری

در این مقاله، ما آموخته‌ایم که تبدیل PDF به متن برای استخراج و استفاده مجدد از اطلاعات به طور مؤثر ضروری است. با Aspose.PDF Cloud، می‌توانید فرآیند کپی کردن متن از PDF ها را خودکار کنید، فایل‌های اسکن شده را با استفاده از OCR آنلاین مدیریت کنید و داده‌ها را به عنوان متن ساختاریافته برای تجزیه و تحلیل یا نمایه‌سازی جستجو صادر کنید.

سوالات متداول (FAQs)

  1. آیا می‌توانم به صورت برنامه‌نویسی متن را از PDF کپی کنم؟ کاملاً. API به شما اجازه می‌دهد تا متن را از فایل‌های PDF کپی کنید، با بازیابی همه‌ی موارد متنی یا استخراج از نواحی خاص با استفاده از مختصات.

  2. تفاوت بین PDF به متن و متن به PDF چیست؟ استخراج داده‌های متنی از اسناد با PDF به متن انجام می‌شود، در حالی که متن به PDF یک سند PDF جدید از ورودی متنی ساده ایجاد می‌کند. Aspose.PDF Cloud از هر دو عملیات پشتیبانی می‌کند.

  3. آیا به نصب Adobe Acrobat نیاز دارم؟ خیر. Aspose.PDF Cloud SDK به طور مستقل از Adobe Acrobat یا هر نرم‌افزار دیگری کار می‌کند. همه عملیات تبدیل PDF به متن در Cloud انجام می‌شود.

  4. آیا متن استخراج شده برای طرح‌های پیچیده دقیق است؟ بله. API می‌تواند به دقت متن را از قالب‌های چند ستونه، جداول و PDFهای محتوی مخلوط استخراج کند و ساختار تمیز و قابل خواندنی را در فایل TXT نتیجه‌ای حفظ کند.

لینک‌های مفید

مقالات مرتبط

ما به شدت بازدید از وبلاگ‌های زیر را پیشنهاد می‌کنیم: