نحن غالبًا ما نحتاج إلى تحويل PDF إلى ملفات نصية للاستخدام في تحليل البيانات أو فهرسة البحث أو إعادة استخدام المحتوى. أيضًا، إذا كنت ترغب في بناء محول من PDF إلى نص، أو أتمتة OCR على الإنترنت، أو نسخ النص من مستندات PDF لمزيد من المعالجة، فإن واجهة برمجة التطبيقات REST الخاصة بنا توفر حلاً موثوقًا وودودًا للمطورين.
API تحويل PDF
يعد Aspose.PDF Cloud SDK for .NET واجهة برمجة تطبيقات مستندة إلى السحابة تُبسط استخراج نص المستندات ومعالجة PDF. يتعامل بذكاء مع كل من ملفات PDF النصية وملفات PDF القائمة على الصور، ويوفر مخرجات دقيقة ومنظمة بتنسيق TXT.
تشمل الميزات الرئيسية:
- استخراج ملف PDF إلى TXT بدقة عالية.
- واجهة برمجة التطبيقات REST متعددة المنصات - تعمل بسلاسة في C#، .NET Core، أو أي بيئة تدعم HTTP.
- دعم للاستخراج الجزئي — تحديد المناطق واستخراج النص من áreas محددة.
للبدء، أضف SDK إلى مشروع .NET الخاص بك باستخدام NuGet:
Install-Package Aspose.PDF-Cloud
ثم، قم بزيارة Aspose Cloud Dashboard للحصول على معرف العميل وكلمات السر الخاصة بالعميل.
تحويل PDF إلى نص باستخدام C# .NET
لننظر إلى كيفية تحويل ملف PDF إلى ملف نصي في C# باستخدام واجهة برمجة التطبيقات .NET REST.
الخطوة 1. - إنشاء مثال لفئة PdfApi
باستخدام بيانات اعتماد العميل.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
الخطوة 2. - قراءة ملف PDF المدخل ورفعه إلى تخزين سحابي.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
الخطوة 3. - تحديد المنطقة المستطيلة في PDF واستخراج النص باستخدام طريقة GetText(...)
.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
الخطوة 4. - قم بالتكرار من خلال القائمة التي تحتوي على تكرارات النص واحفظها على القرص المحلي.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// للحصول على أمثلة كاملة وملفات بيانات، يرجى زيارة https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet
// احصل على بيانات اعتماد العميل من https://dashboard.aspose.cloud/
// قم بإنشاء مثيل من فئة PdfApi
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// رفع ملف PDF إلى التخزين السحابي
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// احفظ النص المستخرج محليًا
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
تحويل PDF إلى ملف TXT باستخدام cURL
بالنسبة للمطورين الذين يفضلون سير العمل القائم على النصوص البرمجية أو متعدد المنصات، يمكن أيضًا الوصول إلى Aspose.PDF Cloud REST API باستخدام أوامر cURL.
الخطوة 1. – توليد رمز وصول:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
الخطوة 2. – استخراج النص من ملف PDF بمجرد生成 رمز JWT، يرجى تنفيذ الأمر التالي لسحب النص من مستند PDF.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
ينقل هذا الأمر من cURL المحتوى النصي من ملف PDF الخاص بك ويخزنه في ملف .txt ، مما يجعله وسيلة مثالية لتحويل PDF إلى ملف نصي في البيئات الآلية.
حاول تحويل PDF إلى نص مجاناً
هل تبحث عن تحويل PDF إلى TXT بدون برمجة؟ جرب محول PDF إلى نص عبر الإنترنت المجاني — المدعوم من Aspose.PDF Cloud. ببساطة قم بتحميل ملف PDF الخاص بك وقم بتنزيل ملف النص المستخرج في ثوانٍ.

استنتاج
في هذه المقالة، نحن قد تعلمنا أن تحويل PDF إلى نص هو أمر ضروري لاستخراج وإعادة استخدام المعلومات بكفاءة. مع Aspose.PDF Cloud، يمكنك أتمتة عملية نسخ النص من ملفات PDF، والتعامل مع الملفات الممسوحة باستخدام OCR عبر الإنترنت، وتصدير البيانات كنص منظم لتحليلات أو فهرسة البحث.
الأسئلة الشائعة (FAQs)
-
Can I copy text from PDF programmatically? بالتأكيد. تتيح لك واجهة برمجة التطبيقات نسخ النص من ملفات PDF عن طريق استرجاع جميع تكرارات النص أو استخراجها من مناطق محددة باستخدام الإحداثيات.
-
ما الفرق بين تحويل PDF إلى نص وتحويل نص إلى PDF؟ تحويل PDF إلى نص يستخرج البيانات النصية من الوثائق، بينما تحويل النص إلى PDF ينشئ وثيقة PDF جديدة من مدخل نص عادي. يدعم Aspose.PDF Cloud كلا العمليتين.
-
هل أحتاج إلى تثبيت Adobe Acrobat؟ لا. تعمل Aspose.PDF Cloud SDK بشكل مستقل عن Adobe Acrobat أو أي برنامج آخر. تحدث جميع عمليات تحويل PDF إلى نص في السحابة.
-
هل النص المستخرج دقيق للتخطيطات المعقدة؟ نعم. يمكن لواجهة برمجة التطبيقات استخراج النص بدقة من تنسيقات متعددة الأعمدة، والجداول، وملفات PDF ذات المحتوى المختلط، مع الحفاظ على بنية نظيفة وقابلة للقراءة في ملف TXT الناتج.
روابط مفيدة
مقالات ذات صلة
نوصي بشدة بزيارة المدونات التالية: