אנו לעיתים קרובות צריכים להמיר PDF לקבצי טקסט לשימוש בניתוח נתונים, אינדוקס חיפוש, או שינוי ייעוד תוכן. בנוסף, אם ברצונכם לבנות המרת PDF לטקסט, לאוטומט OCR באינטרנט, או להעתיק טקסט ממסמכי PDF לעיבוד נוסף, ה- REST API שלנו מספק פתרון אמין וידידותי למפתחים.

API להמרת PDF

ה Aspose.PDF Cloud SDK for .NET הוא API מבוסס ענן שמפשט את הוצאת הטקסט והעיבוד של קבצי PDF. הוא מטפל בצורה חכמה הן בקבצי PDF מבוססי טקסט והן בקבצי PDF מבוססי תמונות, ומספק פלט מדויק ומובנה בפורמט TXT.

תכונות מרכזיות כוללות:

  • PDF to TXT file extraction with high accuracy.
  • ממשק API REST בין פלטפורמות — עובד בצורה חלקה ב- C#, .NET Core, או בכל סביבה התומכת ב- HTTP.
  • תמיכה בהפקה חלקית — הגדר אזורים והפק טקסט מאזורים ספציפיים.

כדי להתחיל, הוסף את ה-SDK לפרויקט ה-.NET שלך באמצעות NuGet:

Install-Package Aspose.PDF-Cloud

אז, בקר בממשק ה-Aspose Cloud Dashboard Aspose Cloud Dashboard כדי לקבל את פרטי ההזדהות Client ID ו- Client Secret שלך.

המרת PDF לטקסט באמצעות C# .NET

בואו נביט כיצד להמיר קובץ PDF לקובץ טקסט ב-C# באמצעות ה-API REST של .NET.

שלב 1. - צור מופע של מחלקת PdfApi באמצעות אישורי לקוח.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

שלב 2. - קרא את קובץ ה-PDF שהוזן והעלה אותו לאחסון בענן.

var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);

שלב 3. - ציין את האזור מלבני ב-PDF והוצא טקסט באמצעות שיטת GetText(...) .

TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);

שלב 4. - חזור על רשימה המכילהOccurrences טקסט ושמור אותה לכונן המקומי.

foreach (var textFragment in response.TextOccurrences.List)
{
    output.WriteLine(textFragment.Text);
}
// לדוגמאות מלאות וקבצי נתונים, אנא היכנסו ל- https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet
// השג פרטי זיהוי לקוח מ- https://dashboard.aspose.cloud/

// יצור מופע של מחלקת PdfApi
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");

// עליך להעלות את ה-PDF לאפליקציית אחסון בענן.
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
    pdfApi.UploadFile("inputPDF.pdf", fileStream);
}

// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);

// שמור את הטקסט המופק באופן מקומי
using (StreamWriter output = new StreamWriter("output.txt"))
{
    foreach (var textFragment in response.TextOccurrences.List)
    {
        output.WriteLine(textFragment.Text);
    }
}
Console.WriteLine("PDF to text conversion completed successfully!");

Convert PDF to TXT File using cURL

למפתחים המעדיפים זרימת עבודה בסקריפט או בין פלטפורמות, ה- Aspose.PDF Cloud REST API ניתן גם לגישה באמצעות פקודות cURL.

צעד 1. – צור טוקן גישה:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

שלב 2. – הוצא טקסט מקובץ PDF ברגע שהאסימון JWT נוצר, אנא הרץ את הפקודה הבאה כדי למשוך את הטקסט מתוך מסמך ה-PDF.

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"

הפקודה cURL הזו מושכת תוכן טקסטואלי מקובץ ה-PDF שלך ושומרת אותו בקובץ .txt, מה שהופך אותה לשיטה אידיאלית להמרת PDF לקובץ טקסט בסביבות אוטומטיות.

נסה את הממיר חינמי PDF לטקסט

Are you looking for PDF to TXT conversion without coding? נסה את הממיר החינמי שלנו Online PDF to Text Converter — מופעל על ידי Aspose.PDF Cloud. פשוט העלה את ה-PDF שלך והורד את קובץ הטקסט המופק בתוך שניות.

extract text from PDF

סיכום

במאמר זה, אנחנו למדנו שהמרת PDF לטקסט היא חיונית להפקה ושימוש מחדש במידע ביעילות. עם Aspose.PDF Cloud, אתה יכול לאוטומט את תהליך העתקת הטקסט מ-PDFs, לטפל בקבצים סרוקים באמצעות OCR אונליין, ולייצא נתונים כטקסט מובנה לניתוחים או אינדוקס חיפוש.

שאלות נפוצות (FAQs)

  1. Can I copy text from PDF programmatically? בהחלט. ה- API מאפשר לך להעתיק טקסט מקבצי PDF על ידי שליפת כל ההופעות של הטקסט או חימום מאזורי ספציפיים באמצעות קואורדינטות.

  2. מה ההבדל בין PDF לטקסט וטקסט ל-PDF? PDF to text מוציא נתונים טקסטואלים ממסמכים, בעוד טקסט ל-PDF יוצר מסמך PDF חדש מקלט טקסט פשוט. Aspose.PDF Cloud תומך בשני הפעולות.

  3. Do I need Adobe Acrobat installed? לא. Aspose.PDF Cloud SDK פועל באופן עצמאי מ-Adobe Acrobat או כל תוכנה אחרת. כל פעולות המרת PDF לטקסט מתבצעות בענן.

  4. האם הטקסט המופק מדויק עבור פריסות מורכבות? כן. ה-API יכול לחלץ טקסט בצורה מדויקת מעיצובים מרובי עמודות, טבלאות ו-PDFs עם תוכן מעורב, תוך שמירה על מבנה נקי וקריא בקובץ ה-TXT الناتן.

קישורים שימושיים

מאמרים קשורים

אנו ממליצים בחום לבקר בבלוגים הבאים: