ממיר PDF ל-HTML

המרת PDF ל-HTML באמצעות Java

אחד מהסטנדרטים דה-פקטו לשיתוף מידע ונתונים דרך האינטרנט הוא PDF. הסיבה לפופולריות שלו היא שהוא שומר על הפריסה והנאמנות של המסמך כאשר הוא צופה בכל פלטפורמה כולל שולחן עבודה או נייד. עם זאת, על מנת לצפות בקבצים אלה, עליך להשתמש ביישום מציג PDF. עם זאת, פתרון פשוט הוא להמיר PDF ל-HTML ולטעון בקלות את ה-HTML בדפדפן האינטרנט. אז במאמר זה, אנו הולכים לדון עוד בפרטים כיצד לפתח ממיר PDF ל-HTML באמצעות REST API.

API להמרה של SXC ל-Excel

על מנת ליצור, לבצע מניפולציות ולהמיר קובצי PDF לפורמטים אחרים, נסה להשתמש ב-Aspose.PDF Cloud SDK עבור Java. כעת על מנת להשתמש ב-SDK, אנא הוסף את המידע הבא ב-pom.xml של פרויקט מסוג maven build.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

כעת, לאחר שנוספה לפרויקט שלך Aspose.PDF Cloud SDK עבור עזר ל-Java, השלב הבא הוא יצירת חשבון חינמי על Aspose Cloud. התחבר באמצעות חשבון חדש שנוצר וחפש/צור מזהה לקוח וסוד לקוח ב-Cloud Dashboard. פרטים אלה נדרשים בסעיפים הבאים.

ממיר PDF ל-HTML ב-Java

בואו נדון בפרטים כיצד לפתח ממיר PDF ל-HTML באמצעות Java Cloud SDK. שים לב שבקטע הקוד הבא, נעשה שימוש בפרמטרים בסיסיים מאוד במהלך פעולת ההמרה, אך אנו ממליצים בחום לבקר בסעיף API Reference לקבלת רשימה של כל הפרמטרים הנתמכים כמו גם התיאור הקשור אליהם.

  • ראשית עלינו ליצור אובייקט PdfApi תוך מתן זיהוי לקוח וסוד לקוח כארגומנטים
  • שנית, טען את קובץ ה-PDF הקלט באמצעות מופע קובץ
  • שלישית, העלה את קובץ PDF הקלט לאחסון בענן באמצעות שיטת uploadFile(…).
  • מכיוון שאנחנו צריכים רק להמיר עמוד שני של PDF, אז אנחנו מספקים ערך עמוד שני באובייקט List
  • כעת קרא לשיטת putPdfInStorageToHtml(…) הדורשת קלט PDF, שם ה-HTML שנוצר ופרמטרי המרה שונים אחרים
try
    {
    // קבל ClientID ו-ClientSecret מ-https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // צור מופע של PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // שם מסמך PDF הקלט 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // שם קובץ ה-HTML שנוצר
    String resultantImage = "Resultant.html";
	  
    // קרא את התוכן של קובץ PDF הקלט
    File file = new File("//Users//"+inputFile);
	    
    // העלה PDF לאחסון בענן
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // רשימה של דפי PDF להמרה
    List<Integer> list = new ArrayList<Integer>();
    //list.add(1);
    list.add(2);  // only convert second page of PDF
	    
    // קרא ל-API להמרת PDF ל-HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // להדפיס הודעת הצלחה
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
ממיר PDF ל-HTML

תמונה 1: - תצוגה מקדימה של המרת PDF ל-HTML

ניתן להוריד את קובץ ה-PDF לדוגמה המשמש בדוגמה לעיל מ-PdfWithScreenAnnotations.pdf

המר PDF ל-HTML באמצעות פקודות cURL

פקודות cURL הן גם אחת הדרכים הנוחות לגישה לממשקי REST API דרך מסוף שורת הפקודה. כעת התנאי המקדים לגישה זו הוא יצירת אסימון גישה JWT (מבוסס על אישורי לקוח) תוך ביצוע הפקודה הבאה.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

ברגע שיש לנו את אסימון JWT, עלינו לבצע את הפקודה הבאה כדי להמיר PDF ל-HTML. ה-HTML שנוצר נשמר כארכיון Zip באחסון בענן.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

סיכום

למדנו את השלבים לפיתוח ממיר PDF ל-HTML באמצעות Java Cloud SDK. אז או שנוכל להשתמש בקטע קוד של Jave כדי להמיר PDF ל-HTML או שנוכל להשתמש בפקודות cULR כדי להמיר PDF ל-HTML5. במקרה שאתה רוצה לבצע שינויים כלשהם בקוד המקור של Java Cloud SDK, ניתן להוריד את קוד המקור המלא מ-GitHub. אתה יכול לשקול לפנות אלינו לפתרון מהיר של בעיות באמצעות פורום תמיכת מוצרים בחינם.

מאמרים קשורים

אנו ממליצים בחום לבקר בקישורים הבאים כדי ללמוד עוד על: