Konwerter plików PDF na HTML

Konwertuj pliki PDF na HTML za pomocą języka Java

Jednym z de facto standardów udostępniania informacji i danych przez Internet jest PDF. Powodem jego popularności jest to, że zachowuje układ i wierność dokumentu podczas przeglądania na dowolnej platformie, w tym na komputerze stacjonarnym lub urządzeniu mobilnym. Aby jednak przeglądać te pliki, musisz użyć przeglądarki plików PDF. Jednak prostym obejściem jest przekonwertowanie pliku PDF na HTML i łatwe załadowanie kodu HTML w przeglądarce internetowej. Dlatego w tym artykule omówimy szczegółowo, jak opracować konwerter plików PDF na HTML przy użyciu interfejsu API REST.

Interfejs API konwersji SXC do programu Excel

Aby tworzyć, przetwarzać i przekształcać pliki PDF do innych formatów, spróbuj użyć Aspose.PDF Cloud SDK for Java. Teraz, aby korzystać z SDK, dodaj następujące informacje w pliku pom.xml projektu typu kompilacja maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Po dodaniu do projektu Aspose.PDF Cloud SDK for Java następnym krokiem jest utworzenie bezpłatnego konta w Aspose Cloud. Zaloguj się przy użyciu nowo utworzonego konta i wyszukaj/utwórz identyfikator klienta i klucz tajny klienta w Cloud Dashboard. Te szczegóły są wymagane w kolejnych sekcjach.

Konwerter plików PDF na HTML w Javie

Omówmy szczegóły, jak opracować konwerter PDF na HTML za pomocą Java Cloud SDK. Należy pamiętać, że w poniższym fragmencie kodu podczas operacji konwersji używane są bardzo podstawowe parametry, ale zdecydowanie zalecamy odwiedzenie sekcji API Reference, aby zapoznać się z listą wszystkich obsługiwanych parametrów, a także z ich opisem.

  • Najpierw musimy utworzyć obiekt PdfApi, podając ClientID i Client secret jako argumenty
  • Po drugie, załaduj wejściowy plik PDF za pomocą instancji File
  • Po trzecie, prześlij wejściowy plik PDF do magazynu w chmurze za pomocą metody uploadFile(…).
  • Ponieważ musimy przekonwertować tylko drugą stronę pliku PDF, podajemy wartość drugiej strony w obiekcie List
  • Teraz wywołaj metodę putPdfInStorageToHtml(…) wymagającą wprowadzenia PDF, nazwy wynikowego HTML i różnych innych parametrów konwersji
try
    {
    // Uzyskaj ClientID i ClientSecret z https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // utwórz instancję PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // nazwa wejściowego dokumentu PDF 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // nazwa wynikowego pliku HTML
    String resultantImage = "Resultant.html";
	  
    // przeczytaj zawartość wejściowego pliku PDF
    File file = new File("//Users//"+inputFile);
	    
    // przesłać plik PDF do magazynu w chmurze
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // lista stron PDF do konwersji
    List<Integer> list = new ArrayList<Integer>();
    //lista.add(1);
    list.add(2);  // only convert second page of PDF
	    
    // wywołaj API do konwersji plików PDF na HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // wydrukować komunikat o powodzeniu
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
Konwerter plików PDF na HTML

Obraz1: - Podgląd konwersji PDF do HTML

Przykładowy plik PDF użyty w powyższym przykładzie można pobrać z PdfWithScreenAnnotations.pdf

Konwertuj pliki PDF na HTML za pomocą poleceń cURL

Polecenia cURL są również jednym z wygodnych sposobów uzyskiwania dostępu do interfejsów API REST za pośrednictwem terminala wiersza poleceń. Teraz warunkiem wstępnym dla tego podejścia jest wygenerowanie tokenu dostępu JWT (na podstawie poświadczeń klienta) podczas wykonywania następującego polecenia.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Gdy mamy token JWT, musimy wykonać następujące polecenie, aby przekonwertować plik PDF na HTML. Wynikowy kod HTML jest zapisywany jako archiwum ZIP w chmurze.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Wniosek

Nauczyliśmy się, jak opracować konwerter plików PDF na HTML za pomocą Java Cloud SDK. Więc albo możemy użyć fragmentu kodu Jave, aby przekonwertować PDF na HTML, albo możemy użyć poleceń cULR, aby przekonwertować PDF na HTML5. Jeśli chcesz wprowadzić jakiekolwiek zmiany w kodzie źródłowym Java Cloud SDK, pełny kod źródłowy można pobrać z GitHub. Możesz rozważyć skontaktowanie się z nami w celu szybkiego rozwiązania problemów za pośrednictwem bezpłatnego forum wsparcia produktu.

Powiązane artykuły

Zdecydowanie zalecamy odwiedzenie poniższych łączy, aby dowiedzieć się więcej o: