PDF do HTML

Konwertuj pliki PDF na HTML za pomocą interfejsu API .NET REST.

Dokumenty PDF są popularnym sposobem udostępniania informacji ze względu na ich spójne formatowanie na różnych urządzeniach i platformach. Jeśli jednak chodzi o wyświetlanie treści w witrynie internetowej, pliki PDF nie zawsze są najbardziej przyjazną dla użytkownika opcją. Jednak konwersja plików PDF do formatu HTML otwiera świat możliwości dla twórców stron internetowych i twórców treści. Innym powodem tej konwersji jest to, że prezentacja treści i dostępność są kluczowymi czynnikami sukcesu w Internecie, ponieważ można je indeksować w wyszukiwarkach.

W tym artykule zagłębimy się w szczegóły konwersji pliku PDF na HTML za pomocą interfejsu API .NET REST.

API REST do konwersji plików PDF na HTML

Konwersja plików PDF na HTML jest łatwa dzięki potężnym możliwościom Aspose.PDF Cloud SDK dla .NET. Ten interfejs API umożliwia bezproblemową integrację funkcji konwersji plików PDF z aplikacjami i przepływami pracy .NET. Za pomocą zaledwie kilku linii kodu możesz bez wysiłku przekonwertować dokumenty PDF na format HTML, dzięki czemu nadają się do wyświetlania i interakcji w Internecie. Interfejs API REST udostępnia szeroką gamę funkcji pozwalających kontrolować proces konwersji. Możesz także dostosować wyjściowy kod HTML, określając domyślną nazwę czcionki, typ dokumentu, układ, rozdzielczość obrazu i różne inne konfiguracje.

Aby rozpocząć proces konwersji, najpierw musimy dodać odniesienie do SDK w naszym projekcie i w tym celu wyszukaj „Aspose.PDF-Cloud” w menedżerze pakietów NuGet w Visual Studio IDE i kliknij przycisk „Dodaj pakiet” . Musisz także uzyskać dane uwierzytelniające klienta z panelu chmury. Jeśli nie masz istniejącego konta, po prostu utwórz bezpłatne konto, postępując zgodnie z instrukcjami podanymi w szybkim starcie.

Konwertuj pliki PDF na HTML przy użyciu języka C# .NET

Teraz musimy wykonać następujący fragment kodu, aby przeprowadzić konwersję, abyśmy mogli renderować plik PDF na stronę internetową.

// Więcej przykładów można znaleźć na stronie https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Uzyskaj dane uwierzytelniające klienta z https://dashboard.aspose.cloud/
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";

// utwórz instancję PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Wprowadź nazwę pliku PDF
String inputFile = "Binder1-1.pdf";
// przeczytaj zawartość wejściowego pliku PDF
var pdfFile = System.IO.File.OpenRead(inputFile);

// Wywołaj interfejs API, aby przekonwertować plik PDF na HTML i zapisać wynik w chmurze
// Określiliśmy wyjściowy format HTML jako „HTML5”. 
// Flaga umożliwiająca zapisywanie każdej strony PDF jako osobnego pliku HTML jest włączona
// Dane wyjściowe zostaną wygenerowane jako archiwum .ZIP
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5", 
    splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", 
    outputFormat: "Zip" , file: pdfFile);
PDF do HTML

Podgląd konwersji PDF na HTML.

Poniżej podano krótkie szczegóły dotyczące powyższego fragmentu kodu.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Najpierw utwórz obiekt klasy PdfApi, przekazując poświadczenia klienta jako argumenty wejściowe.

var pdfFile = System.IO.File.OpenRead(inputFile);

Przeczytaj zawartość pliku PDF z dysku lokalnego.

pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);

Wywołaj interfejs API, aby przekonwertować plik PDF ze strumienia wejściowego na format HTML. Podczas konwersji określiliśmy wartość zapisania każdej strony PDF w osobnym pliku HTML.

Odwiedź stronę PutPdfInRequestToHtml, aby uzyskać pełną listę argumentów obsługiwanych przez to wywołanie interfejsu API i powiązane z nimi szczegóły.

Wejściowy dokument PDF użyty w powyższym przykładzie można pobrać z Binder1.pdf.

PDF do HTML Online za pomocą poleceń cURL

Konwersja plików PDF na HTML za pomocą poleceń cURL w połączeniu z Aspose.PDF Cloud to także wszechstronne i wydajne podejście. Wykorzystując możliwości poleceń cURL, możesz łatwo zintegrować interfejs API chmury Aspose.PDF ze swoimi aplikacjami i zautomatyzować proces konwersji pliku PDF na HTML. Co więcej, użycie poleceń cURL umożliwia łatwą interakcję z punktami końcowymi RESTful, umożliwiając bezproblemową komunikację i wymianę danych. Aby więc wyświetlić plik PDF w przeglądarce HTML, wystarczy przekonwertować pliki PDF na HTML, wywołując kilka poleceń cURL, co znacznie skraca czas i wysiłek programowania.

Pierwszym krokiem w tym podejściu jest wygenerowanie tokena dostępu JWT. Wykonaj więc następujące polecenie:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Teraz musimy wykonać następujące polecenie cURL, które ładuje plik PDF z magazynu w chmurze, konwertuje cały dokument do formatu HTML i zapisuje dane wyjściowe jako archiwum .ZIP na dysku lokalnym (nazwa określona argumentem -o).

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.zip"

Zamień „inputPDF” na nazwę wejściowego dokumentu PDF dostępnego w chmurze, a „accessToken” na token dostępu JWT wygenerowany powyżej.

Wniosek

Podsumowując, konwersja plików PDF na HTML za pomocą Aspose.PDF Cloud API zapewnia kompleksowe i wszechstronne rozwiązanie. Niezależnie od tego, czy używasz interfejsu API .NET REST do bezproblemowej integracji, czy poleceń cURL do wydajnej konwersji, pakiet Aspose.PDF Cloud SDK oferuje rozbudowane funkcje i opcje dostosowywania. Podejścia te zapewniają dokładne renderowanie treści PDF do responsywnego kodu HTML, zachowując układ i formatowanie, zapewniając optymalną wygodę użytkowania. Dodatkowo możliwość osadzania treści PDF na stronach HTML umożliwia tworzenie wszechstronnych i interaktywnych aplikacji internetowych, zwiększając dostępność i zaangażowanie użytkowników.

Przydatne linki

Powiązane artykuły

Gorąco polecamy odwiedzenie następujących blogów: