
Java を使用して PDF を HTML に変換する
インターネット上で情報とデータを共有するためのデファクト スタンダードの 1 つは PDF です。その人気の理由は、デスクトップやモバイルを含むあらゆるプラットフォームで表示されたときに、ドキュメントのレイアウトと忠実度が維持されることです。ただし、これらのファイルを表示するには、PDF ビューアー アプリケーションを使用する必要があります。ただし、簡単な回避策は、PDF を HTML に変換し、HTML を Web ブラウザーに簡単にロードすることです。したがって、この記事では、REST API を使用して PDF から HTML へのコンバーターを開発する方法について詳しく説明します。
SXC から Excel への変換 API
PDF ファイルを作成、操作、および他の形式に変換するには、Aspose.PDF Cloud SDK for Java を使用してみてください。 SDK を使用するには、maven ビルド タイプのプロジェクトの pom.xml に次の情報を追加してください。
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
Aspose.PDF Cloud SDK for Java リファレンスがプロジェクトに追加されたので、次のステップは Aspose Cloud で無料アカウントを作成することです。新しく作成したアカウントを使用してログインし、クラウド ダッシュボード でクライアント ID とクライアント シークレットを検索/作成します。これらの詳細は、以降のセクションで必要になります。
JavaでのPDFからHTMLへのコンバーター
Java Cloud SDK を使用して PDF から HTML へのコンバーターを開発する方法について詳しく説明しましょう。次のコード スニペットでは、変換操作中に非常に基本的なパラメーターが使用されますが、API リファレンス セクションにアクセスして、サポートされているすべてのパラメーターのリストと関連する説明を確認することを強くお勧めします。
- 最初に、引数として ClientID と Client secret を提供しながら、PdfApi オブジェクトを作成する必要があります
- 次に、File インスタンスを使用して入力 PDF ファイルをロードします。
- 3 番目に、uploadFile(…) メソッドを使用して入力 PDF をクラウド ストレージにアップロードします。
- PDF の 2 ページ目のみを変換する必要があるため、List オブジェクトで 2 ページ目の値を提供しています。
- ここで、入力 PDF、結果の HTML の名前、およびその他のさまざまな変換パラメーターを必要とする putPdfInStorageToHtml(…) メソッドを呼び出します。
try
{
// https://dashboard.aspose.cloud/ から ClientID と ClientSecret を取得します。
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// PdfApi のインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// 入力 PDF ドキュメントの名前
String inputFile = "PdfWithScreenAnnotations.pdf";
// 結果の HTML ファイルの名前
String resultantImage = "Resultant.html";
// 入力PDFファイルの内容を読む
File file = new File("//Users//"+inputFile);
// PDFをクラウドストレージにアップロード
pdfApi.uploadFile("input.pdf", file, null);
// 変換する PDF ページのリスト
List<Integer> list = new ArrayList<Integer>();
//list.add(1);
list.add(2); // only convert second page of PDF
// PDF から HTML への変換用の API を呼び出す
pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null,
null, null, false, false, null, null,null, list, null,
"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
null, null, null, null, null, null, null, null, null, "Zip");
// 成功メッセージを出力する
System.out.println("PDF to HTML Successsul !");
}catch(Exception ex)
{
System.out.println(ex);
}

Image1:- PDF から HTML への変換プレビュー
上記の例で使用されているサンプル PDF ファイルは、PdfWithScreenAnnotations.pdf からダウンロードできます。
cURL コマンドを使用して PDF を HTML に変換する
cURL コマンドは、コマンド ライン ターミナルから REST API にアクセスするための便利な方法の 1 つでもあります。このアプローチの前提条件は、次のコマンドの実行中に (クライアント資格情報に基づいて) JWT アクセス トークンを生成することです。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
JWT トークンを取得したら、次のコマンドを実行して PDF を HTML に変換する必要があります。結果の HTML は、クラウド ストレージに Zip アーカイブとして保存されます。
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
結論
Java Cloud SDK を使用して PDF から HTML へのコンバーターを開発する手順を学習しました。したがって、Jave コード スニペットを使用して PDF を HTML に変換するか、cULR コマンドを使用して PDF を HTML5 に変換できます。 Java Cloud SDK のソース コードを変更したい場合は、GitHub から完全なソース コードをダウンロードできます。無料の 製品サポート フォーラム から問題を迅速に解決するために、Google にアプローチすることを検討してください。
関連記事
詳細については、次のリンクにアクセスすることを強くお勧めします。