
C# .NET を使用して PDF から HTML へのコンバーターを開発する
ほとんどの人は、どのプラットフォームでファイルを表示する場合でもドキュメントの書式設定が保持されるため、Portable Document Format (PDF) を使用します。デスクトップまたはモバイル プラットフォームで表示する場合、ドキュメントの忠実度は損なわれません。ただし、PDF ファイルを表示するには、特定のビューア アプリケーションを使用する必要があります。そのため、このような欠点を克服するには、HTML 形式が有効なソリューションの 1 つになります。この記事では、C# .NET を使用して PDF を HTML に変換する方法について詳しく説明します。
この記事では、以下のトピックについて詳しく説明します。
- PDF から HTML への変換 API
- PDF を HTML に変換 - 応答の結果
- PDF から HTML へ - クラウド ストレージに保存
- ローカルドライブの PDF から HTML へ - クラウド ストレージに出力
PDF から HTML への変換 API
Aspose.PDF Cloud は REST アーキテクチャに基づいており、PDF を作成、編集するだけでなく、HTML、JPEG、DOCX、PPTX、XLSX、SVG などの サポートされているドキュメント形式 に変換する機能も提供します。この記事では、C# .NET を使用して PDF を HTML に変換する手順に焦点を当てています。このタスクは、Aspose.PDF Cloud のラッパーである Aspose.PDF Cloud SDK for .NET を使用して実行できます。これにより、.NET アプリケーション内で REST API のすべての機能を利用できます。
SDKはNuGetとGitHubからダウンロードできます。NuGetライブラリからインストールするには、NuGetパッケージマネージャーで次のコマンドを実行してください。
Install-Package Aspose.Pdf-Cloud
または、SDK を NuGet パッケージとして Visual Studio プロジェクト内に直接インストールすることも検討できます。ソリューション エクスプローラーでプロジェクト ツリーを展開し、パッケージ フォルダーを右クリックして、コンテキスト メニューから [NuGet パッケージの管理…] オプションを選択するだけです。

画像 1:- NuGet パッケージを管理します。
次に、検索フィールドで Aspose.PDF Cloud を検索し、パッケージ名の横にあるチェックボックスをオンにして、「パッケージの追加」ボタンをクリックします。

画像 2: NuGet パッケージ内の Aspose.PDF Cloud SDK。
Aspose.Pdf-Cloud.dll が Packages フォルダーの下に表示されることに注意してください。

画像 3: ソリューション エクスプローラーの下にある Aspose.Pdf-cloud.dll。
インストール後、既存のGitHubまたはGoogleアカウントを使用してクラウドダッシュボードにサインインするか、新しいアカウントの作成ボタンをクリックする必要があります。
PDF を HTML に変換 - 応答の結果
PDF から HTML への変換操作を実行するには、以下の手順に従ってください。入力 PDF はクラウド ストレージから読み込まれ、結果の HTML は応答ストリーム コンテキストとして返されます。このコンテキストはローカル ドライブに保存することも、Web ブラウザーに直接表示することもできます。
- 最初のステップは、クライアント ID とクライアント シークレットの詳細を定義する文字列変数を作成することです。
- 次に、クライアント ID とクライアント シークレット変数を引数として渡しながら、PdfApi のインスタンスを作成します。
- 3 番目に、PDF ファイルの内容を読み取り、Stream インスタンスに読み込みます。
- 次に、PdfApiクラスのUploadFile(…)メソッドを使用してPDFファイルをクラウドストレージにアップロードします。
- 最後に、GetPdfInStorageToHtml(…) メソッドを呼び出して変換を実行します。
// https://dashboard.aspose.cloud/ からクライアント資格情報を取得します。
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// PdfApiのインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 入力PDFファイルのパス
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// PDFファイルの内容をStreamインスタンスに読み込む
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// クラウドストレージ内のファイル名
String fileNameinStorage = "MyUploaded.pdf";
try
{
// PDFをクラウドストレージにアップロードする
pdfApi.UploadFile(fileNameinStorage, fs);
// ドキュメント変換を実行する
var response = pdfApi.GetPdfInStorageToHtml(fileNameinStorage, folder: null);
// コンソールに結果を書き込む
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
PDF から HTML へ - クラウド ストレージに保存
このセクションでは、PDF ファイルを HTML に変換し、出力をクラウド ストレージに保存する方法を使用します。この要件を満たすには、以下の手順に従ってください。
- まず、クライアント ID とクライアント シークレットの詳細を引数として渡して、PdfApi クラスのインスタンスを作成します。
- 次に、入力 PDF ファイルを Stream インスタンスに読み取り、.zip 拡張子を持つ出力ファイル名を指定します。
- 3 番目に、UploadFile(…) メソッドを使用して PDF ファイルをクラウド ストレージにアップロードします。
- 最後に、入力PDFファイル名と結果のファイル名を引数として受け取るPutPdfInStorageToHtml(…)メソッドを呼び出します。
- 最後に、コンソールに応答コードを出力します。
// https://dashboard.aspose.cloud/ からクライアント資格情報を取得します。
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// PdfApiのインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 入力PDFファイルのパス
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// PDFファイルの内容をStreamインスタンスに読み込む
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// クラウドストレージ内のファイル名
String fileNameinStorage = "MyUploaded.pdf";
// クラウドストレージ内の結果ファイルの名前
string resFileName = "result.zip";
// ファイルをクラウドストレージにアップロードする
try
{
// ファイルをクラウドストレージにアップロードする
pdfApi.UploadFile(fileNameinStorage, fs);
// PDFからHTMLへの変換を実行し、ファイルをクラウドストレージに保存します
var response = pdfApi.PutPdfInStorageToHtml(fileNameinStorage,resFileName, folder: null);
// コンソールに応答コードを出力する
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
ローカルドライブの PDF から HTML へ - クラウド ストレージに出力
このセクションでは、ローカル ドライブから PDF を読み込み、オンラインで PDF を HTML に変換し、出力をクラウド ストレージに保存する手順について説明します。
- 最初のステップは、クライアント ID とクライアント シークレットを引数として渡しながら、PdfApi のインスタンスを作成することです。
- 次に、クラウド ストレージに保存する入力 PDF と結果の .zip の文字列変数を定義します。
- 3 番目に、入力 PDF をストリーム インスタンスに読み込みます。
- 最後に、PutPdfInRequestToHtml(…) メソッドを呼び出します。このメソッドは、結果のファイル名と PDF を保持するストリームを引数として受け取ります。出力はクラウド ストレージに保存されます。
// https://dashboard.aspose.cloud/ からクライアント資格情報を取得します。
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// PdfApiのインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 入力PDFファイルのパス
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// クラウドストレージ内のファイル名
String resultantFile = "converted.zip";
try
{
using (Stream stream = System.IO.File.OpenRead(inputFile))
{
// PDFからHTMLへの変換を開始する
var response = pdfApi.PutPdfInRequestToHtml(resultantFile, file: stream);
// コンソールに応答コード(成功の場合は200)を出力します。
Console.WriteLine(response);
} // stream ends here
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
結論
この記事では、さまざまな方法で PDF を HTML に変換する手順について説明しました。クラウド ストレージにすでに保存されている PDF ファイルを読み込むだけでなく、ローカル ドライブからファイルを読み込んで HTML 形式に変換することもできました。Aspose.PDF Cloud SDK for .NET は MIT ライセンスの下で配布されており、完全なソース コードは GitHub からダウンロードできます。API の使用中に問題が発生した場合や、関連する質問がある場合は、無料製品サポート フォーラム からお気軽にお問い合わせください。
関連リンク
詳細については、次のリンクにアクセスすることをお勧めします。