大量の文書は、すべてのプラットフォーム(デスクトップまたはモバイル)で文書の書式設定が保持されるため、Portable Document Format(PDF)で作成されます。ただし、PDFファイルを直接変更することはできず、そのためにはインストールとライセンスのコストがかかるPDF操作ソフトウェアを使用する必要があります。したがって、実行可能な解決策の1つは、PDFをWord形式に変換することです。
- PDF から Word への変換 API
- C# で PDF を DOC に変換する
- Word に変換 - 出力をクラウド ストレージに保存
- cURL コマンドを使用して PDF を Word DOC に変換する
PDF から Word への変換 API
Aspose.PDF Cloud は、PDF ファイルを作成、操作し、DOC、DOCX、XLSX、PPTX、HTML などにレンダリングする機能を提供する優れた REST ベースの API です。REST アーキテクチャにより、デスクトップ、Web、モバイル、Windows、macOS、Linux などのあらゆるオペレーティング システムを含むあらゆるプラットフォームで使用できます。したがって、.NET アプリケーション内で PDF を Word に変換するには、Aspose.PDF Cloud SDK for .NET を使用できます。
SDK の最新リリースをインストールするには、NuGet パッケージ マネージャーで次のコマンドを実行してください。
Install-Package Aspose.Pdf-Cloud
Visual Studio 内での参照
Visual Studioプロジェクト内にSDKを直接追加することもできます。ソリューションエクスプローラーでプロジェクトツリーを展開し、パッケージフォルダーを右クリックして、コンテキストメニューからNuGetパッケージの管理…オプションを選択します。検索フィールドでAspose.PDF Cloudを検索し、パッケージ名の横にあるチェックボックスをオンにして、パッケージの追加ボタンをクリックします。
Aspose.Cloud ダッシュボード にアカウントがない場合は、既存の GitHub または Google アカウントを使用して無料アカウントを作成するか、新しいアカウントの作成 ボタンをクリックしてください。次のセクションで必要になるので、カスタマイズされたクライアント資格情報を取得してください。
C# で PDF を DOC に変換する
C# .NET アプリケーションで PDF ファイルを Word 文書 (DOC) 形式に変換するには、以下の手順に従ってください。変換後、出力は Steam インスタンスに保存され、後でローカル システムに保存できます。
- まず、文字列オブジェクトを使用してクライアント ID とクライアント シークレットの詳細を定義します。
- 次に、クライアントIDとクライアントシークレットを引数として渡しながらPdfApiオブジェクトを初期化します。
- 3 番目に、ファイルの内容を読み取り、PdfApi の UploadFile(…) メソッドを使用してクラウド ストレージにアップロードします。
- ここで、クラウド ストレージから PDF ファイル参照と、フォーマット、maxDistanceBetweenTextLines、変換モードなどのその他のオプション パラメータを取得する GetPdfInStorageToDoc(…) メソッドを呼び出す必要があります。
- 出力は Steam インスタンス内にあるため、File.Create メソッドを使用して出力をローカル ドライブに保存できます。
// https://dashboard.aspose.cloud/ からクライアント資格情報を取得します。
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";
// PdfApiのインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 入力PDFファイル名
String inputFile = "HtmlExample1.pdf";
// ファイルをクラウドストレージにアップロードする
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
var response = pdfApi.UploadFile(inputFile, file );
}
try
{
// メソッドを呼び出して変換を実行し、出力をストリームインスタンスに保存します。
// 出力形式をDocx、モードをFlowに指定しました。
// モード値を使用すると、PDF ドキュメントをワードプロセッサ ドキュメントに変換する方法を制御できます。
var response = pdfApi.GetPdfInStorageToDoc(inputFile,null, format: "Docx",null,null,maxDistanceBetweenTextLines: 2,mode: "Flow", folder: null);
Console.WriteLine(response);
// 出力をローカルドライブに保存するメソッドを呼び出す
saveToDisk(response, "/Users/nshahbaz/Downloads/Converted.docx");
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
// ストリームコンテンツをローカルドライブ上のファイルに保存する方法
public static void saveToDisk(Stream responseStream, String resultantFile)
{
var fileStream = File.Create(resultantFile);
responseStream.Seek(0, SeekOrigin.Begin);
responseStream.CopyTo(fileStream);
fileStream.Close();
}
HtmlExample1.pdfとConverted.docxをダウンロードするには、次のリンクにアクセスしてください。
PDF を Word に変換 - 出力をクラウド ストレージに保存
このセクションでは、クラウド ストレージから PDF ドキュメントを読み込み、Word 形式に変換して、出力をクラウド ストレージに保存するプロセスについて説明します。このタスクを実行するには、以下の手順に従ってください。
- まず、クライアント ID とクライアント シークレットの詳細を引数として渡して、PdfApi のインスタンスを作成します。
- ローカル システムから PDF ファイルを読み込み、PdfApi の UploadFile(…) メソッドを使用してクラウド ストレージにアップロードします (これはオプションの手順であり、クラウド ストレージに PDF がまだ存在しない場合に使用できます)。
- 結果のファイル名を定義する文字列変数を作成します。
- 最後に、入力PDF名、出力ファイル名、およびその他のオプションパラメータを受け入れるPutPdfInStorageToDoc(…)を呼び出します。
// https://dashboard.aspose.cloud/ からクライアント資格情報を取得します。
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";
// PdfApiのインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 入力PDFファイル名
String inputFile = "HtmlExample1.pdf";
// ファイルをクラウドストレージにアップロードする
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
var response = pdfApi.UploadFile(inputFile, file );
}
// 結果のファイル名
string outputfile = "result.doc";
try
{
// メソッドを呼び出して変換を実行し、出力をクラウドストレージに保存します
var response = pdfApi.PutPdfInStorageToDoc(inputFile, outputfile, format: "Doc",folder: null);
// コンソールに応答コードを出力する
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
cURL コマンドを使用して PDF を Word DOC に変換する
cURL コマンドは、REST API にアクセスするための優れたメカニズムです。次のセクションでは、cURL コマンドを使用して PDF から Word ドキュメントへの変換を実行します。ただし、前提条件として、最初のステップは Aspose.Cloud ダッシュボード から取得した ClientID と ClientSecret の詳細に基づいて JSON Web トークン (JWT) を生成することです。ターミナルで次のコマンドを実行して、JWT トークンを生成してください。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
JWT トークンを取得したら、次のコマンドを実行して、クラウド ストレージにすでに存在する PDF ファイルの変換を実行できます。変換された Word 文書はクラウド ストレージに保存されます。
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/HtmlExample1.pdf/convert/doc?outPath=converted.docx&addReturnToLineEnd=true&format=DocX&mode=Textbox" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
結論
この記事では、Aspose.PDF Cloud を使用して PDF から Word へのコンバーターを開発する手順について説明しました。C# コード スニペットを使用して PDF を DOC に変換するオプションと、cURL コマンドを使用して PDF を Word に変換するオプションを検討しました。変換以外にも、他の魅力的な機能も提供されており、詳細については Aspose.PDF Cloud の機能 を参照してください。
当社のクラウドSDKはMITライセンスに基づいて開発されているため、完全なコードスニペットはGitHubからダウンロードできます。APIの使用中に問題が発生した場合や関連する質問がある場合は、無料サポートフォーラムからお気軽にお問い合わせください。
関連記事
詳細については、次のリンクにアクセスすることをお勧めします。