PDFからWordへ

C# .NET を使用して PDF を Word に変換する

大量の文書は、すべてのプラットフォーム(デスクトップまたはモバイル)で文書の書式設定が保持されるため、Portable Document Format(PDF)で作成されます。ただし、PDFファイルを直接変更することはできず、そのためにはインストールとライセンスのコストがかかるPDF操作ソフトウェアを使用する必要があります。したがって、実行可能な解決策の1つは、PDFをWord形式に変換することです。

PDF から Word への変換 API

Aspose.PDF Cloud は、PDF ファイルを作成、操作し、DOCDOCXXLSXPPTXHTML などにレンダリングする機能を提供する優れた REST ベースの API です。REST アーキテクチャにより、デスクトップ、Web、モバイル、Windows、macOS、Linux などのあらゆるオペレーティング システムを含むあらゆるプラットフォームで使用できます。したがって、.NET アプリケーション内で PDF を Word に変換するには、Aspose.PDF Cloud SDK for .NET を使用できます。

SDK の最新リリースをインストールするには、NuGet パッケージ マネージャーで次のコマンドを実行してください。

Install-Package Aspose.Pdf-Cloud

Visual Studio 内での参照

Visual Studioプロジェクト内にSDKを直接追加することもできます。ソリューションエクスプローラーでプロジェクトツリーを展開し、パッケージフォルダーを右クリックして、コンテキストメニューからNuGetパッケージの管理…オプションを選択します。検索フィールドでAspose.PDF Cloudを検索し、パッケージ名の横にあるチェックボックスをオンにして、パッケージの追加ボタンをクリックします。

NuGet パッケージを管理する

画像 1:- NuGet パッケージを管理します。

Aspose.Cloud ダッシュボード にアカウントがない場合は、既存の GitHub または Google アカウントを使用して無料アカウントを作成するか、新しいアカウントの作成 ボタンをクリックしてください。次のセクションで必要になるので、カスタマイズされたクライアント資格情報を取得してください。

C# で PDF を DOC に変換する

C# .NET アプリケーションで PDF ファイルを Word 文書 (DOC) 形式に変換するには、以下の手順に従ってください。変換後、出力は Steam インスタンスに保存され、後でローカル システムに保存できます。

  • まず、文字列オブジェクトを使用してクライアント ID とクライアント シークレットの詳細を定義します。
  • 次に、クライアントIDとクライアントシークレットを引数として渡しながらPdfApiオブジェクトを初期化します。
  • 3 番目に、ファイルの内容を読み取り、PdfApi の UploadFile(…) メソッドを使用してクラウド ストレージにアップロードします。
  • ここで、クラウド ストレージから PDF ファイル参照と、フォーマット、maxDistanceBetweenTextLines、変換モードなどのその他のオプション パラメータを取得する GetPdfInStorageToDoc(…) メソッドを呼び出す必要があります。
  • 出力は Steam インスタンス内にあるため、File.Create メソッドを使用して出力をローカル ドライブに保存できます。
// https://dashboard.aspose.cloud/ からクライアント資格情報を取得します。
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";

// PdfApiのインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// 入力PDFファイル名
String inputFile = "HtmlExample1.pdf";

// ファイルをクラウドストレージにアップロードする
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
    var response = pdfApi.UploadFile(inputFile, file );
}

try
{
    // メソッドを呼び出して変換を実行し、出力をストリームインスタンスに保存します。
    // 出力形式をDocx、モードをFlowに指定しました。 
    // モード値を使用すると、PDF ドキュメントをワードプロセッサ ドキュメントに変換する方法を制御できます。
    var response = pdfApi.GetPdfInStorageToDoc(inputFile,null, format: "Docx",null,null,maxDistanceBetweenTextLines: 2,mode: "Flow", folder: null);
    Console.WriteLine(response);
    
    // 出力をローカルドライブに保存するメソッドを呼び出す
    saveToDisk(response, "/Users/nshahbaz/Downloads/Converted.docx");
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}

// ストリームコンテンツをローカルドライブ上のファイルに保存する方法
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}
PDFからDOCへのプレビュー

画像 1: PDF から DOC への変換プレビュー。

HtmlExample1.pdfConverted.docxをダウンロードするには、次のリンクにアクセスしてください。

PDF を Word に変換 - 出力をクラウド ストレージに保存

このセクションでは、クラウド ストレージから PDF ドキュメントを読み込み、Word 形式に変換して、出力をクラウド ストレージに保存するプロセスについて説明します。このタスクを実行するには、以下の手順に従ってください。

  • まず、クライアント ID とクライアント シークレットの詳細を引数として渡して、PdfApi のインスタンスを作成します。
  • ローカル システムから PDF ファイルを読み込み、PdfApi の UploadFile(…) メソッドを使用してクラウド ストレージにアップロードします (これはオプションの手順であり、クラウド ストレージに PDF がまだ存在しない場合に使用できます)。
  • 結果のファイル名を定義する文字列変数を作成します。
  • 最後に、入力PDF名、出力ファイル名、およびその他のオプションパラメータを受け入れるPutPdfInStorageToDoc(…)を呼び出します。
// https://dashboard.aspose.cloud/ からクライアント資格情報を取得します。
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";

// PdfApiのインスタンスを作成する
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// 入力PDFファイル名
String inputFile = "HtmlExample1.pdf";

// ファイルをクラウドストレージにアップロードする
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
    var response = pdfApi.UploadFile(inputFile, file );
}

// 結果のファイル名
string outputfile = "result.doc";

try
{
    // メソッドを呼び出して変換を実行し、出力をクラウドストレージに保存します
    var response = pdfApi.PutPdfInStorageToDoc(inputFile, outputfile, format: "Doc",folder: null);
    
    // コンソールに応答コードを出力する
    Console.WriteLine(response);
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}  

cURL コマンドを使用して PDF を Word DOC に変換する

cURL コマンドは、REST API にアクセスするための優れたメカニズムです。次のセクションでは、cURL コマンドを使用して PDF から Word ドキュメントへの変換を実行します。ただし、前提条件として、最初のステップは Aspose.Cloud ダッシュボード から取得した ClientID と ClientSecret の詳細に基づいて JSON Web トークン (JWT) を生成することです。ターミナルで次のコマンドを実行して、JWT トークンを生成してください。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT トークンを取得したら、次のコマンドを実行して、クラウド ストレージにすでに存在する PDF ファイルの変換を実行できます。変換された Word 文書はクラウド ストレージに保存されます。

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/HtmlExample1.pdf/convert/doc?outPath=converted.docx&addReturnToLineEnd=true&format=DocX&mode=Textbox" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

結論

この記事では、Aspose.PDF Cloud を使用して PDF から Word へのコンバーターを開発する手順について説明しました。C# コード スニペットを使用して PDF を DOC に変換するオプションと、cURL コマンドを使用して PDF を Word に変換するオプションを検討しました。変換以外にも、他の魅力的な機能も提供されており、詳細については Aspose.PDF Cloud の機能 を参照してください。

当社のクラウドSDKはMITライセンスに基づいて開発されているため、完全なコードスニペットはGitHubからダウンロードできます。APIの使用中に問題が発生した場合や関連する質問がある場合は、無料サポートフォーラムからお気軽にお問い合わせください。

関連記事

詳細については、次のリンクにアクセスすることをお勧めします。