
PDF から Word へのコンバーター | PDF から DOC への変換 API
PDFは、情報共有に広く使用されているファイル形式の1つです。すべてのプラットフォームとすべてのデバイス(デスクトップ、モバイルなど)でドキュメントの忠実性を維持するため、人気があります。ただし、PDFファイルに変更を加える必要がある場合は、特定のアプリケーションを使用してPDFドキュメントを開いて編集する必要があります。ただし、大量の更新の場合は、PDFファイルをWordドキュメントに変換することが1つの実行可能なソリューションです。また、一括変換には、プログラミングSDKが効果的なソリューションです。この記事では、Python SDKを使用してPDFをWordに変換する方法について詳しく説明します。
ワードプロセッシングAPI
Aspose.Words Cloud は、Word ファイル HTML、JPEG、PNG、およびその他の サポートされているファイル形式 を作成、編集、変換する機能を提供する、受賞歴のある REST ベースの API です。同時に、PDF ドキュメントをロードして MS Word (DOCX、DOC、DOT、RTF、DOCM) または OpenDocument (ODT、OTT) にレンダリングする機能もサポートしています。この変換を実行するために、サードパーティのソフトウェアのダウンロードやインストールは必要ありません。クラウド内のドキュメント処理エンジンを使用してすべての変換を実行します。Python アプリケーション内でドキュメント変換操作を実装するには、クラウド API のラッパーである Aspose.Words Cloud SDK for Python を使用する必要があります。
インストール
SDKはPIPとGitHubからダウンロードできます。コマンドラインターミナルで次のコマンドを実行してSDKをインストールします。
pip install aspose-words-cloud
PyCharm IDE
PyCharm IDE を使用している場合は、プロジェクトの依存関係として SDK を直接追加できます。
ファイル ->設定 ->プロジェクト ->Python インタープリター ->asposewordscloud

画像 1:- PyCharm 設定オプション。

画像 2:- Aspose.Words Python パッケージ。
Python を使用した PDF から Word へのコンバーター
PDF ファイルを Word 形式に変換するには、以下の手順に従ってください。
- まず、ClientID と ClientSecret の詳細を引数として渡しながら、ApiClient オブジェクトを作成する必要があります。
- 次に、ApiClient インスタンスを引数として渡しながら WordsApi のインスタンスを作成します。
- 3 番目に、UploadFileRequest(..) メソッドを使用して PDF ファイルをクラウド ストレージにアップロードします。
- ここで、エクスポート形式として docx を定義する SaveOptionsData オブジェクトのオブジェクトを作成します。
- 次のステップは、PDF ファイル名と SaveOptionsData オブジェクトを引数として受け取る SaveAsRequest のインスタンスを作成することです。
- 最後に、WordsApi クラスの saveas(..) を呼び出して変換操作を実行します。
# その他のサンプルについては、https://github.com/aspose-words-cloud/aspose-words-cloud-python をご覧ください。
# Aspose.Words Python オブジェクトを初期化する
words_api = WordsApi("6185429e-17ce-468d-bb81-a51ac9d96c16","73a07e2fb010f559e482d854fe5a8f49")
# 入力PDF文書
inputFileName = 'awesome_table_in_pdf.pdf'
# 結果の Word 文書の名前
resultantFile = 'Converted.docx'
# PDF文書をクラウドストレージにアップロードする
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open(inputFileName, 'rb'), "", None))
# ドキュメントエクスポートオプション
request_save_options_data = asposewordscloud.SaveOptionsData(save_format='docx', file_name=resultantFile)
# 入力PDF名とWordエクスポートオプションを渡しながらドキュメントSaveAsリクエストを作成します
request = asposewordscloud.models.requests.SaveAsRequest(name=inputFileName,
save_options_data=request_save_options_data,
folder=None)
# 変換操作を開始する
result = words_api.words_api.save_as(request)
# コンソールに結果を印刷する
print("Result {}".format(result))
上記のコードスニペットで使用されているサンプルファイルは、awesometableinpdf.pdfおよびConverted.docxからダウンロードできます。
cURL コマンドを使用して PDF を DOC に変換する
他の REST API と同様に、Aspose.Words Cloud にも cURL コマンド経由でアクセスできます。ただし、API アクセスに進む前に、Aspose.Cloud ダッシュボード で指定されたクライアント資格情報に基づいて JWT アクセス トークンを生成する必要があります。次の cURL コマンドを実行して、JWT アクセス トークンを生成してください。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
これで、次のコマンドを使用して、クラウド ストレージにある PDF ファイルを Word 形式に変換できるようになりました。次のコマンドでは、-o パラメータを使用して出力をローカル ドライブに保存しています。
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o Converted.docx
出力された Word 文書をクラウド ストレージに直接保存する必要がある場合は、次のコマンドを使用してください。次のコマンドの outPath リクエスト パラメータに注意してください。
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx&outPath=newResultant.docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
結論
この記事では、Python API を使用して PDF を Word に変換する方法に関して、Aspose.Words Cloud の優れた機能について説明しました。同様に、cURL コマンドを使用して PDF を DOC またはその他のサポートされている形式にエクスポートする方法についても詳しく説明しました。さらに、Swagger インターフェイス を使用して Web ブラウザー内で API にアクセスすることもできます。さらに、Cloud SDK は MIT ライセンスの下で開発されているため、完全なソース コードは GitHub リポジトリで入手できます。
APIの使用中に問題が発生した場合、または関連する質問がある場合は、無料の製品サポートフォーラムからお問い合わせください。
関連記事
詳細については、次のリンクにアクセスすることをお勧めします。