Python Cloud SDK を使用して PDF から Excel へのコンバーターを開発します。

PDFをExcelに変換する

PDF を Excel に変換する方法 | Python SDK を使用して PDF を Excel にエクスポートする

PDF ファイルは文書の書式設定を保持するのに優れていますが、そこからデータを抽出して利用するのは複雑になる場合があります。ここで、PDF を Excel に変換する必要性が明らかになります。Excel ワークブックは、スプレッドシート形式を使用して、データを整理して処理するための構造化された方法を提供します。PDF から表、図、テキストをシームレスに抽出し、Excel セルに整理して分析できるようにすることを想像してください。この変換により、データ処理が簡素化されるだけでなく、効率と生産性が向上します。

さらに、Excel は主に、収益、給与、会計情報などのデータを保存および整理するために使用されます。Excel を使用すると、ユーザーはこれらのデータを使用して計算を行い、グラフやチャートを作成できます。この記事では、PDF を Excel 形式に変換する方法について詳しく説明します。

PDF 処理用の Python クラウド SDK

Aspose.PDF Cloud SDK for Python は、PDF から XLS への変換プロセスを効率化する強力なツールとして登場しました。シームレスな「PDF から Excel」への変換を可能にするだけでなく、他のさまざまな機能も提供します。PDF を操作し、特定のデータを抽出し、Excel 対応のファイルを簡単に生成する機能を活用できると想像してみてください。

最初のステップは、PIPおよびGitHubリポジトリからダウンロードできるPython Cloud SDKをインストールすることです。最新バージョンのCloud SDKをインストールするには、ターミナル/コマンドプロンプトで次のコマンドを実行してください。

pip install asposepdfcloud

MS ビジュアルスタジオ

Visual Studio IDE 内の Python プロジェクトに参照を直接追加する必要がある場合は、Python 環境ウィンドウで asposepdfcloud をパッケージとして検索してください。インストール プロセスを完了するには、下の画像に番号が付けられた手順に従ってください。

PDFをExcelに保存

画像 1:- Aspose.PDF Cloud SDK for Python パッケージ。

パイチャーム

PyCharm は Python 開発用の人気の IDE です。このセクションでは、Windows プラットフォームでの PyCharm の設定について説明します。

  • [ファイル] メニューをクリックし、[設定…] メニュー項目を選択します。
PyCharmの設定

画像 2:- PyCharm 設定メニュー項目。

  • 左側からプロジェクト ツリーを展開し、Python インタープリター オプションを選択します。
  • 右側のセクションの + (プラス) 記号をクリックし、利用可能なパッケージ ダイアログの検索フィールドに asposepdfcloud と入力します。
  • 次に、「パッケージのインストール」ボタンをクリックします。
PDF を Excel に変換する SDK

画像 3:- Aspose.PDF Cloud for Python パッケージ。

SDK がインストールされると、成功メッセージが表示されます。

PDF から Excel への SDK

画像 4:- Aspose.PDF Cloud for Python がインストールされると、成功メッセージが表示されます。

  • クラウドダッシュボードに既存のアカウントがない場合は、GitHubまたはGoogleの認証情報を使用して無料アカウントを作成できます。ダッシュボードにログインして、パーソナライズされたクライアント認証情報を取得します。
クライアントの資格情報

画像 5: Aspose.Cloud ダッシュボード上のクライアント資格情報。

PythonでPDFをExcelに変換する

Python コード スニペットを使用して PDF を Excel ワークブック (XLSX) に変換するには、以下の手順に従ってください。以下のコード スニペットでは、入力 PDF がクラウド ストレージで使用可能であることが前提となっていることに注意してください。

  • まず、引数としてクライアント ID とクライアント シークレットを指定して、ApiClient クラスのインスタンスを作成します。
  • 次に、ApiClient オブジェクトを引数として受け取る PdfApi クラスのインスタンスを作成します。
  • ここで、入力 PDF の名前と結果の XLSX ファイル名を指定します。
  • 最後に、入力 PDF ファイル、結果の XLSX ファイル名、およびオプションのパラメータを受け取り、統一されたワークシートを生成するメソッド putpdfinstoragetoxlsx(..) を呼び出します。
# その他のコードサンプルについては、https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python をご覧ください。
# クライアントの資格情報については、https://dashboard.aspose.cloud/ をご覧ください。

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # PdfApiClient を引数として渡しながら PdfApi インスタンスを作成します。
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # 結果の Excel ワークブックの名前
        resultant_file_name = 'Resultant.xlsx'
    
        # APIを呼び出してPDFをExcel形式に変換する
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # コンソールにメッセージを出力する(オプション)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
PDFからXLSXへのプレビュー

画像 6: PDF から Excel への変換プレビュー。

上記の例で使用したサンプルファイルは、awesomeTable.pdfおよびResultant.xlsxからダウンロードできます。

cURL コマンドを使用した PDF から XLS への変換

Aspose.PDF Cloud と cURL コマンドを使用すると、合理化された自動化されたアプローチを実現できるため、PDF から XLS への変換は簡単に実行できます。Aspose.PDF Cloud と cURL コマンドを併用することで、変換プロセスが簡素化されるだけでなく、さまざまなワークフローへのシームレスな統合が可能になります。

このアプローチの最初のステップは、クライアントの資格情報に基づいて JSON Web Token (JWT) を生成することです。JWT トークンを生成するには、次のコマンドを実行してください。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT トークンを取得したら、次のコマンドを実行して PDF を XLS 形式に変換してください。

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

結論

結論として、堅牢な Aspose.PDF Cloud SDK for Python を選択するか、cURL コマンドを Aspose.PDF Cloud と併用するかにかかわらず、PDF を Excel 形式に変換するという目的を簡単に達成できます。Aspose.PDF Cloud SDK for Python は、変換以外のさまざまな機能を提供する、包括的で開発者に優しいソリューションを提供します。一方、cURL コマンドを利用すると、多用途でスクリプト化可能なアプローチが提供されます。選択した方法に関係なく、両方のアプローチは強力なツールとして機能し、PDF からデータを構造化して抽出する方法に革命をもたらします。

関連記事

以下の内容について詳しくは、次の記事を参照することをお勧めします。