テキストの検索と置換
テキストの検索と置換という優れた機能により、PDF 編集機能の可能性を最大限に引き出します。ビジネス プロフェッショナル、学生、または PDF ドキュメントを扱う個人にとって、特定のテキストをすばやく検索して置換する機能は非常に重要です。効率的なドキュメント処理のニーズはますます高まっており、強力なツールを自由に使えることが不可欠です。この記事では、Aspose.PDF Cloud SDK for Python を使用して PDF ファイル内のテキストを検索および置換するプロセスについて説明します。

Adobe Acrobat やその他のソフトウェアのダウンロードやインストールは不要で、すべての PDF 処理をクラウドで実行します。

PDF操作クラウドSDK

Aspose.PDF Cloud は、PDF ファイルを効率的に処理し、ドキュメント処理タスクを効率化するための幅広い機能を提供する強力な SDK です。この SDK の優れた機能の 1 つは、PDF ドキュメント内のテキストを検索および置換できることです。Aspose.PDF Cloud SDK for Python の可能性を最大限に活用して、PDF 編集ワークフローに革命を起こしましょう。

したがって、API を使用する最初のステップは、PIP および GitHub リポジトリから無料でダウンロードできる Cloud SDK をインストールすることです。ターミナル/コマンド プロンプトで次のコマンドを実行するだけで、最新バージョンの SDK がシステムにインストールされます。

pip install asposepdfcloud

MS ビジュアルスタジオ

Visual Studio を使用する場合は、Visual Studio プロジェクト内の Python プロジェクトに参照を追加することもできます。Python 環境ウィンドウで asposepdfcloud をパッケージとして検索してください。インストール プロセスを完了するには、下の画像に番号が付けられた手順に従ってください。

Aspose.PDF クラウド Python

画像 1:- Aspose.PDF Cloud SDK for Python パッケージ。

また、クラウド API にアクセスするにはクライアントの認証情報も必要です。これは クラウド ダッシュボード から取得できます。サインアップするか、新しいアカウントの作成 ボタンをクリックして必要な情報を入力します。

クライアントの資格情報

画像 2: Aspose.Cloud ダッシュボード上のクライアント資格情報。

Python を使用したテキストの検索と置換

特定の文字列を検索し、PDF ドキュメント内でその文字列がすべて出現する箇所を置換するには、以下の手順に従ってください。

  • まず、引数としてクライアント ID とクライアント シークレットを指定して、ApiClient クラスのインスタンスを作成します。
  • 次に、ApiClient オブジェクトを入力引数として受け取る PdfApi クラスのインスタンスを作成します。
  • 入力 PDF ドキュメントを指定する変数を作成します。
  • 次に、テキスト置換プロパティを定義する TextReplaceListRequest のオブジェクトを作成します。
  • 最後に、postdocumenttextreplace(..) メソッドを呼び出して検索と置換操作を開始し、結果をクラウド ストレージに保存します。
def findAndReplaceText():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # PdfApiClient を引数として渡しながら PdfApi インスタンスを作成します。
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'URL2PDF.pdf'
        
        # 置換テキストのプロパティ
        text_Replace_Request = asposepdfcloud.TextReplaceListRequest 
        {
          "TextReplaces": [
            {
              "OldValue": "Productivity",
              "NewValue": "Increased Productivity",
             # 「正規表現」: 真、
              "TextState": {
                "FontSize": 0,
                "Font": "Arial",
                "ForegroundColor": {
                  "A": 0,
                  "R": 252,
                  "G": 240,
                  "B": 3
                },
                "BackgroundColor": {
                  "A": 0,
                  "R": 252,
                  "G": 3,
                  "B": 248
                },
                "FontStyle": "Regular"
              },
              "Rect": {
                "LLX": 0,
                "LLY": 0,
                "URX": 0,
                "URY": 0
              }
            }
          ],
          "DefaultFont": "Arial",
          "StartIndex": 0,
          "CountReplace": 0
        }

        # PDF文書内のテキストを置換するAPIを呼び出す
        response = pdf_api.post_document_text_replace(name = input_file, text_replace = text_Replace_Request)
        print(response)
        # コンソールにメッセージを出力する(オプション)
        print('Text successfully Replaced in PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
テキスト置換出力プレビュー

画像 3: テキスト置換出力のプレビュー。

上記のコード スニペットでは、StartIndex と CountReplace という 2 つのパラメータに特に注意してください。StartIndex は、テキスト置換操作が開始される特定のテキストの出現を定義し、CountReplace は置換する必要があるテキストの出現を定義します。下の画像では、インデックス 2 から始まる製品ファミリ文字列の 2 つの出現のみが更新されていることに注意してください。

文字列置換の2つの出現

画像 4: 文字列の 2 つの出現が置換されます。

参考までに、入力URL2PDF.pdfと結果Text-Replace-Output.pdfを添付しました。

cURL コマンドを使用してテキストを検索および置換する

Aspose.PDF Cloud SDK for Python を使用するだけでなく、cURL コマンドの柔軟性を活用して PDF ドキュメント内のテキスト置換を実行することもできます。cURL は、HTTP 要求を行って Web サービスとやり取りできるコマンド ライン ツールであり、Aspose.PDF Cloud API と統合するための多目的なオプションです。cURL コマンドを使用すると、API エンドポイントに簡単に要求を送信し、「テキストの置換」機能を使用して特定のテキスト パターンを検索し、新しいコンテンツに置き換えることができます。

ここで、以下のコマンドを実行して JWT トークンを生成してください。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

パーソナライズされた JWT トークンを生成したので、次の cURL コマンドを実行して PDF ドキュメント内の生産性文字列を置き換え、更新されたドキュメントを同じクラウド ストレージに保存する必要があります。

curl -X POST "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/text/replace" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-H  "Content-Type: application/json" \
-d "{  \"TextReplaces\": [    {      \"OldValue\": \"Product Family\",      \"NewValue\": \"Product Families\",      \"Regex\": true,      \"TextState\": {        \"FontSize\": 0,        \"Font\": \"Arial\",        \"ForegroundColor\": {          \"A\": 0,          \"R\": 252,          \"G\": 240,          \"B\": 3        },        \"BackgroundColor\": {          \"A\": 0,          \"R\": 252,          \"G\": 3,          \"B\": 248        },        \"FontStyle\": \"Regular\"      },      \"Rect\": {        \"LLX\": 0,        \"LLY\": 0,        \"URX\": 0,        \"URY\": 0      }    }  ],  \"DefaultFont\": \"Arial\",  \"StartIndex\": 2,  \"CountReplace\": 2}"

結論

結論として、PDF ドキュメント内のテキストを検索および置換する機能は、ドキュメント処理ワークフローを大幅に強化できる貴重な機能です。Aspose.PDF Cloud SDK for Python のパワーと cURL コマンドの利便性により、PDF ファイル内のテキスト置換タスクをシームレスに実行するために必要なツールが手に入ります。特定のキーワードを更新する必要がある場合、プレースホルダーを変更する必要があるか、複数のドキュメントにわたって一括変更を行う必要がある場合、これらのソリューションは柔軟性、効率性、および統合の容易さを提供します。Aspose.PDF Cloud SDK for Python の機能を活用するか、cURL コマンドを使用することで、テキスト置換操作を自動化し、生産性を向上させ、正確で一貫性のある結果を得ることができます。今日からこれらの強力なツールを活用し、PDF ドキュメント処理の可能性を解き放ちましょう。

便利なリンク

関連記事

詳細については、次のリンクにアクセスすることをお勧めします。