Python SDK を使用して Word を HTML に変換した後、Web で Word 文書を表示する

Word を HTML に変換する

Word を HTML に変換 | Python SDK を使用した Word から HTML への変換

この記事では、Python SDK を使用して Word を HTML に変換する手順を説明します。 Word ドキュメントは、公式および個人情報の共有に広く使用されています。ただし、Web ブラウザーでドキュメントを表示または表示する必要がある場合は、問題が発生します。したがって、賢明な解決策は、Word 文書を HTML 形式に変換することです。

Word から HTML への変換 API

Aspose.Words Cloud は、MS Word、OpenOffice、または WordProcessingML ドキュメントを読み込むことができます。個々の要素レベルで操作したり、これらのファイルを サポートされているファイル形式 に変換したりできます。 Python アプリケーションでドキュメント処理機能を利用するには、Aspose.Words Cloud SDK for Python を使用する必要があります。したがって、SDK を使用するための最初のステップは、PIP および GitHub からダウンロードできるインストールです。コマンド ライン ターミナルで次のコマンドを実行して、SDK をインストールします。

pip install aspose-words-cloud

次のステップは、Aspose.Cloud ダッシュボード にアクセスして無料アカウントを作成し、クラウド ストレージでドキュメントを管理できるようにすることです。

Python を使用して Word を HTML に変換する

以下の手順に従って、ローカル ドライブから Word ドキュメントを読み込み、クラウド ストレージにアップロードしてください。次に、ルーチンを初期化して DOC ファイルを HTML 形式に変換し、出力を同じクラウド ストレージに保存します。

  • まず、クライアント資格情報を使用して WordsApi のインスタンスを作成します。
  • 次に、ローカル ドライブから Word ドキュメントをアップロードし、uploadfile(…) メソッドを使用してクラウド ストレージにアップロードします。
  • ここで、入力 Word ファイルと結果の HTML ドキュメントを定義する GetDocumentWithFormatRequest のインスタンスを作成します。
  • 最後に、メソッド getdocumentwithformat(…) を呼び出して、変換プロセスを開始します
# その他のサンプルについては、https://github.com/aspose-words-cloud/aspose-words-cloud-python にアクセスしてください。
# https://dashboard.aspose.cloud/ からアプリ キーとアプリ SID を取得します。
try:
    # クライアント資格情報
    client_secret = "1c9379bb7d701c26cc87e741a29987bb"
    client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

    # WordsApi のインスタンスを作成する
    words_api = WordsApi(client_id,client_secret)

    # 入力ワード文書名
    inputFileName = 'test_multi_pages.docx'
    resultantFile = 'Converted.html'

    # ソース Word ドキュメントを Cloud Storage にアップロードする
    words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

    # ドキュメント変換用のオブジェクトを作成する
    request = asposewordscloud.models.requests.GetDocumentWithFormatRequest(inputFileName, "HTML", None, None, None,
                                                                                        None, resultantFile, None)
    # Word から JPEG への変換操作を開始する
    result = words_api.get_document_with_format(request)
        
    # コンソールにメッセージを表示 (オプション)
    print('Conversion process completed successfully !')
  except ApiException as e:
    print("Exception while calling WordsApi: {0}".format(e))

上記の例で使用されているサンプル Word 文書は、testmultipages.docx からダウンロードできます。

cURL コマンドを使用した Word から HTML への変換

cURL コマンドを使用して、Word 文書を HTML 形式に変換することもできます。ただし、変換プロセスを開始する前に、個人のクライアント資格情報に基づいて JWT アクセス トークンを作成する必要があります。そのため、次のコマンドを実行して JWT トークンを作成してください。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT トークンが生成されたら、次のコマンドを実行して、サンプルの Word ドキュメントをクラウド ストレージにアップロードする必要があります。

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.docx" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>" \
-H  "Content-Type: multipart/form-data" \
-d {"fileContent":{c:\Users\nayyer\Downloads\test_doc.docx}}

次のコマンドを実行して、Word 文書をクラウド ストレージから HTML 形式に変換し、結果の HTML を同じクラウド ストレージに保存します。

curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=HTML&outPath=Resultant.html" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

結論

この記事では、Python SDK を使用して Word から HTML への変換を実行する手順について説明しました。同様に、cURL コマンドを使用して DOC から HTML、DOCX から HTML への変換を実行するオプションも検討しました。完全な変換プロセスは非常にシンプルでわかりやすいので、ビジネス要件に集中するだけでよく、内部のドキュメント変換の複雑さは忘れてしまいます。 API は、ドキュメント間のすべての変換ルーチンを管理し、結果のコンテンツを返します。 Programmers Guide を調べて、SDK が提供するその他の機能について学習することをお勧めします。さらに、クラウド SDK の完全なソース コードは GitHub からダウンロードでき、要件に応じてダウンロードおよび更新できます。

関連トピック

以下の記事を参照して、以下について学ぶことをお勧めします。