htmlからマークダウンへ

オンラインでHTMLをMarkdownに変換

HTML 形式は、大多数のブラウザがこの標準をサポートしているため、Web サイトの主要な形式の 1 つです。一方、Markdown ファイルは、Markdown 言語のいくつかの可能な方言の 1 つを使用して作成されたテキスト ファイルです。プレーン テキストの書式設定を使用しますが、テキストの書式設定方法を指定するインライン テキスト シンボルが含まれています (たとえば、太字テキストの場合は \bold\、斜体、インデント、ヘッダーなどのその他のマークアップ)。 Markdown ファイルでは .MD、.MARKDN、および .MDOWN 拡張子が使用される場合があることに注意してください。「.markdown」および「.md」拡張子が最も一般的な拡張子です。そこでこの記事では、REST API を使用して HTML を Markdown に変換する方法について詳しく説明します。

HTML からマークダウンへの変換 API

Aspose.HTML Cloud は、HTML ファイルを操作する機能を提供する主要な HTML ファイル処理 API です。また、HTML を PDFJPGTIFFXPS、その他の サポートされている形式 に変換する機能もサポートしています。 HTMLをMD形式に変換する機能もサポートしています。 Java 言語を使用して HTML からマークダウンへのコンバーターを開発するには、まず Maven ビルド タイプの pom.xml ファイルに Aspose.HTML Cloud SDK for Java リファレンスを追加する必要があります。

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.8.0</version>
    </dependency>
</dependencies>

インストール後、GitHub または Google アカウントを使用して、Aspose.Cloud ダッシュボード 経由でクラウド サービスに無料のサブスクリプション アカウントを作成してください。または、単純に 新しいアカウントを作成し、クライアント認証情報の詳細を取得します。

Java で HTML を Markdown に変換する

HTML を Markdown に変換するには、以下に指定されている手順に従ってください。

  • まず、Configuration.setAPPSID メソッドと Configuration.setAPIKEY メソッドに対してクライアント資格情報を渡します。
  • 次に、setBasePath(..)、setAuthPath(..)の詳細を設定し、WebKitとしてsetUserAgent(…)を指定します。
  • 3 番目に、setDebug(..) メソッドに true を渡します。
  • 設定後、ConversionApiクラスのオブジェクトを作成してください。
  • 最後に、PutConvertDocumentToMarkdown(…) メソッドを呼び出して HTML を Markdown に変換し、出力をクラウド ストレージに保存します。
// その他の例については、https://github.com/aspose-html-cloud/aspose-html-cloud-java をご覧ください。

try
    {
    // https://dashboard.aspose.cloud/ から ClientID と ClientSecret を取得します。
    String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
    String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
  
    // API呼び出しの詳細
    com.aspose.html.Configuration.setAPP_SID(clientId);
    com.aspose.html.Configuration.setAPI_KEY(clientSecret);
    com.aspose.html.Configuration.setBasePath("https://api.aspose.cloud/v3.0");
    com.aspose.html.Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
    com.aspose.html.Configuration.setUserAgent("WebKit");
    com.aspose.html.Configuration.setDebug(true);
        
    // Aspose.HTML Cloud APIのオブジェクトを作成する
    com.aspose.html.api.ConversionApi htmlApi = new ApiClient().createService(ConversionApi.class);
     	
    // クラウドストレージからのHTMLドキュメント
    String name = "list.html";
    	
    String folder = null; // The folder in the storage. Should exist.
    String storage = "Internal"; // Name of the storage. null
    	
    // 呼び出しの実行を準備する
    retrofit2.Call<okhttp3.ResponseBody> call = htmlApi.PutConvertDocumentToMarkdown(name, "Converted.md", true, folder, storage);
      
    System.out.println("HTML to Markdown conversion sucessfull !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }

cURL コマンドを使用した HTML から MD への変換

Aspose.HTML Cloud は REST アーキテクチャに基づいているため、cURL コマンドを介して簡単にアクセスできます。ここで、前提条件として、クラウド ダッシュボード上のアカウントに対して指定されたクライアント資格情報に基づいて JWT アクセス トークンを生成する必要があります。ここで、次のコマンドを実行して JWT トークンを生成してください。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT トークンを取得したら、次のコマンドを実行して HTML を MD に変換します。

curl -v -X PUT "https://api.aspose.cloud/html/list.html/convert/md?outPath=Converted.md&useGit=false" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

結論

この記事は、Java Cloud SDK を使用して HTML から Markdown へのコンバータを開発する手順を学習するための優れた情報源を提供します。より少ないコード行で、HTML を MD 形式に変換できることがわかりました。 Web ブラウザ内の Swagger UI を通じて API を探索することも検討してください。関連するご質問がある場合、または問題が発生した場合は、無料の テクニカル サポート フォーラム 経由でお気軽にお問い合わせください。

関連記事

詳細については、次の記事を参照することを強くお勧めします。