Microsoft Word は、Word ドキュメント (DOC/DOCX) を作成、編集、およびさまざまな形式に変換するために広く使用されています。同様に、Markdown は軽量のマークアップ言語で、フォーマット要素をプレーン テキスト ドキュメントに追加するために使用できます。これは、タグがすべてを台無しにすることなく読めるプレーンテキスト文書ですが、リスト、太字、斜体などのテキスト修飾子を追加する方法がまだあるはずです。したがって、Word文書があり、同等のファイルを作成する必要がある場合Markdown 構文では、手動で作成するのが難しくなります。ただし、プログラムによる解決策で問題を解決できます。この記事では、Java Cloud SDK を使用して単語からマークダウンへのコンバーターを開発する方法について詳しく説明します。
Word から Markdown への変換 API
Aspose.Words Cloud という名前の当社の REST ベースの API は、MS Word ドキュメントの作成、操作、およびさまざまな サポートされているフォーマット への変換操作を実装するための素晴らしいソリューションです。同じドキュメント変換および処理機能を Java アプリケーションに実装するには、REST API のラッパーである Aspose.Words Cloud SDK for Java を使用する必要があります。そのため、SDK 利用の最初のステップでは、pom.xml (maven ビルド タイプ プロジェクト) に次の情報を含めて、Java プロジェクトにその参照を追加する必要があります。
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
SDK 参照がプロジェクトに追加されたら、次の重要なステップは、クラウド ダッシュボード からクライアント資格情報を取得することです。それ以外の場合は、最初に有効なメール アドレスを使用して無料アカウントを登録する必要があります。
JavaでWordからMDへ
このセクションでは、Java コード スニペットを使用して Word を MD 形式に変換する方法の手順と関連する詳細について説明します。入力 Word ドキュメントをロードするための 2 つのオプションを使用します。つまり、クラウド ストレージまたはローカル ドライブから読み込み、それを Markdown 形式に変換します。
ローカル ドライブから Word 文書を読み込む
- まず、WordsApi のインスタンスを作成し、パーソナライズされた資格情報を引数として渡します。
- 次に、Files.readAllBytes(…) メソッドを使用して入力 Word 文書の内容を読み取り、byte[] 配列で戻り値を取得します。
- 3 番目に、入力 Word ファイル、MD 形式、および結果の Markdown ファイルの名前を引数として受け取る ConvertDocumentRequest のオブジェクトを作成します。
- ここで、Word から MD への変換のためにメソッド convertDocument(…) を呼び出します。結果の Markdown は応答ストリームとして返され、byte[] インスタンスに保存されます
- 最後に、結果の Markdown をローカル ドライブに保存するために、FileOutputStream のオブジェクトを作成し、その write(…) メソッドを使用します。
// その他のコード スニペットについては、https://github.com/aspose-words-cloud/aspose-words-cloud-java をご覧ください。
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// baseUrl が null の場合、WordsApi はデフォルトの https://api.aspose.cloud を使用します
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// ローカル システムから Word 文書を読み込む
File file1 = new File("sample_EmbeddedOLE.docx");
// 入力ワード文書の内容を読む
byte[] documentStream = Files.readAllBytes(file1.toPath());
// 結果のファイル形式
String format = "md";
// 結果のファイル名を提供するドキュメント変換リクエストを作成します
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// 単語からマークダウンへの変換を実行し、出力をバイト配列に保存します
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// 結果のマークダウン ドキュメントをローカル ドライブに保存する
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
sampleEmbeddedOLE.docx から入力 Word ドキュメントをダウンロードすることを検討してください。
クラウド ストレージから Word 文書を読み込む
- 同様に、最初に WordsApi のインスタンスを作成し、パーソナライズされた資格情報を引数として渡す必要があります
- 次に、入力 Word ファイル名、MD 形式、および結果の Markdown ファイル名を引数として受け取る GetDocumentWithFormatRequest のオブジェクトを作成します。
- 最後に、Word から Markdown への変換操作をトリガーするメソッド getDocumentWithFormat(..) を呼び出します。結果のMDファイルはクラウドストレージに保存されます
// その他のコード スニペットについては、https://github.com/aspose-words-cloud/aspose-words-cloud-java をご覧ください。
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// baseUrl が null の場合、WordsApi はデフォルトの https://api.aspose.cloud を使用します
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// GetDocumentWithFormatRequest の新しいオブジェクトを作成する
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// メソッドを呼び出して、変換操作を開始します
// 結果のファイルはクラウドストレージに保存されます
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
cURL コマンドを使用した DOC から Markdown への変換
また、REST API は、cURL コマンドを使用して任意のプラットフォームからアクセスできる柔軟性も提供します。したがって、このセクションでは、クラウドストレージからWord文書をロードし、DOCXからMarkdownへの変換を実行し、結果のMDファイルをローカルドライブに保存する方法について詳しく説明します.まず、次のコマンドを使用して (クライアント資格情報に基づいて) JWT アクセス トークンを生成し、DOCX から Markdown への変換を実行する必要があります。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
JWT が生成されたら、次のコマンドを実行して、クラウド ストレージから Word ドキュメントを読み込み、Word から Markdown への変換を実行してください。結果のMDファイルはローカルドライブに保存されます
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
結論
Java を使用してプログラムで Word を Markdown に変換する方法の詳細を学習したこの記事の最後に到達しました。同様に、cURL コマンドを使用して DOCX を Markdown に変換する手順も調べました。
API の機能を調べるもう 1 つのオプションは、Web ブラウザー内の SwaggerUI を使用することです。また、製品ドキュメント を参照することをお勧めします。これは、他のエキサイティングな機能について学ぶためのすばらしい情報源です。 Cloud SDK のソース コードをダウンロードして変更する必要がある場合は、GitHub (MIT ライセンスで公開) で入手できます。最後に、API の使用中に問題が発生した場合は、無料の 製品サポート フォーラム から迅速な解決策を得ることができます。
関連記事
詳細については、次のリンクを参照してください。