Microsoft Word 广泛用于创建、编辑 Word 文档 (DOC/DOCX) 并将其转换为各种格式。同样,Markdown 是一种轻量级标记语言,您可以使用它向纯文本文档添加格式元素。它是一个纯文本文档,应该是可读的,没有标签会弄乱一切,但仍然应该有添加文本修饰符的方法,如列表、粗体、斜体等。所以如果我们有一个 Word 文档,我们需要创建一个等效的文件在 Markdown 语法中,很难手动创建它。但是,编程解决方案可以解决问题。本文将解释有关如何使用 Java Cloud SDK 开发 word 到 markdown 转换器的所有细节。
Word 到 Markdown 转换 API
我们名为 Aspose.Words Cloud 的基于 REST 的 API 是实现 MS Word 文档创建、操作和转换为各种支持格式 的出色解决方案。现在,为了在 Java 应用程序中实现相同的文档转换和处理功能,我们需要使用 Aspose.Words Cloud SDK for Java,它是 REST API 的包装器。所以在使用SDK的第一步,我们需要通过在pom.xml(maven构建类型项目)中包含以下信息来在我们的Java项目中添加它的引用。
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
在项目中添加 SDK 参考后,下一个重要步骤是从 Cloud Dashboard 获取您的客户端凭据。否则,您需要先使用有效的电子邮件地址注册一个免费帐户。
Java 中的 Word 到 MD
本节解释了我们如何使用 Java 代码片段将 Word 转换为 MD 格式的步骤和相关细节。我们将使用两种选项来加载输入的 Word 文档,即从云存储或本地驱动器,然后将其转换为 Markdown 格式。
从本地驱动器加载 Word 文档
- 首先,创建一个 WordsApi 实例并将个性化凭据作为参数传递
- 其次,使用 Files.readAllBytes(…) 方法读取输入 Word 文档的内容,并在 byte[] 数组中获取返回值
- 第三,创建一个 ConvertDocumentRequest 对象,它将输入的 Word 文件、MD 格式和生成的 Markdown 文件名作为参数
- 现在,调用方法 convertDocument(…) 将 Word 转换为 MD。生成的 Markdown 作为响应流返回,保存到 byte[] 实例中
- 最后,为了将生成的 Markdown 保存到本地驱动器,创建一个 FileOutputStream 对象并使用其 write(…) 方法
// 更多代码片段,请访问 https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// 如果 baseUrl 为 null,WordsApi 使用默认的 https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// 从本地系统加载word文档
File file1 = new File("sample_EmbeddedOLE.docx");
// 读取输入的word文档内容
byte[] documentStream = Files.readAllBytes(file1.toPath());
// 结果文件格式
String format = "md";
// 在我们提供结果文件名的地方创建文档转换请求
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// 执行单词到降价转换并将输出保存在字节数组中
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// 将生成的降价文档保存到本地驱动器
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
您可以考虑从 sampleEmbeddedOLE.docx 下载输入的 Word 文档。
从云存储加载 Word 文档
- 同样,首先我们需要创建一个 WordsApi 实例,同时将个性化凭证作为参数传递
- 其次,创建一个 GetDocumentWithFormatRequest 对象,它以输入的 Word 文件名、MD 格式和生成的 Markdown 文件名作为参数
- 最后,调用 getDocumentWithFormat(..) 方法触发 Word 到 Markdown 的转换操作。生成的 MD 文件保存在云存储中
// 更多代码片段,请访问 https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// 如果 baseUrl 为 null,WordsApi 使用默认的 https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// 现在创建一个新的 GetDocumentWithFormatRequest 对象
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// 现在调用方法启动转换操作
// 结果文件存储在云存储中
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
使用 cURL 命令将 DOC 转换为 Markdown
REST API 还提供了在 cURL 命令的帮助下从任何平台访问的灵活性。因此,在本节中,我们将详细讨论如何从云存储加载 Word 文档,执行 DOCX 到 Markdown 转换并将生成的 MD 文件保存在本地驱动器上。现在首先我们需要使用以下命令生成 JWT 访问令牌(基于客户端凭据),然后执行 DOCX 到 Markdown 的转换。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
生成 JWT 后,请执行以下命令从云存储加载 Word 文档并执行 Word 到 Markdown 转换。然后将生成的 MD 文件存储在本地驱动器上
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
结论
我们已经到达本文的结尾,在那里我们了解了有关如何使用 Java 以编程方式将 Word 转换为 Markdown 的详细信息。同样,我们也探索了通过 cURL 命令将 DOCX 转换为 Markdown 的步骤。
探索 API 功能的另一种选择是通过 Web 浏览器中的 SwaggerUI。我们还建议浏览 产品文档,这是了解其他令人兴奋的功能的绝佳信息来源。如果您需要下载和修改 Cloud SDK 的源代码,可以在 GitHub(根据 MIT 许可发布)上获得。最后,如果您在使用 API 时遇到任何问题,您可以考虑通过免费的 产品支持论坛 联系我们寻求快速解决方案。
相关文章
请访问以下链接以了解更多信息: