word转html

在 Java 中将 Word 转换为 HTML

在我们的日常生活中,我们不得不处理 Microsoft Word(DOC/DOCX) 文件,既用于个人目的,也用于官方目的。同样,我们可能需要通过 Internet 共享这些文档,并且为了打开/查看这些文档,收件人需要特定的应用程序,例如 MS Word、OpenOffice 等。此外,某些限制性环境可能无权安装任何其他应用程序,因此在这种情况下,将 Word 转换为 HTML 可能是一种可行的解决方案。使用这种方法,我们可以轻松地在网络浏览器中打开 Word 文档(无需安装任何其他软件)。因此,本文将解释如何使用 Java Cloud SDK 将 Word 转换为 HTML 的步骤。

Word 到 HTML 转换 REST API

Aspose.Words Cloud 是一个基于 REST 的解决方案,提供以编程方式创建、编辑 MS Word 文档并将其转换为各种支持的格式 的功能。现在,根据本文的范围,我们将使用 Aspose.Words Cloud SDK for Java,它使我们能够利用 Java 应用程序中的所有 word 文档转换功能。因此,为了使用此 SDK,我们需要通过在 pom.xml(maven 构建类型项目)中包含以下信息来在我们的 Java 项目中添加它的引用。

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

下一个重要步骤是从 Cloud Dashboard 获取您的客户端凭据。如果您尚未注册,则需要先通过有效的电子邮件地址注册一个免费帐户,然后获取您的凭据。

在 Java 中将 Word 转换为 HTML

我们将讨论有关如何使用 Java 代码片段将 Word 转换为 HTML 的步骤及其相关细节。

  • 创建一个 WordsApi 对象,我们在其中将个性化凭据作为参数传递
  • 现在使用 readAllBytes(…) 方法加载输入的 Word 文档内容,并在 byte[] 数组中获取返回值
  • 下一步是创建一个 ConvertDocumentRequest 类的对象,它以输入的 Word 文件、HTML 格式和结果文件名作为参数
  • 最后,调用方法convertDocument(…) 执行Word 到HTML 的转换。转换成功后,生成的 HTML 文档存储在云存储中
// 更多代码片段,请访问 https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// 如果 baseUrl 为 null,WordsApi 使用默认的 https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // 从本地系统加载word文档
        File file1 = new File("test_multi_pages.docx");

        // 读取输入的word文档内容
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // 结果文件格式
        String format = "html";

        // 在我们提供结果文件名的地方创建文档转换请求
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, "output.html",null, null, null);
  
        // 执行 word 到 html 的转换
        wordsApi.convertDocument(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
word转html

图片:- Word 到 HTML 文档转换预览

上例中使用的示例 Word 文档可以从 testmultipages.docx 下载。

使用 cURL 命令将 DOCX 转换为 HTML

REST API 提供了在任何平台上通过 cURL 命令进行访问的便利性。因此,在本节中,我们将讨论有关如何使用 cURL 命令将 DOCX 转换为 HTML 的详细信息。因此,第一步是使用以下命令生成 JWT 访问令牌(基于客户端凭据)。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

现在我们需要执行以下命令来执行 Word 到 HTML 的转换,其中输入的 Word 文档预计在云存储中可用,转换后,我们将把生成的 HTML 文档保存在本地驱动器上。

curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.html"

我们还可以将生成的文件直接保存在云存储中,因此,我们只需要为 outPath 参数提供值(如下所示)

curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html&outPath=output.html" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

结论

现在我们已经到了本文的结尾,我们了解了有关如何使用 Java 以编程方式将 Word 转换为 HTML 的详细信息。我们还看到了通过 cURL 命令将 DOCX 转换为 HTML 的选项。为了快速测试,您还可以尝试在 Web 浏览器中通过 SwaggerUI 访问 API,同时,您可以考虑浏览 产品文档,这是一个了不起的信息来源。

如果您需要下载和修改 Cloud SDK 的源代码,可以在 GitHub(根据 MIT 许可发布)上免费获得。最后,如果您在使用 API 时遇到任何问题或有任何相关疑问,您可以考虑通过免费的 产品支持论坛 联系我们寻求快速解决方案。

相关文章

请访问以下链接以了解更多信息: