
Aspose.Words Cloud 可让您将 Word 文档(包括 DOC 和 DOCX)转换为 HTML 文件格式。当您想要在线显示 Word 文档的内容并使其对搜索引擎友好时,Word 到 HTML 的转换非常有用。附加优势是无需特殊查看器或第三方应用程序即可查看 HTML 文件。Aspose.Words Cloud 提供以下 API 来将 Word 文档转换为 HTML:
| 名称 | 描述 |
| ——- | ———— |
| GetDocumentWithFormat | 将云存储中的文档转换为指定格式。|
| ConvertDocument | 将本地驱动器上的文档转换为指定格式。|
| SaveAs | 将文档转换为目标格式并进行详细设置,并将结果保存至存储。|
Word 到 HTML 的转换
在调用上述 API 之前,您需要在 Aspose Cloud 注册一个帐户,并在 Cloud Dashboard 获取您的 App Key 和 SID。注册后,您将获得丰厚的免费试用机会,以便您可以不受任何评估限制地测试 API。
以下 cURL 示例显示如何将 DOCX 转换为 HTML:
// 首先获取 JSON Web Token 进行身份验证
// 从 https://dashboard.aspose.cloud/ 获取 App Key 和 App SID
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=[APP_SID]&client_secret=[APP_KEY]" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
// cURL 示例:在本地存储上将 DOCX 文档转换为 HTML
curl -v "https://api.aspose.cloud/v4.0/words/convert?format=html" \
-X PUT \
-T DOCXtoHTML.docx \
-H "Content-Type: application/json" \
-H "accept: application/json" \
-H "authorization: Bearer <jwt token>" \
-o DOCXtoHTML.html
此代码片段可高效地将 DOCX 文件转换为 HTML 文件。它不会创建任何额外的图像或样式表。例如,它将 DOCX 文件中的图像转换为 base64 图像,以便您可以获得最高保真度的输出。以下是文件的屏幕截图:
输入 DOCX 文件

输出 HTML 文件(Google Chrome 预览版)

您可以在上面的屏幕截图中注意到 HTML 渲染的质量。
具有详细设置的 Word 到 HTML 转换
PUT /words/{name}/saveAs API 允许您使用详细设置将 Microsoft Word 文档转换为 HTML。以下 cURL 示例生成一个 ZIP 文件作为输出,因为我们已在 HtmlSaveOptions 中将“ZipOutput”设置为“true”。有关 HtmlSaveOptions 的完整列表,请查看 文档。
// 首先获取 JSON Web Token 进行身份验证
// 从 https://dashboard.aspose.cloud/ 获取 App Key 和 App SID
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=[APP_SID]&client_secret=[APP_KEY]" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
// cURL 示例将 DOCX 文档转换为 HTML 并将输出文件保存为 ZIP
curl -v "https://api.aspose.cloud/v4.0/words/DOCXtoHTML.docx/saveAs" \
-X PUT \
-d "{'SaveFormat': 'html', 'FileName': 'DOCXtoHTML.html', 'ZipOutput': true}" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "authorization: Bearer "<jwt token>
生成的 ZIP 文件将包含 HTML 文件和 PNG、JPG 等格式的图像,而不是将它们转换为 base64 图像。让我们看一下比较屏幕截图,其中显示了这些代码片段生成的 HTML 文件的源代码。

此图像上标记的部分阐明了这两种方法的工作原理。左侧将包含数据的图像标签显示为 base64 图像。而从 DOCXtoHTML.zip 捕获的右侧将图像显示为本地 PNG 文件。
HTML 到 Word 的转换
我们已经详细介绍了 Word 到 HTML 的转换。让我们来看看 HTML 到 Word 的转换,这是 Aspose.Words Cloud 的另一个值得一提的功能。它允许您通过指定 URL 将网页转换为 DOCX。cURL 示例非常简单,如下所示:
// 首先获取 JSON Web Token 进行身份验证
// 从 https://dashboard.aspose.cloud/ 获取 App Key 和 App SID
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=[APP_SID]&client_secret=[APP_KEY]" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
// cURL 示例,用于加载网页并将其保存为 docx 格式
curl -v "https://api.aspose.cloud/v4.0/words/loadWebDocument" \
-X PUT \
-d "{ 'LoadingDocumentUrl': 'https://www.le.ac.uk/oerresources/bdra/html/page_09.htm', 'SaveOptions': { 'SaveFormat': 'docx', 'FileName': 'HTMLDocument.docx', 'SaveRoutingSlip': true } }" \
-H "Content-Type: application/json" \
-H "Accept: application/json" \
-H "Authorization: Bearer <jwt token>"
渲染引擎足够高效,可以在 DOCX 文件中生成所见即所得的输出。以下是输出 DOCX 文件的屏幕截图。

标题级别、列表、缩进、格式,一切都已准备就绪,充分说明了渲染引擎的功能。我们希望您会喜欢使用这些简单但功能强大的功能。如有任何疑问或顾虑,请通过 免费支持论坛 与我们联系。我们将竭诚为您服务!
推荐文章
我们强烈建议您阅读以下文章以了解更多信息: