管理网络内容通常意味着将丰富的 Microsoft Word Online 文档发布到网站或应用程序上。与手动复制粘贴相比,.NET REST API 可以自动将 Word documents 转换为 HTML,保留结构、样式和图像。

Word to HTML Conversion API

Aspose.Words Cloud SDK for .NET 提供了一种通过 REST 端点和 SDK 轻松执行 DOC 到 HTML 转换的方法。您可以使用几行代码将 DOC 或 DOCX 转换为 HTML,理想用于 CMS 吸收、知识库和静态网站管道。

从 NuGet 安装 .NET SDK:

NuGet\Install-Package Aspose.Words-Cloud

现在,在 Aspose Cloud dashboard 上创建一个免费帐户,并获取您的客户端 ID 和客户端密钥。

将 Word 文档转换为 HTML 的 C# (.NET) 代码

以下是一个最小示例,演示如何使用 C# 将 MS Word 文档转换为 HTML。

  1. 首先,我们需要创建一个 Configuration 对象和 WordsApi 对象。
var config = new Configuration { ClientId = clientID, ClientSecret = clientSecret };
var wordsApi = new WordsApi(config);
  1. 其次,使用 UploadFileRequest 对象将输入的 Word 文档上传到云存储。
var uploadFileRequest = new UploadFileRequest(file, inputFile);
wordsApi.UploadFile(uploadFileRequest);
  1. 创建 ConvertDocumentRequest 类的实例,并调用 GetDocumentWithFormat(…) 方法以启动 Word 文档到 HTML 的转换操作。
var response = new GetDocumentWithFormatRequest(inputFile, format,outPath: resultant);
wordsApi.GetDocumentWithFormat(response);
// 对于完整的示例和数据文件,请访问 
https://github.com/aspose-words-cloud/aspose-words-cloud-dotnet

// 从 https://dashboard.aspose.cloud/ 获取客户端凭据
string clientSecret = "XXXXXXXXXXXX";
string clientID = "XXXXXXX-XXXXXX-XXXXX-be35-ff5c3a6aa4a2";

// 创建配置对象,使用 ClientID 和 Client Secret 详细信息
var config = new Aspose.Words.Cloud.Sdk.Configuration { ClientId = clientID, ClientSecret = clientSecret };
// 初始化 WordsApi 实例
var wordsApi = new WordsApi(config);

// Input PDF file name
String inputFile = "test_multi_pages.docx";

// 结果文件格式
String format = "HTML";

String resultant = "resultantFile.html";

// 将输入的 ODT 文件的内容加载到流实例中
var sourceFile = System.IO.File.OpenRead(inputFile);

// 创建 DocumentWithFormatRequest 请求对象
var response = new ConvertDocumentRequest(requestDocument, format: "HTML", outPath: "resultantFile.html");

// 触发文档操作
wordsApi.ConvertDocument(response);

// 打印成功消息如果转换成功
if (response != null && response.Equals("OK"))
{
    Console.WriteLine("The Word to HTML conversion completed successfully !");
    Console.ReadKey();
}
word to html

Word 文档到 HTML 转换的预览

DOC/DOCX 转换为 HTML 通过 cURL

或者,您也可以考虑使用 cURL 命令将 Word DOC/DOCX 转换为 HTML 格式。 当您寻找一个不依赖平台且不需要编码经验的解决方案时,这种方法是非常高效的。

  1. 生成基于客户端凭证的 JWT 访问令牌:
curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=XXXXX-XXXX-XXXX-be35-ff5c3a6aa4a2&client_secret=CLIENT_SECRET" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"
  1. Convert a Word DOC to HTML format directly from command line interface/terminal.
curl -v "https://api.aspose.cloud/v4.0/words/{sourceFile}?format=html" \
-X GET \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "{resultantFile}"

sourceFile 替换为输入 Word 文档的名称,resultantFile 替换为结果 HTML 的名称,并将 accessToken 替换为上面生成的 JWT 访问令牌。

高级 HTML 导出选项

为了改善质量和搜索引擎优化(SEO),当针对 Word Online 内容管道时:

  • 响应式布局与固定布局:使用嵌入式 CSS 来实现移动友好的 HTML。
  • 图像:导出为 Base64,以便用于单一 HTML 文件或分开文件夹以提高性能。
  • 字体:通过嵌入或提供字体资源来确保字体的准确性。
  • 页面:转换特定页面范围以用于预览或摘要。
  • 清理:后处理 HTML,以移除内联样式,如果您的 CMS 应用全局 CSS。

试用免费的 Word ->HTML 转换器

要快速开始探索此 API 的功能,您可以立即测试 Word 文档到 HTML 的转换工作流程,通过我们的免费在线转换器—上传 DOC/DOCX,获取可发布的 HTML,而无需安装任何东西。因此,请在网页浏览器中尝试我们的 free online DOCX to HTML converter

docx to html online

Word DOCX 到 HTML 转换器应用的预览。

结论

使用 Aspose.Words Cloud SDK for .NET 是以规模快速将 Word 转换为 HTML 的最佳方法。无论您是需要将 DOC 转换为 HTML 以用于 CMS,还是将 DOCX 转换为 HTML 以用于静态网站,或是要自动化从 MS Word Online 工作流程进行 DOC 到 HTML 的转换,Aspose.Words Cloud 都能提供干净、可靠的结果,且代码量最少。

常见问题解答

  1. 如何在线将 Word 转换为 HTML? 使用上面链接的免费应用程序或调用 REST API 以获取您的 DOC/DOCX 文件生成的网页就绪 HTML。

  2. 它会保留图像和样式吗? 是的——启用 Base64 导出为内联资产或将它们单独保存以便更好地缓存。

  3. 这与 Microsoft Word Online 有什么不同吗? Word Online 是微软的编辑器;本指南展示了如何使用 .NET REST API 以编程方式将 Word 导出为 HTML,以进行自动化和 CI/CD。

  4. 我可以批量转换多个 Word 文件吗? 是的—循环遍历 C# 中的文件路径或发送批量 API 请求以处理大型文档集。

推荐文章

我们强烈推荐访问以下博客: