PDF sang Word

Chuyển đổi PDF sang Word bằng C# .NET

Một số lượng lớn tài liệu được tạo ra ở Định dạng Tài liệu Di động (PDF) vì nó bảo toàn định dạng tài liệu trên mọi nền tảng (máy tính để bàn hoặc thiết bị di động).Tuy nhiên, chúng ta không thể trực tiếp sửa đổi các tệp PDF và vì mục đích đó, chúng ta cần sử dụng một số phần mềm xử lý PDF bao gồm chi phí cài đặt và cấp phép. Do đó, một trong những giải pháp khả thi là chuyển đổi PDF sang định dạng Word.

API chuyển đổi PDF sang Word

Aspose.PDF Cloud là một API dựa trên REST tuyệt vời cung cấp khả năng tạo, thao tác và hiển thị các tệp PDF thành DOC, DOCX, XLSX, PPTX, HTML, v.v. Nhờ kiến trúc REST, nó có thể được sử dụng trên mọi nền tảng bao gồm máy tính để bàn, web, thiết bị di động và mọi hệ điều hành như Windows, macOS, Linux, v.v. Vì vậy, để chuyển đổi PDF sang Word trong ứng dụng .NET, có thể sử dụng Aspose.PDF Cloud SDK cho .NET.

Vui lòng thực hiện lệnh sau trong trình quản lý gói NuGet để cài đặt bản phát hành SDK mới nhất.

Install-Package Aspose.Pdf-Cloud

Tham chiếu trong Visual Studio

Chúng ta cũng có thể thêm SDK trực tiếp vào dự án Visual Studio. Do đó, hãy mở rộng cây dự án trong Solution Explorer, nhấp chuột phải vào thư mục Packages và chọn tùy chọn Manage NuGet Packages… từ menu ngữ cảnh. Tìm kiếm Aspose.PDF Cloud trong trường tìm kiếm, bật hộp kiểm bên cạnh tên gói và nhấp vào nút Add Package

Quản lý các gói NuGet

Hình ảnh 1:- Quản lý các gói NuGet.

Trong trường hợp bạn không có tài khoản trên Bảng điều khiển Aspose.Cloud, vui lòng tạo một tài khoản miễn phí bằng tài khoản GitHub hoặc Google hiện có của bạn hoặc nhấp vào nút Tạo tài khoản mới. Nhận Thông tin xác thực khách hàng được cá nhân hóa của bạn vì chúng sẽ được yêu cầu trong các phần sau.

PDF sang DOC trong C#

Vui lòng làm theo các bước được chỉ định bên dưới để thực hiện chuyển đổi tệp PDF sang định dạng tài liệu Word (DOC) trong ứng dụng C# .NET. Sau khi chuyển đổi, đầu ra được lưu trữ trong một phiên bản steam có thể được lưu sau đó trên hệ thống cục bộ.

  • Đầu tiên, xác định thông tin chi tiết về Client ID và Client Secret bằng cách sử dụng các đối tượng chuỗi.
  • Thứ hai, khởi tạo đối tượng PdfApi trong khi truyền Client ID và Client Secret làm đối số.
  • Thứ ba, đọc nội dung tệp và tải lên bộ nhớ đám mây bằng phương thức UploadFile(…) của PdfApi.
  • Bây giờ chúng ta cần gọi phương thức GetPdfInStorageToDoc(…) để lấy tham chiếu tệp PDF từ bộ nhớ đám mây và các tham số tùy chọn khác như định dạng, maxDistanceBetweenTextLines, chế độ chuyển đổi, v.v.
  • Vì đầu ra nằm trong phiên bản Steam nên chúng ta có thể sử dụng phương thức File.Create để lưu đầu ra vào ổ đĩa cục bộ.
// lấy thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";

// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Nhập tên tệp PDF
String inputFile = "HtmlExample1.pdf";

// tải tập tin lên bộ nhớ đám mây
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
    var response = pdfApi.UploadFile(inputFile, file );
}

try
{
    // gọi phương thức để thực hiện chuyển đổi và lưu đầu ra trong phiên bản luồng
    // Chúng tôi đã chỉ định định dạng đầu ra là Docx và chế độ là Flow 
    // Giá trị chế độ cho phép kiểm soát cách chuyển đổi tài liệu PDF thành tài liệu xử lý văn bản.
    var response = pdfApi.GetPdfInStorageToDoc(inputFile,null, format: "Docx",null,null,maxDistanceBetweenTextLines: 2,mode: "Flow", folder: null);
    Console.WriteLine(response);
    
    // gọi phương thức để lưu đầu ra trên ổ đĩa cục bộ
    saveToDisk(response, "/Users/nshahbaz/Downloads/Converted.docx");
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}

// phương pháp lưu nội dung luồng vào tệp trên ổ đĩa cục bộ
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}
Xem trước PDF sang DOC

Hình ảnh 1:- Xem trước quá trình chuyển đổi PDF sang DOC.

Vui lòng truy cập các liên kết sau để tải xuống HtmlExample1.pdfConverted.docx.

Chuyển đổi PDF sang Word - Lưu đầu ra trong bộ nhớ đám mây

Trong phần này, chúng ta sẽ thảo luận về quá trình tải tài liệu PDF từ Cloud storage, thực hiện chuyển đổi sang định dạng Word và lưu đầu ra trong Cloud storage. Vui lòng làm theo hướng dẫn được chỉ định bên dưới để hoàn thành nhiệm vụ này:

  • Đầu tiên, tạo một phiên bản của PdfApi bằng cách truyền thông tin chi tiết về Client ID và Client Secret làm đối số.
  • Tải tệp PDF từ hệ thống cục bộ và tải lên bộ nhớ đám mây bằng phương thức UploadFile(…) của PdfApi (đây là bước tùy chọn và có thể sử dụng nếu bạn chưa có tệp PDF nào trên bộ nhớ đám mây).
  • Tạo một biến chuỗi xác định tên tệp kết quả.
  • Cuối cùng, gọi PutPdfInStorageToDoc(…) chấp nhận tên PDF đầu vào, tên tệp đầu ra và các tham số tùy chọn khác.
// lấy thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";

// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Nhập tên tệp PDF
String inputFile = "HtmlExample1.pdf";

// tải tập tin lên bộ nhớ đám mây
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
    var response = pdfApi.UploadFile(inputFile, file );
}

// tên tập tin kết quả
string outputfile = "result.doc";

try
{
    // gọi phương thức để thực hiện chuyển đổi và lưu đầu ra trong bộ nhớ đám mây
    var response = pdfApi.PutPdfInStorageToDoc(inputFile, outputfile, format: "Doc",folder: null);
    
    // in mã phản hồi trong bảng điều khiển
    Console.WriteLine(response);
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}  

PDF sang Word DOC sử dụng lệnh cURL

Các lệnh cURL là một cơ chế tuyệt vời để truy cập REST API. Vì vậy, trong phần sau, chúng ta sẽ thực hiện chuyển đổi PDF sang Word Doc bằng lệnh cURL. Tuy nhiên, như một điều kiện tiên quyết, bước đầu tiên là tạo JSON Web Token (JWT) dựa trên thông tin chi tiết ClientID và ClientSecret được lấy từ bảng điều khiển Aspose.Cloud. Vui lòng thực hiện lệnh sau trong terminal để tạo mã thông báo JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Sau khi có mã thông báo JWT, chúng ta có thể thực hiện lệnh sau để thực hiện chuyển đổi tệp PDF đã có trong bộ nhớ đám mây. Tài liệu Word kết quả sau đó được lưu trữ trong bộ nhớ đám mây.

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/HtmlExample1.pdf/convert/doc?outPath=converted.docx&addReturnToLineEnd=true&format=DocX&mode=Textbox" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Phần kết luận

Bài viết này đã giải thích các bước để phát triển Trình chuyển đổi PDF sang Word bằng Aspose.PDF Cloud. Chúng tôi đã khám phá các tùy chọn để chuyển đổi PDF sang DOC bằng đoạn mã C#, cũng như chuyển đổi PDF sang Word bằng lệnh cURL. Ngoài chuyển đổi, nó còn cung cấp các tính năng thú vị khác và thông tin chi tiết của chúng có thể được tìm thấy tại Tính năng của Aspose.PDF Cloud.

Vì Cloud SDK của chúng tôi được phát triển theo Giấy phép MIT, nên đoạn mã hoàn chỉnh của chúng có thể được tải xuống từ GitHub. Trong trường hợp bạn gặp bất kỳ sự cố nào khi sử dụng API hoặc có bất kỳ thắc mắc liên quan nào, vui lòng liên hệ qua Diễn đàn hỗ trợ miễn phí.

Bài viết liên quan

Chúng tôi cũng khuyên bạn nên truy cập vào các liên kết sau để tìm hiểu thêm về: