Một số lượng lớn tài liệu được tạo ra ở Định dạng Tài liệu Di động (PDF) vì nó bảo toàn định dạng tài liệu trên mọi nền tảng (máy tính để bàn hoặc thiết bị di động).Tuy nhiên, chúng ta không thể trực tiếp sửa đổi các tệp PDF và vì mục đích đó, chúng ta cần sử dụng một số phần mềm xử lý PDF bao gồm chi phí cài đặt và cấp phép. Do đó, một trong những giải pháp khả thi là chuyển đổi PDF sang định dạng Word.
- API chuyển đổi PDF sang Word
- PDF sang DOC trong C#
- Chuyển đổi sang Word - Lưu đầu ra trong bộ nhớ đám mây
- PDF sang Word DOC sử dụng lệnh cURL
API chuyển đổi PDF sang Word
Aspose.PDF Cloud là một API dựa trên REST tuyệt vời cung cấp khả năng tạo, thao tác và hiển thị các tệp PDF thành DOC, DOCX, XLSX, PPTX, HTML, v.v. Nhờ kiến trúc REST, nó có thể được sử dụng trên mọi nền tảng bao gồm máy tính để bàn, web, thiết bị di động và mọi hệ điều hành như Windows, macOS, Linux, v.v. Vì vậy, để chuyển đổi PDF sang Word trong ứng dụng .NET, có thể sử dụng Aspose.PDF Cloud SDK cho .NET.
Vui lòng thực hiện lệnh sau trong trình quản lý gói NuGet để cài đặt bản phát hành SDK mới nhất.
Install-Package Aspose.Pdf-Cloud
Tham chiếu trong Visual Studio
Chúng ta cũng có thể thêm SDK trực tiếp vào dự án Visual Studio. Do đó, hãy mở rộng cây dự án trong Solution Explorer, nhấp chuột phải vào thư mục Packages và chọn tùy chọn Manage NuGet Packages… từ menu ngữ cảnh. Tìm kiếm Aspose.PDF Cloud trong trường tìm kiếm, bật hộp kiểm bên cạnh tên gói và nhấp vào nút Add Package
Trong trường hợp bạn không có tài khoản trên Bảng điều khiển Aspose.Cloud, vui lòng tạo một tài khoản miễn phí bằng tài khoản GitHub hoặc Google hiện có của bạn hoặc nhấp vào nút Tạo tài khoản mới. Nhận Thông tin xác thực khách hàng được cá nhân hóa của bạn vì chúng sẽ được yêu cầu trong các phần sau.
PDF sang DOC trong C#
Vui lòng làm theo các bước được chỉ định bên dưới để thực hiện chuyển đổi tệp PDF sang định dạng tài liệu Word (DOC) trong ứng dụng C# .NET. Sau khi chuyển đổi, đầu ra được lưu trữ trong một phiên bản steam có thể được lưu sau đó trên hệ thống cục bộ.
- Đầu tiên, xác định thông tin chi tiết về Client ID và Client Secret bằng cách sử dụng các đối tượng chuỗi.
- Thứ hai, khởi tạo đối tượng PdfApi trong khi truyền Client ID và Client Secret làm đối số.
- Thứ ba, đọc nội dung tệp và tải lên bộ nhớ đám mây bằng phương thức UploadFile(…) của PdfApi.
- Bây giờ chúng ta cần gọi phương thức GetPdfInStorageToDoc(…) để lấy tham chiếu tệp PDF từ bộ nhớ đám mây và các tham số tùy chọn khác như định dạng, maxDistanceBetweenTextLines, chế độ chuyển đổi, v.v.
- Vì đầu ra nằm trong phiên bản Steam nên chúng ta có thể sử dụng phương thức File.Create để lưu đầu ra vào ổ đĩa cục bộ.
// lấy thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";
// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// Nhập tên tệp PDF
String inputFile = "HtmlExample1.pdf";
// tải tập tin lên bộ nhớ đám mây
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
var response = pdfApi.UploadFile(inputFile, file );
}
try
{
// gọi phương thức để thực hiện chuyển đổi và lưu đầu ra trong phiên bản luồng
// Chúng tôi đã chỉ định định dạng đầu ra là Docx và chế độ là Flow
// Giá trị chế độ cho phép kiểm soát cách chuyển đổi tài liệu PDF thành tài liệu xử lý văn bản.
var response = pdfApi.GetPdfInStorageToDoc(inputFile,null, format: "Docx",null,null,maxDistanceBetweenTextLines: 2,mode: "Flow", folder: null);
Console.WriteLine(response);
// gọi phương thức để lưu đầu ra trên ổ đĩa cục bộ
saveToDisk(response, "/Users/nshahbaz/Downloads/Converted.docx");
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
// phương pháp lưu nội dung luồng vào tệp trên ổ đĩa cục bộ
public static void saveToDisk(Stream responseStream, String resultantFile)
{
var fileStream = File.Create(resultantFile);
responseStream.Seek(0, SeekOrigin.Begin);
responseStream.CopyTo(fileStream);
fileStream.Close();
}
Vui lòng truy cập các liên kết sau để tải xuống HtmlExample1.pdf và Converted.docx.
Chuyển đổi PDF sang Word - Lưu đầu ra trong bộ nhớ đám mây
Trong phần này, chúng ta sẽ thảo luận về quá trình tải tài liệu PDF từ Cloud storage, thực hiện chuyển đổi sang định dạng Word và lưu đầu ra trong Cloud storage. Vui lòng làm theo hướng dẫn được chỉ định bên dưới để hoàn thành nhiệm vụ này:
- Đầu tiên, tạo một phiên bản của PdfApi bằng cách truyền thông tin chi tiết về Client ID và Client Secret làm đối số.
- Tải tệp PDF từ hệ thống cục bộ và tải lên bộ nhớ đám mây bằng phương thức UploadFile(…) của PdfApi (đây là bước tùy chọn và có thể sử dụng nếu bạn chưa có tệp PDF nào trên bộ nhớ đám mây).
- Tạo một biến chuỗi xác định tên tệp kết quả.
- Cuối cùng, gọi PutPdfInStorageToDoc(…) chấp nhận tên PDF đầu vào, tên tệp đầu ra và các tham số tùy chọn khác.
// lấy thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "caac6e3d4a4724b2feb53f4e460eade3";
string clientID = "4ccf1790-accc-41e9-8d18-a78dbb2ed1aa";
// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// Nhập tên tệp PDF
String inputFile = "HtmlExample1.pdf";
// tải tập tin lên bộ nhớ đám mây
using (var file = System.IO.File.OpenRead("/Users/nshahbaz/Downloads/" +inputFile))
{
var response = pdfApi.UploadFile(inputFile, file );
}
// tên tập tin kết quả
string outputfile = "result.doc";
try
{
// gọi phương thức để thực hiện chuyển đổi và lưu đầu ra trong bộ nhớ đám mây
var response = pdfApi.PutPdfInStorageToDoc(inputFile, outputfile, format: "Doc",folder: null);
// in mã phản hồi trong bảng điều khiển
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
PDF sang Word DOC sử dụng lệnh cURL
Các lệnh cURL là một cơ chế tuyệt vời để truy cập REST API. Vì vậy, trong phần sau, chúng ta sẽ thực hiện chuyển đổi PDF sang Word Doc bằng lệnh cURL. Tuy nhiên, như một điều kiện tiên quyết, bước đầu tiên là tạo JSON Web Token (JWT) dựa trên thông tin chi tiết ClientID và ClientSecret được lấy từ bảng điều khiển Aspose.Cloud. Vui lòng thực hiện lệnh sau trong terminal để tạo mã thông báo JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Sau khi có mã thông báo JWT, chúng ta có thể thực hiện lệnh sau để thực hiện chuyển đổi tệp PDF đã có trong bộ nhớ đám mây. Tài liệu Word kết quả sau đó được lưu trữ trong bộ nhớ đám mây.
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/HtmlExample1.pdf/convert/doc?outPath=converted.docx&addReturnToLineEnd=true&format=DocX&mode=Textbox" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Phần kết luận
Bài viết này đã giải thích các bước để phát triển Trình chuyển đổi PDF sang Word bằng Aspose.PDF Cloud. Chúng tôi đã khám phá các tùy chọn để chuyển đổi PDF sang DOC bằng đoạn mã C#, cũng như chuyển đổi PDF sang Word bằng lệnh cURL. Ngoài chuyển đổi, nó còn cung cấp các tính năng thú vị khác và thông tin chi tiết của chúng có thể được tìm thấy tại Tính năng của Aspose.PDF Cloud.
Vì Cloud SDK của chúng tôi được phát triển theo Giấy phép MIT, nên đoạn mã hoàn chỉnh của chúng có thể được tải xuống từ GitHub. Trong trường hợp bạn gặp bất kỳ sự cố nào khi sử dụng API hoặc có bất kỳ thắc mắc liên quan nào, vui lòng liên hệ qua Diễn đàn hỗ trợ miễn phí.
Bài viết liên quan
Chúng tôi cũng khuyên bạn nên truy cập vào các liên kết sau để tìm hiểu thêm về: