pdf sang xml

Chuyển đổi PDF sang XML bằng .NET REST API.

Trong bối cảnh kỹ thuật số, nhu cầu chuyển đổi PDF sang XML (Ngôn ngữ đánh dấu mở rộng) chưa bao giờ cấp thiết hơn thế. Mặc dù PDF rất tuyệt vời trong việc bảo toàn định dạng và chia sẻ, nhưng nó thường đặt ra thách thức khi trích xuất và cấu trúc dữ liệu. Mặt khác, XML là ngôn ngữ đánh dấu đa năng được thiết kế để sắp xếp, lưu trữ và vận chuyển dữ liệu. Bằng cách chuyển đổi PDF sang XML, chúng tôi thu hẹp khoảng cách giữa nội dung phi cấu trúc và dữ liệu có cấu trúc, cho phép vô số ứng dụng, từ phân tích dữ liệu đến khả năng tái sử dụng nội dung.

Chúng ta hãy cùng tìm hiểu chi tiết về cách chuyển đổi PDF sang XML bằng .NET REST API.

REST API để chuyển đổi PDF sang XML

Tận dụng khả năng của Aspose.PDF Cloud SDK cho .NET, quá trình chuyển đổi trở nên liền mạch và hiệu quả. Không chỉ chuyển đổi PDF sang XML, SDK mạnh mẽ này còn cung cấp nhiều khả năng khác—từ thao tác tài liệu đến trích xuất dữ liệu. Hãy cùng khám phá quy trình chuyển đổi PDF sang XML để cách mạng hóa cách chúng ta xử lý và sử dụng dữ liệu tài liệu.

Vui lòng tìm kiếm Aspose.PDF-Cloud trong trình quản lý gói NuGet bên trong Visual Studio IDE và nhấp vào nút Thêm gói để tham chiếu SDK được thêm vào dự án.

Bạn cũng cần lấy thông tin xác thực của khách hàng từ bảng điều khiển đám mây.Trong trường hợp bạn chưa có tài khoản, chỉ cần tạo một tài khoản miễn phí bằng cách làm theo hướng dẫn được chỉ định trong khởi động nhanh.

Phát triển công cụ chuyển đổi tệp PDF sang XML trong C# .NET

Vui lòng làm theo hướng dẫn bên dưới để chuyển đổi tệp PDF sang XML để biểu diễn dữ liệu có cấu trúc.

// Để biết thêm ví dụ, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Nhận thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

if (response != null)
{
    Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");


// Phương pháp tùy chỉnh để lưu nội dung luồng vào tệp trên ổ đĩa cục bộ
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}

Dưới đây là thông tin chi tiết nhanh về đoạn mã nêu trên.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Tạo một đối tượng của lớp PdfApi trong khi truyền thông tin xác thực của khách hàng làm đối số đầu vào.

pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

Bây giờ, hãy gọi API để chuyển đổi tệp PDF được gắn thẻ sang định dạng XML. Sau đó, chúng tôi sử dụng phương pháp tùy chỉnh để lưu đầu ra vào ổ đĩa cục bộ.

Chuyển đổi PDF sang XML bằng lệnh cURL

Việc chuyển đổi từ PDF sang XML trở nên hiệu quả và linh hoạt đáng kể khi sử dụng Aspose.PDF Cloud API kết hợp với các lệnh cURL. Sự kết hợp mạnh mẽ này không chỉ đơn giản hóa quá trình chuyển đổi mà còn nâng cao khả năng truy cập và khả năng sử dụng dữ liệu trên nhiều ứng dụng. Bây giờ, hãy cùng khám phá thêm một số chi tiết về quá trình chuyển đổi này vì nó tạo điều kiện cho việc trích xuất, chia sẻ và diễn giải dữ liệu dễ dàng.

Bước đầu tiên trong cách tiếp cận này là tạo mã thông báo truy cập JWT. Vì vậy, hãy thực hiện lệnh sau:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Sau khi tạo mã thông báo JWT, chúng ta cần thực hiện lệnh sau để chuyển đổi tệp PDF được gắn thẻ sang định dạng XML. Sau khi chuyển đổi, XML kết quả được lưu trữ trên ổ đĩa cục bộ.

curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.xml"

Thay thế sourceFile bằng tên tệp PDF đầu vào đã có trong bộ nhớ đám mây và thay thế accessToken bằng mã thông báo truy cập JWT được tạo ở trên.

Phần kết luận

Tóm lại, dù lựa chọn Aspose.PDF Cloud SDK mạnh mẽ cho .NET hay sử dụng lệnh cURL song song với Aspose.PDF Cloud, chúng ta có thể dễ dàng đạt được mục tiêu chuyển đổi liền mạch từ định dạng PDF sang XML để tăng cường sử dụng dữ liệu. Vì vậy, bất kể phương pháp nào được chọn, cả hai cách tiếp cận đều là những công cụ mạnh mẽ, cách mạng hóa cách chúng ta cấu trúc và trích xuất dữ liệu từ PDF.

Liên kết hữu ích

Bài viết liên quan

Chúng tôi thực sự khuyên bạn nên ghé thăm các blog sau: