在數位領域,需要將 PDF 轉換為 XML(可擴充標記語言) )從未如此重要。儘管 PDF 在保留格式和共享方面非常出色,但在提取和建立資料時往往會帶來挑戰。另一方面,XML 是一種通用標記語言,旨在組織、儲存和傳輸資料。透過將 PDF 轉換為 XML,我們彌合了非結構化內容和結構化資料之間的差距,從而支援從資料分析到內容可重複使用性的大量應用程式。
讓我們深入研究如何使用 .NET REST API 將 PDF 轉換為 XML 的詳細資訊。
用於 PDF 到 XML 轉換的 REST API
利用 Aspose.PDF Cloud SDK for .NET 的功能,轉換變得無縫且有效。除了 PDF 到 XML 的轉換之外,這個強大的 SDK 還提供從文件操作到資料擷取的一系列功能。讓我們探索將 PDF 轉換為 XML 的過程,以徹底改變我們處理和利用文件資料的方式。
請在 Visual Studio IDE 中的 NuGet 套件管理器中搜尋“Aspose.PDF-Cloud”,然後按一下“新增套件”按鈕,以便將 SDK 參考新增至專案。
在 C# .NET 中開發 PDF 到 XML 文件轉換器
請按照下面給出的說明將 PDF 文件轉換為 XML 以實現資料的結構化表示。
// 更多範例,https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples
// 從 https://dashboard.aspose.cloud/ 取得客戶端憑證
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";
// 建立 PdfApi 的實例
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
if (response != null)
{
Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");
// 將流內容儲存到本機磁碟機上的檔案的自訂方法
public static void saveToDisk(Stream responseStream, String resultantFile)
{
var fileStream = File.Create(resultantFile);
responseStream.Seek(0, SeekOrigin.Begin);
responseStream.CopyTo(fileStream);
fileStream.Close();
}
下面給出了有關上述程式碼片段的快速詳細資訊。
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
建立 PdfApi 類別的對象,同時傳遞客戶端憑證作為輸入參數。
pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
現在,呼叫 API 將帶有標籤的 PDF 檔案轉換為 XML 格式。然後我們使用自訂方法將輸出儲存到本機磁碟機。
使用 cURL 指令將 PDF 轉換為 XML
當將 Aspose.PDF Cloud API 與 cURL 命令結合使用時,從 PDF 到 XML 的轉換變得非常有效率且靈活。這種強大的組合不僅簡化了轉換過程,還增強了各種應用程式中的資料可存取性和可用性。現在讓我們進一步探討此轉換的一些細節,因為它有助於輕鬆地提取、共享和解釋資料。
此方法的第一步是產生 JWT 存取令牌。因此,請執行以下命令:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
產生 JWT 令牌後,我們需要執行以下命令將帶有標籤的 PDF 檔案轉換為 XML 格式。轉換後,產生的 XML 儲存在本機磁碟機上。
curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H "authorization: Bearer {accessToken}" \
-o "Converted.xml"
將 sourceFile
替換為雲端儲存中已有的輸入 PDF 檔案的名稱,並將 accessToken
替換為上面產生的 JWT 存取權令牌。
結論
總而言之,無論是選擇強大的 Aspose.PDF Cloud SDK for .NET 還是將 cURL 指令與 Aspose.PDF Cloud 結合使用,我們都可以輕鬆實現從 PDF 無縫轉換為 XML 格式的目標,從而提高資料使用率。因此,無論選擇哪種方法,這兩種方法都是強大的工具,徹底改變了我們從 PDF 中建立和提取資料的方式。
有用的連結
相關文章
我們強烈建議您造訪以下部落格: