در چشم انداز دیجیتال، نیاز به تبدیل PDF به XML (زبان نشانه گذاری توسعه پذیر) ) هرگز به این اندازه انتقادی نبوده است. اگرچه PDF در حفظ قالب و به اشتراک گذاری عالی است، اما اغلب در هنگام استخراج و ساختار داده ها با چالش مواجه می شود. در حالی که از سوی دیگر، XML یک زبان نشانه گذاری همه کاره است که برای سازماندهی، ذخیره و انتقال داده ها طراحی شده است. با تبدیل فایلهای PDF به XML، شکاف بین محتوای بدون ساختار و دادههای ساختیافته را پر میکنیم و برنامههای زیادی را از تجزیه و تحلیل دادهها تا قابلیت استفاده مجدد محتوا را قادر میسازیم.
بیایید به جزئیات نحوه تبدیل PDF به XML با استفاده از NET REST API بپردازیم.
- REST API برای تبدیل PDF به XML
- تبدیل فایل PDF به XML در C#.NET را توسعه دهید
- تبدیل PDF به XML با دستورات cURL
REST API برای تبدیل PDF به XML
با استفاده از قابلیتهای [Aspose.PDF Cloud SDK for .NET] (https://products.aspose.cloud/pdf/net/)، تبدیل یکپارچه و مؤثر میشود. فراتر از تبدیل PDF به XML، این SDK قدرتمند طیفی از قابلیت ها را ارائه می دهد - از دستکاری سند تا استخراج داده ها. بیایید روند تبدیل PDF به XML را بررسی کنیم تا روشی را که دادههای سند را مدیریت و استفاده میکنیم متحول کنیم.
لطفاً «Aspose.PDF-Cloud» را در NuGet packages manager در داخل Visual Studio IDE جستجو کنید و روی دکمه «افزودن بسته» کلیک کنید تا مرجع SDK به پروژه اضافه شود.
همچنین باید اعتبار مشتری خود را از [داشبورد ابری] (https://dashboard.aspose.cloud/) دریافت کنید. در صورتی که حساب موجود ندارید، به سادگی با دنبال کردن دستورالعملهای مشخص شده در [راه اندازی سریع] (https://docs.aspose.cloud/total/getting-started/quickstart/) یک حساب رایگان ایجاد کنید.
تبدیل فایل PDF به XML در C#.NET را توسعه دهید
لطفاً دستورالعملهای داده شده زیر را برای تبدیل یک فایل PDF به XML برای نمایش ساختار یافته دادهها دنبال کنید.
// برای مثالهای بیشتر، https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples
// اعتبار مشتری را از https://dashboard.aspose.cloud/ دریافت کنید
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";
// یک نمونه از PdfApi ایجاد کنید
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
if (response != null)
{
Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");
// روش سفارشی برای ذخیره محتوای جریان در فایل در درایو محلی
public static void saveToDisk(Stream responseStream, String resultantFile)
{
var fileStream = File.Create(resultantFile);
responseStream.Seek(0, SeekOrigin.Begin);
responseStream.CopyTo(fileStream);
fileStream.Close();
}
در زیر جزئیات سریع مربوط به قطعه کد ذکر شده در بالا ارائه شده است.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
یک شی از کلاس PdfApi ایجاد کنید، در حالی که اعتبار مشتری را به عنوان آرگومان ورودی ارسال می کنید.
pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
اکنون برای تبدیل فایل پی دی اف برچسب گذاری شده به فرمت XML با API تماس بگیرید. سپس از روش سفارشی برای ذخیره خروجی در درایو محلی استفاده می کنیم.
تبدیل PDF به XML با دستورات cURL
هنگام استفاده از Aspose.PDF Cloud API در ارتباط با دستورات cURL، تبدیل از PDF به XML بسیار کارآمد و انعطافپذیر میشود. این ترکیب قدرتمند نه تنها فرآیند تبدیل را ساده می کند، بلکه دسترسی به داده ها و قابلیت استفاده را در طیفی از برنامه ها افزایش می دهد. اکنون بیایید جزئیات بیشتری در مورد این تبدیل بررسی کنیم زیرا استخراج، به اشتراک گذاری و تفسیر آسان داده ها را تسهیل می کند.
اولین قدم در این رویکرد، تولید توکن دسترسی JWT است. بنابراین، لطفا دستور زیر را اجرا کنید:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
هنگامی که توکن JWT تولید شد، باید دستور زیر را برای تبدیل یک فایل PDF برچسب گذاری شده به فرمت XML اجرا کنیم. پس از تبدیل، XML حاصل در یک درایو محلی ذخیره می شود.
curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H "authorization: Bearer {accessToken}" \
-o "Converted.xml"
«sourceFile» را با نام فایل PDF ورودی که قبلاً در فضای ذخیرهسازی ابری موجود است جایگزین کنید و «accessToken» را با نشانه دسترسی JWT که در بالا ایجاد شده است جایگزین کنید.
نتیجه
در خاتمه، چه انتخاب کردن Aspose.PDF Cloud SDK برای دات نت و چه با استفاده از دستورات cURL در پشت سر هم با Aspose.PDF Cloud، میتوانیم به راحتی به هدف خود در تبدیل یکپارچه از فرمت PDF به XML برای استفاده بهتر از داده دست یابیم. بنابراین، صرف نظر از روش انتخاب شده، هر دو رویکرد به عنوان ابزار قدرتمندی هستند و نحوه ساختار و استخراج داده ها از PDF را متحول می کنند.
لینک های مفید
- راهنمای برنامه نویس
- مرجع API
- کد منبع SDK
- تالار گفتمان پشتیبانی رایگان
- [نمایشهای نمایشی زنده] (https://products.aspose.app/pdf/family)
مقالات مرتبط
ما به شدت توصیه می کنیم از وبلاگ های زیر دیدن کنید: