pdf به xml

تبدیل PDF به XML با .NET REST API.

در چشم انداز دیجیتال، نیاز به تبدیل PDF به XML (زبان نشانه گذاری توسعه پذیر) ) هرگز به این اندازه انتقادی نبوده است. اگرچه PDF در حفظ قالب و به اشتراک گذاری عالی است، اما اغلب در هنگام استخراج و ساختار داده ها با چالش مواجه می شود. در حالی که از سوی دیگر، XML یک زبان نشانه گذاری همه کاره است که برای سازماندهی، ذخیره و انتقال داده ها طراحی شده است. با تبدیل فایل‌های PDF به XML، شکاف بین محتوای بدون ساختار و داده‌های ساخت‌یافته را پر می‌کنیم و برنامه‌های زیادی را از تجزیه و تحلیل داده‌ها تا قابلیت استفاده مجدد محتوا را قادر می‌سازیم.

بیایید به جزئیات نحوه تبدیل PDF به XML با استفاده از NET REST API بپردازیم.

REST API برای تبدیل PDF به XML

با استفاده از قابلیت‌های [Aspose.PDF Cloud SDK for .NET] (https://products.aspose.cloud/pdf/net/)، تبدیل یکپارچه و مؤثر می‌شود. فراتر از تبدیل PDF به XML، این SDK قدرتمند طیفی از قابلیت ها را ارائه می دهد - از دستکاری سند تا استخراج داده ها. بیایید روند تبدیل PDF به XML را بررسی کنیم تا روشی را که داده‌های سند را مدیریت و استفاده می‌کنیم متحول کنیم.

لطفاً «Aspose.PDF-Cloud» را در NuGet packages manager در داخل Visual Studio IDE جستجو کنید و روی دکمه «افزودن بسته» کلیک کنید تا مرجع SDK به پروژه اضافه شود.

همچنین باید اعتبار مشتری خود را از [داشبورد ابری] (https://dashboard.aspose.cloud/) دریافت کنید. در صورتی که حساب موجود ندارید، به سادگی با دنبال کردن دستورالعمل‌های مشخص شده در [راه اندازی سریع] (https://docs.aspose.cloud/total/getting-started/quickstart/) یک حساب رایگان ایجاد کنید.

تبدیل فایل PDF به XML در C#.NET را توسعه دهید

لطفاً دستورالعمل‌های داده شده زیر را برای تبدیل یک فایل PDF به XML برای نمایش ساختار یافته داده‌ها دنبال کنید.

// برای مثال‌های بیشتر، https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// اعتبار مشتری را از https://dashboard.aspose.cloud/ دریافت کنید
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// یک نمونه از PdfApi ایجاد کنید
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

if (response != null)
{
    Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");


// روش سفارشی برای ذخیره محتوای جریان در فایل در درایو محلی
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}

در زیر جزئیات سریع مربوط به قطعه کد ذکر شده در بالا ارائه شده است.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

یک شی از کلاس PdfApi ایجاد کنید، در حالی که اعتبار مشتری را به عنوان آرگومان ورودی ارسال می کنید.

pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

اکنون برای تبدیل فایل پی دی اف برچسب گذاری شده به فرمت XML با API تماس بگیرید. سپس از روش سفارشی برای ذخیره خروجی در درایو محلی استفاده می کنیم.

تبدیل PDF به XML با دستورات cURL

هنگام استفاده از Aspose.PDF Cloud API در ارتباط با دستورات cURL، تبدیل از PDF به XML بسیار کارآمد و انعطاف‌پذیر می‌شود. این ترکیب قدرتمند نه تنها فرآیند تبدیل را ساده می کند، بلکه دسترسی به داده ها و قابلیت استفاده را در طیفی از برنامه ها افزایش می دهد. اکنون بیایید جزئیات بیشتری در مورد این تبدیل بررسی کنیم زیرا استخراج، به اشتراک گذاری و تفسیر آسان داده ها را تسهیل می کند.

اولین قدم در این رویکرد، تولید توکن دسترسی JWT است. بنابراین، لطفا دستور زیر را اجرا کنید:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

هنگامی که توکن JWT تولید شد، باید دستور زیر را برای تبدیل یک فایل PDF برچسب گذاری شده به فرمت XML اجرا کنیم. پس از تبدیل، XML حاصل در یک درایو محلی ذخیره می شود.

curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.xml"

«sourceFile» را با نام فایل PDF ورودی که قبلاً در فضای ذخیره‌سازی ابری موجود است جایگزین کنید و «accessToken» را با نشانه دسترسی JWT که در بالا ایجاد شده است جایگزین کنید.

نتیجه

در خاتمه، چه انتخاب کردن Aspose.PDF Cloud SDK برای دات نت و چه با استفاده از دستورات cURL در پشت سر هم با Aspose.PDF Cloud، می‌توانیم به راحتی به هدف خود در تبدیل یکپارچه از فرمت PDF به XML برای استفاده بهتر از داده دست یابیم. بنابراین، صرف نظر از روش انتخاب شده، هر دو رویکرد به عنوان ابزار قدرتمندی هستند و نحوه ساختار و استخراج داده ها از PDF را متحول می کنند.

لینک های مفید

مقالات مرتبط

ما به شدت توصیه می کنیم از وبلاگ های زیر دیدن کنید: