Aspose.OMR Cloud SDK for Java به توسعهدهندگان امکان میدهد تا بهصورت مستقیم از برنامههای Java با ویژگیهای تشخیص علامت نوری (OMR) کار کنند. این راهنما نشان میدهد چگونه تبدیل PDF به JSON را در Java انجام دهیم، شامل تنظیمات، پیادهسازی کد، بهینهسازی عملکرد و عیبیابی.
تبدیل PDF به JSON - پیشنیازها و تنظیمات
قبل از شروع، مطمئن شوید که موارد زیر را دارید:
- کیت توسعه جاوا (JDK) 8 یا بالاتر نصب شده بر روی ماشین شما.
- Maven برای مدیریت وابستگیها.
- یک حساب Aspose Cloud با شناسه مشتری و رمز مشتری.
آخرین نسخه را از این صفحه دانلود کنید.
SDK را از طریق Maven نصب کنید:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-omr-cloud</artifactId>
<version>23.12</version>
</dependency>
یا از خط فرمان استفاده کنید:
mvn install com.aspose:aspose-omr-cloud
عبارات import زیر را به پروژه Java خود اضافه کنید:
import com.aspose.omr.cloud.ApiClient;
import com.aspose.omr.cloud.Configuration;
import com.aspose.omr.cloud.api.OMRApi;
import com.aspose.omr.cloud.model.*;
شما همچنین باید احراز هویت را پیکربندی کنید:
Configuration.getDefaultApiClient().setBasePath("https://api.aspose.cloud");
Configuration.getDefaultApiClient().setClientId("YOUR_CLIENT_ID");
Configuration.getDefaultApiClient().setClientSecret("YOUR_CLIENT_SECRET");
PDF به JSON در جاوا
کار اصلی این است که یک فایل PDF را به سرویس OMR ارسال کنید و نمایه JSON از دادههای استخراجشده را دریافت کنید. SDK تماسهای HTTP را انتزاع میکند و به شما امکان میدهد بر منطق کسبوکار تمرکز کنید.
ویژگیهای کلیدی Aspose.OMR Cloud SDK for Java
- پردازش OMR با دقت بالا برای برگههای پاسخ اسکنشده.
- پشتیبانی پردازش دستهای برای چندین PDF.
- خروجی مستقیم JSON مناسب برای سرویسهای پاییندستی.
- بهینهسازی حافظه داخلی برای اسناد بزرگ.
بهینهسازی عملکرد با Aspose.OMR Cloud SDK برای PDF به JSON
هنگام تبدیل تعداد زیادی PDF یا فایلهای بسیار بزرگ، موارد زیر را در نظر بگیرید:
- فعالسازی حالت استریمینگ برای جلوگیری از بارگذاری کل PDF در حافظه.
- افزایش حجم heap JVM (
-Xmx2gیا بیشتر) برای بارهای کاری سنگین. - استفاده از جریانهای موازی برای پردازش همزمان فایلها.
مدیریت حافظه برای تبدیلهای بزرگ PDF با استفاده از Aspose.OMR Cloud SDK
فایلهای PDF بزرگ میتوانند باعث OutOfMemoryError شوند. برای کاهش این مشکل:
- صفحات را به صورت قطعات با استفاده از پارامتر
extractPageRangeپردازش کنید. - پس از استفاده، اشیاء
OMRTaskرا بهسرعت از بین ببرید. - استفاده از ابزارهایی مانند VisualVM برای نظارت بر مصرف حافظه.
عیبیابی مشکلات رایج تبدیل PDF به JSON
| پیام خطا | دلیل محتمل | راه حل |
|---|---|---|
401 Unauthorized |
اعتبارهای نادرست کلاینت | شناسه/رمز عبور کلاینت را بررسی کنید و توکن را دوباره تولید کنید |
InvalidFileFormat |
فایل بارگذاری شده PDF نیست | اطمینان حاصل کنید که فایل پسوند .pdf دارد و نوع MIME صحیح است |
ConversionTimeout |
فایل بزرگ از زمانسنجی پیشفرض عبور میکند | زمانسنجی را در تنظیمات ApiClient افزایش دهید |
مراحل تبدیل PDF به JSON در Java
-
مقداردهی اولیه کلاینت OMR: یک نمونه از
OMRApiرا با استفاده ازApiClientپیکربندیشده ایجاد کنید.OMRApi omrApi = new OMRApi(); -
بارگذاری فایل PDF: از
omrApi.uploadFileبرای ارسال PDF به ابر استفاده کنید.
مستندات: official documentation.
مرجع API: API reference. -
ایجاد یک کار تبدیل: با استفاده از
omrApi.createTask، شناسه فایل بارگذاریشده و درخواست خروجی JSON را ارسال کنید.OMRTaskRequest request = new OMRTaskRequest(); request.setFileId(uploadedFileId); request.setOutputFormat("json"); OMRTaskResponse task = omrApi.createTask(request); -
پرسوجو برای تکمیل کار: بهطور مکرر
omrApi.getTaskStatus(task.getId())را بررسی کنید تا وضعیتCompletedشود.while (!omrApi.getTaskStatus(task.getId()).getStatus().equals("Completed")) { Thread.sleep(2000); } -
دانلود نتیجه JSON: فایل JSON را با استفاده از
omrApi.downloadResult(task.getResultFileId())دریافت کنید.byte[] jsonData = omrApi.downloadResult(task.getResultFileId()); Files.write(Paths.get("output.json"), jsonData);
PDF به JSON در Java - مثال کامل کد
مثال زیر یک تبدیل کامل انتها به انتها از یک فایل PDF محلی به یک سند JSON را با استفاده از Aspose.OMR Cloud SDK for Java نشان میدهد.
توجه: این مثال کد، عملکرد اصلی را نشان میدهد. قبل از استفاده از آن در پروژه خود، مطمئن شوید مسیرهای فایل (
sample.pdf,output.json) را به مکانهای واقعی خود بهروز کنید، اطمینان حاصل کنید تمام وابستگیهای مورد نیاز بهدرستی نصب شدهاند و بهطور کامل در محیط توسعه خود تست کنید. اگر با مشکلی مواجه شدید، لطفاً به مستندات رسمی مراجعه کنید یا برای دریافت کمک با تیم پشتیبانی تماس بگیرید.
تبدیل اسناد مبتنی بر ابر از طریق REST API با استفاده از cURL
Aspose.OMR Cloud SDK همچنین یک REST API را ارائه میدهد که میتوان آن را بهصورت مستقیم با cURL صدا زد. در ادامه مراحل معمول آورده شده است.
1. احراز هویت و دریافت توکن دسترسی
curl -X POST "https://api.aspose.cloud/connect/token" \
-H "Content-Type: application/x-www-form-urlencoded" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET"
2. بارگذاری PDF منبع
curl -X POST "https://api.aspose.cloud/v4.0/omr/files" \
-H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
-F "file=@sample.pdf"
3. تبدیل JSON درخواست
curl -X POST "https://api.aspose.cloud/v4.0/omr/tasks" \
-H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
-H "Content-Type: application/json" \
-d '{"fileId":"UPLOADED_FILE_ID","outputFormat":"json"}'
4. دانلود فایل JSON تولید شده
curl -X GET "https://api.aspose.cloud/v4.0/omr/files/RESULT_FILE_ID/content" \
-H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
-o output.json
برای جزئیات بیشتر، به مستندات رسمی API مراجعه کنید.
نتیجهگیری
تبدیل PDF به JSON در جاوا با استفاده از Aspose.OMR Cloud SDK for Java به سادگی انجام میشود. این کتابخانه بارگذاری فایل، پردازش OMR و تولید JSON را مدیریت میکند و به توسعهدهندگان امکان میدهد تا بر یکپارچهسازی خروجی در برنامههای خود تمرکز کنند. بهخاطر داشته باشید که برای استفاده در محیط تولید باید یک لایسنس مناسب دریافت کنید؛ میتوانید لایسنس موقت را از صفحه لایسنس موقت دریافت کنید یا گزینههای کامل قیمتگذاری را در صفحه محصول بررسی کنید. با نصب SDK، کد بهینهسازیشده برای عملکرد و مدیریت خطای واضح، میتوانید بهصورت قابل اعتماد دادههای ساختاریافته را از PDFها در مقیاس بزرگ استخراج کنید.
سوالات متداول
چگونه کتابخانه PDF به JSON در جاوا طرحهای پیچیده فرم را مدیریت میکند؟
SDK عناصر بصری PDF را تجزیه میکند و آنها را به یک طرحواره JSON که سلسلهمراتب را حفظ میکند، نگاشت میکند. برای طرحهای پیچیده، ممکن است نیاز به تنظیم قالب OMR یا پسپردازش JSON داشته باشید. برای سفارشیسازی قالب به مستندات رسمی مراجعه کنید.
آیا میتوانم تبدیل PDF به JSON را در جاوا بدون از دست دادن قالببندی انجام دهم؟
بله. تبدیل ساختار منطقی فیلدهای فرم را حفظ میکند. در حالی که استایل بصری بخشی از JSON نیست، دادههای موقعیتی اطمینان میدهند که در صورت نیاز میتوانید چیدمان را بازسازی کنید. برای بهترین روشها به بخش تبدیل PDF به JSON بدون از دست دادن قالببندی در جاوا مراجعه کنید.
آیا پردازش دستهای برای تبدیل PDF به JSON در جاوا پشتیبانی میشود؟
بهطور قطع. API دستهای SDK به شما امکان میدهد چندین فایل PDF را در یک درخواست ارسال کنید و پردازش مؤثر پردازش دستهای PDF به JSON در جاوا را فعال کنید. شناسههای کار (task IDs) بازگشتی را مدیریت کنید تا هر نتیجه JSON را بازیابی کنید.