Aspose.OMR Cloud SDK for Java به توسعه‌دهندگان امکان می‌دهد تا به‌صورت مستقیم از برنامه‌های Java با ویژگی‌های تشخیص علامت نوری (OMR) کار کنند. این راهنما نشان می‌دهد چگونه تبدیل PDF به JSON را در Java انجام دهیم، شامل تنظیمات، پیاده‌سازی کد، بهینه‌سازی عملکرد و عیب‌یابی.

تبدیل PDF به JSON - پیش‌نیازها و تنظیمات

قبل از شروع، مطمئن شوید که موارد زیر را دارید:

  • کیت توسعه جاوا (JDK) 8 یا بالاتر نصب شده بر روی ماشین شما.
  • Maven برای مدیریت وابستگی‌ها.
  • یک حساب Aspose Cloud با شناسه مشتری و رمز مشتری.

آخرین نسخه را از این صفحه دانلود کنید.

SDK را از طریق Maven نصب کنید:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-omr-cloud</artifactId>
    <version>23.12</version>
</dependency>

یا از خط فرمان استفاده کنید:

mvn install com.aspose:aspose-omr-cloud

عبارات import زیر را به پروژه Java خود اضافه کنید:

import com.aspose.omr.cloud.ApiClient;
import com.aspose.omr.cloud.Configuration;
import com.aspose.omr.cloud.api.OMRApi;
import com.aspose.omr.cloud.model.*;

شما همچنین باید احراز هویت را پیکربندی کنید:

Configuration.getDefaultApiClient().setBasePath("https://api.aspose.cloud");
Configuration.getDefaultApiClient().setClientId("YOUR_CLIENT_ID");
Configuration.getDefaultApiClient().setClientSecret("YOUR_CLIENT_SECRET");

PDF به JSON در جاوا

کار اصلی این است که یک فایل PDF را به سرویس OMR ارسال کنید و نمایه JSON از داده‌های استخراج‌شده را دریافت کنید. SDK تماس‌های HTTP را انتزاع می‌کند و به شما امکان می‌دهد بر منطق کسب‌وکار تمرکز کنید.

ویژگی‌های کلیدی Aspose.OMR Cloud SDK for Java

  • پردازش OMR با دقت بالا برای برگه‌های پاسخ اسکن‌شده.
  • پشتیبانی پردازش دسته‌ای برای چندین PDF.
  • خروجی مستقیم JSON مناسب برای سرویس‌های پایین‌دستی.
  • بهینه‌سازی حافظه داخلی برای اسناد بزرگ.

بهینه‌سازی عملکرد با Aspose.OMR Cloud SDK برای PDF به JSON

هنگام تبدیل تعداد زیادی PDF یا فایل‌های بسیار بزرگ، موارد زیر را در نظر بگیرید:

  • فعال‌سازی حالت استریمینگ برای جلوگیری از بارگذاری کل PDF در حافظه.
  • افزایش حجم heap JVM (-Xmx2g یا بیشتر) برای بارهای کاری سنگین.
  • استفاده از جریان‌های موازی برای پردازش همزمان فایل‌ها.

مدیریت حافظه برای تبدیل‌های بزرگ PDF با استفاده از Aspose.OMR Cloud SDK

فایل‌های PDF بزرگ می‌توانند باعث OutOfMemoryError شوند. برای کاهش این مشکل:

  • صفحات را به صورت قطعات با استفاده از پارامتر extractPageRange پردازش کنید.
  • پس از استفاده، اشیاء OMRTask را به‌سرعت از بین ببرید.
  • استفاده از ابزارهایی مانند VisualVM برای نظارت بر مصرف حافظه.

عیب‌یابی مشکلات رایج تبدیل PDF به JSON

پیام خطا دلیل محتمل راه حل
401 Unauthorized اعتبارهای نادرست کلاینت شناسه/رمز عبور کلاینت را بررسی کنید و توکن را دوباره تولید کنید
InvalidFileFormat فایل بارگذاری شده PDF نیست اطمینان حاصل کنید که فایل پسوند .pdf دارد و نوع MIME صحیح است
ConversionTimeout فایل بزرگ از زمان‌سنجی پیش‌فرض عبور می‌کند زمان‌سنجی را در تنظیمات ApiClient افزایش دهید

مراحل تبدیل PDF به JSON در Java

  1. مقداردهی اولیه کلاینت OMR: یک نمونه از OMRApi را با استفاده از ApiClient پیکربندی‌شده ایجاد کنید.

    OMRApi omrApi = new OMRApi();
    
  2. بارگذاری فایل PDF: از omrApi.uploadFile برای ارسال PDF به ابر استفاده کنید.
    مستندات: official documentation.
    مرجع API: API reference.

  3. ایجاد یک کار تبدیل: با استفاده از omrApi.createTask، شناسه فایل بارگذاری‌شده و درخواست خروجی JSON را ارسال کنید.

    OMRTaskRequest request = new OMRTaskRequest();
    request.setFileId(uploadedFileId);
    request.setOutputFormat("json");
    OMRTaskResponse task = omrApi.createTask(request);
    
  4. پرس‌و‌جو برای تکمیل کار: به‌طور مکرر omrApi.getTaskStatus(task.getId()) را بررسی کنید تا وضعیت Completed شود.

    while (!omrApi.getTaskStatus(task.getId()).getStatus().equals("Completed")) {
        Thread.sleep(2000);
    }
    
  5. دانلود نتیجه JSON: فایل JSON را با استفاده از omrApi.downloadResult(task.getResultFileId()) دریافت کنید.

    byte[] jsonData = omrApi.downloadResult(task.getResultFileId());
    Files.write(Paths.get("output.json"), jsonData);
    

PDF به JSON در Java - مثال کامل کد

مثال زیر یک تبدیل کامل انتها به انتها از یک فایل PDF محلی به یک سند JSON را با استفاده از Aspose.OMR Cloud SDK for Java نشان می‌دهد.

توجه: این مثال کد، عملکرد اصلی را نشان می‌دهد. قبل از استفاده از آن در پروژه خود، مطمئن شوید مسیرهای فایل (sample.pdf, output.json) را به مکان‌های واقعی خود به‌روز کنید، اطمینان حاصل کنید تمام وابستگی‌های مورد نیاز به‌درستی نصب شده‌اند و به‌طور کامل در محیط توسعه خود تست کنید. اگر با مشکلی مواجه شدید، لطفاً به مستندات رسمی مراجعه کنید یا برای دریافت کمک با تیم پشتیبانی تماس بگیرید.

تبدیل اسناد مبتنی بر ابر از طریق REST API با استفاده از cURL

Aspose.OMR Cloud SDK همچنین یک REST API را ارائه می‌دهد که می‌توان آن را به‌صورت مستقیم با cURL صدا زد. در ادامه مراحل معمول آورده شده است.

1. احراز هویت و دریافت توکن دسترسی

curl -X POST "https://api.aspose.cloud/connect/token" \
     -H "Content-Type: application/x-www-form-urlencoded" \
     -d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET"

2. بارگذاری PDF منبع

curl -X POST "https://api.aspose.cloud/v4.0/omr/files" \
     -H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
     -F "file=@sample.pdf"

3. تبدیل JSON درخواست

curl -X POST "https://api.aspose.cloud/v4.0/omr/tasks" \
     -H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
     -H "Content-Type: application/json" \
     -d '{"fileId":"UPLOADED_FILE_ID","outputFormat":"json"}'

4. دانلود فایل JSON تولید شده

curl -X GET "https://api.aspose.cloud/v4.0/omr/files/RESULT_FILE_ID/content" \
     -H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
     -o output.json

برای جزئیات بیشتر، به مستندات رسمی API مراجعه کنید.

نتیجه‌گیری

تبدیل PDF به JSON در جاوا با استفاده از Aspose.OMR Cloud SDK for Java به سادگی انجام می‌شود. این کتابخانه بارگذاری فایل، پردازش OMR و تولید JSON را مدیریت می‌کند و به توسعه‌دهندگان امکان می‌دهد تا بر یکپارچه‌سازی خروجی در برنامه‌های خود تمرکز کنند. به‌خاطر داشته باشید که برای استفاده در محیط تولید باید یک لایسنس مناسب دریافت کنید؛ می‌توانید لایسنس موقت را از صفحه لایسنس موقت دریافت کنید یا گزینه‌های کامل قیمت‌گذاری را در صفحه محصول بررسی کنید. با نصب SDK، کد بهینه‌سازی‌شده برای عملکرد و مدیریت خطای واضح، می‌توانید به‌صورت قابل اعتماد داده‌های ساختاریافته را از PDFها در مقیاس بزرگ استخراج کنید.

سوالات متداول

چگونه کتابخانه PDF به JSON در جاوا طرح‌های پیچیده فرم را مدیریت می‌کند؟
SDK عناصر بصری PDF را تجزیه می‌کند و آن‌ها را به یک طرح‌واره JSON که سلسله‌مراتب را حفظ می‌کند، نگاشت می‌کند. برای طرح‌های پیچیده، ممکن است نیاز به تنظیم قالب OMR یا پس‌پردازش JSON داشته باشید. برای سفارشی‌سازی قالب به مستندات رسمی مراجعه کنید.

آیا می‌توانم تبدیل PDF به JSON را در جاوا بدون از دست دادن قالب‌بندی انجام دهم؟
بله. تبدیل ساختار منطقی فیلدهای فرم را حفظ می‌کند. در حالی که استایل بصری بخشی از JSON نیست، داده‌های موقعیتی اطمینان می‌دهند که در صورت نیاز می‌توانید چیدمان را بازسازی کنید. برای بهترین روش‌ها به بخش تبدیل PDF به JSON بدون از دست دادن قالب‌بندی در جاوا مراجعه کنید.

آیا پردازش دسته‌ای برای تبدیل PDF به JSON در جاوا پشتیبانی می‌شود؟
به‌طور قطع. API دسته‌ای SDK به شما امکان می‌دهد چندین فایل PDF را در یک درخواست ارسال کنید و پردازش مؤثر پردازش دسته‌ای PDF به JSON در جاوا را فعال کنید. شناسه‌های کار (task IDs) بازگشتی را مدیریت کنید تا هر نتیجه JSON را بازیابی کنید.

بیشتر بخوانید