PDF به TXT

تبدیل PDF به TXT به صورت آنلاین در جاوا

فایل PDF یکی از فرمت های پرکاربرد برای اشتراک گذاری داده ها و اطلاعات از طریق اینترنت است. با این حال، گاهی اوقات آنها محتوا را با استفاده از فونت های سفارشی تولید می کنند و ممکن است اندازه فایل حاصل افزایش یابد. علاوه بر این، ممکن است نیاز به استخراج محتوای متنی برای پردازش بیشتر داشته باشیم، بنابراین در این سناریو، تبدیل PDF به متن یکی از راه حل های قابل اجرا است. در این مقاله، ما قصد داریم جزئیاتی را در مورد چگونگی تبدیل PDF به فرمت TXT مورد بحث قرار دهیم.

API تبدیل PDF به متن

Aspose.Words Cloud SDK برای جاوا راه حل پیشرو برای پردازش اسناد Word است. این یک راه حل شگفت انگیز است که قابلیت هایی برای ایجاد، ویرایش و تبدیل فایل های مختلف به DOC، HTML، JPEG و [فرمت های پشتیبانی شده] مختلف دیگر را ارائه می دهد. به غیر از اسناد Word، از بارگیری فایل‌های PDF و ذخیره خروجی در TXT، HTML، XPS، TIFF و غیره نیز پشتیبانی می‌کند. اکنون برای استفاده از SDK، لطفاً جزئیات زیر را به pom.xml خود از نوع ساخت Maven خود اضافه کنید.

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://repository.aspose.cloud/repo/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-words-cloud</artifactId>
		<version>22.5.0</version>
	</dependency>
</dependencies>

اکنون باید با مراجعه به Aspose.Cloud dashboard یک حساب کاربری رایگان ایجاد کنیم. به سادگی با استفاده از حساب کاربری GitHub یا Google موجود خود ثبت نام کنید یا روی دکمه ایجاد یک حساب جدید کلیک کنید.

تبدیل PDF به TXT در Java

لطفاً دستورالعمل‌های زیر را دنبال کنید تا نیازهای خود را با استفاده از قطعه کد Java برآورده کنید.

  • ابتدا یک شی از WordsApi با استفاده از Client ID و Client Secret به عنوان پارامتر ایجاد کنید
  • در مرحله دوم، محتوای فایل PDF را از درایو محلی با استفاده از شی File بخوانید
  • ثالثاً، محتوای فایل PDF را با استفاده از نمونه UploadFileRequest بخوانید
  • مرحله بعدی فراخوانی روش uploadFile(…) برای آپلود PDF در فضای ذخیره سازی ابری است
  • اکنون، یک شی از GetDocumentWithFormatRequest (…) ایجاد کنید که در آن فرمت خروجی را به عنوان فرمت TXT تعیین می کنیم.
  • در نهایت، متد getDocumentWithFormat(…) را برای تبدیل PDF به Text و ذخیره خروجی در فضای ذخیره سازی ابری فراخوانی کنید.
// برای نمونه های بیشتر، لطفاً به https://github.com/aspose-words-cloud/aspose-words-cloud-java مراجعه کنید

try
    {
    // ClientID و ClientSecret را از https://dashboard.aspose.cloud/ دریافت کنید
    String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
    String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
  
    // یک شی از WordsApi ایجاد کنید
    // اگر baseUrl null باشد، WordsApi از https://api.aspose.cloud پیش فرض استفاده می کند
    WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

    // محتوای PDF را از درایو محلی بخوانید
    File file = new File("c://input.pdf");
    
    // ایجاد درخواست آپلود فایل
    UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
    
    // آپلود فایل در فضای ذخیره سازی ابری
    wordsApi.uploadFile(uploadRequest);
        
    // ایجاد شی درخواست تبدیل سند
    GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
        
    // برای تبدیل PDF به متن آنلاین با API تماس بگیرید
    wordsApi.getDocumentWithFormat(request);
    
    System.out.println("PDF to TXT Conversion sucessfull !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }

لطفاً از قطعه کد زیر برای بارگیری PDF از درایو محلی و ذخیره در فرمت TXT استفاده کنید. پس از تبدیل، فایل حاصل در فضای ذخیره سازی ابری ذخیره می شود.

  • ابتدا یک شی از WordsApi با استفاده از Client ID و Client Secret به عنوان پارامتر ایجاد کنید
  • در مرحله دوم، محتوای فایل PDF را از درایو محلی با استفاده از شی File بخوانید
  • سوم، یک شی از ConvertDocumentRequest (…) ایجاد کنید که در آن آرگومان های شی File، TXT را به عنوان فرمت نتیجه و مسیر خروجی فایل TXT حاصل را ارائه می کنیم.
  • در نهایت، متد convertDocument(…) را برای تبدیل PDF به Text و ذخیره خروجی در فضای ذخیره سازی ابری فراخوانی کنید.
// برای نمونه های بیشتر، لطفاً به https://github.com/aspose-words-cloud/aspose-words-cloud-java مراجعه کنید

try
    {
    // ClientID و ClientSecret را از https://dashboard.aspose.cloud/ دریافت کنید
    String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
    String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
  
    // یک شی از WordsApi ایجاد کنید
    // اگر baseUrl null باشد، WordsApi از https://api.aspose.cloud پیش فرض استفاده می کند
    WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

    // محتوای PDF را از درایو محلی بخوانید
    File file = new File("c://input.pdf");
           
    // ایجاد شی درخواست تبدیل سند
    ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
        
    // برای تبدیل PDF به فرمت متن با API تماس بگیرید
    wordsApi.convertDocument(request);
    
    System.out.println("PDF to TXT Conversion sucessfull !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }
PDF به متن

تصویر 1: - پیش نمایش تبدیل PDF به متن در فضای ذخیره سازی ابری

PDF به TXT با استفاده از دستورات cURL

در این قسمت قصد داریم با استفاده از دستورات cURL تبدیل PDF به متن را انجام دهیم. اکنون به عنوان یک پیش نیاز، باید توکن دسترسی JWT را بر اساس اعتبار مشتری با استفاده از دستور زیر تولید کنیم.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

اکنون لطفا دستور زیر را برای آپلود فایل PDF در فضای ذخیره سازی ابری اجرا کنید.

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>" \
-H  "Content-Type: multipart/form-data" \
-d {"fileContent":{}}

در نهایت دستور زیر را برای تبدیل PDF به فرمت Text اجرا کنید.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

نتیجه گیری

در این مقاله جزئیات تبدیل PDF به متن با استفاده از قطعه کد Java توضیح داده شده است. به همین ترتیب، مراحل تبدیل PDF به TXT را با استفاده از دستورات cURL نیز آموخته ایم. برای یادگیری بهتر، می‌توانید API را با استفاده از Swagger UI در مرورگر وب کاوش کنید.

اگر سؤال مرتبطی دارید یا با مشکلی مواجه شدید، لطفاً از طریق [تالار گفتمان پشتیبانی فنی] رایگان با ما تماس بگیرید.

مقالات مرتبط

ما به شدت توصیه می کنیم مقالات زیر را برای کسب اطلاعات بیشتر مطالعه کنید: