estratt test minn PDF

Oħroġ Test minn PDF f’Java

Ilkoll nafu li PDF fajls huma wieħed mill-formati diġitali l-aktar importanti u użati ħafna biex jiġu ppreżentati u skambjati dokumenti b’mod affidabbli, indipendentement mis-softwer, il-ħardwer, jew is-sistema operattiva. Madankollu, f’xi xenarji, nistgħu nkunu interessati li niksbu silta minn fajls PDF kbar. Jew, jista ‘jkollna rekwiżit li nsalvaw il-PDF għal Test onlajn. Allura f’dan l-artikolu, se nesploraw id-dettalji dwar kif tiżviluppa PDF to Test converter billi tuża Java REST API.

PDF Generator API

Ikseb l-ingranaġġ biex tiġġenera dokumenti PDF billi tuża mudelli jew mill-bidu billi tuża l-API REST tagħna. Fl-istess ħin, l-API jippermettilek ukoll teditja kif ukoll tittrasforma l-fajls PDF għal formati appoġġjati oħra. Tista ‘wkoll tieħu l-benefiċċji ta’ estrazzjoni ta ’test minn PDF, tiddeċifrar u tgħaqqad fajls PDF bl-użu ta’ Java Cloud SDK. Issa, sabiex nużaw l-Aspose.PDF Cloud SDK għal Java, irridu nżidu r-referenza tiegħu fl-applikazzjoni Java tagħna billi ninkludu d-dettalji li ġejjin f’pom.xml (proġett tat-tip maven build).

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-cloud-pdf</artifactId>
        <version>21.11.0</version>
        <scope>compile</scope>
    </dependency>
</dependencies>

Wara l-installazzjoni, irridu noħolqu kont b’xejn fuq Cloud Dashboard u niksbu kredenzjali personalizzati tal-klijent.

Oħroġ Test minn PDF billi tuża Java

Ejja nesploraw id-dettalji biex jiġi estratt it-test minn PDF billi tuża Java cloud SDK. F’dan l-eżempju, se nużaw l-input li ġej PdfWithTable.pdf fajl.

pdf għal test ocr

Immaġni 1:- Fajl tad-dħul għall-estrazzjoni ta’ PDF għal Test.

pdf għal test ocr

Immaġni 2:- Oħroġ it-test minn preview PDF

// għal aktar eżempji, jekk jogħġbok żur https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-java/tree/master/Examples/src/main/java/com/aspose/asposecloudpdf/examples

try
    {
    // Ikseb ClientID u ClientSecret minn https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
    // toħloq istanza ta' PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
    // isem tad-dokument PDF input
    String name = "PdfWithTable.pdf";
		        
    // aqra l-kontenut tal-fajl PDF input
    File file = new File(name); 
    // ittella PDF fil-ħażna sħaba
    pdfApi.uploadFile("input.pdf", file, null);
		        
    // X-koordinata tar-rokna t'isfel - tax-xellug
    Double LLX = 500.0;
    // Y - koordinat tal-kantuniera t'isfel tax-xellug.
    Double LLY = 500.0;
    // X - koordinat tal-kantuniera ta' fuq tal-lemin.
    Double URX = 800.0;
    // Y - koordinat tal-kantuniera ta' fuq tal-lemin.
    Double URY = 800.0;
			       
    // sejħa API biex Ikkonverti PDF għal Test
    TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);    
		    
    // Tgħaddi minn Okkorrenza tat-Test individwali
    for(int counter=0; counter <=response.getTextOccurrences().getList().size()-1; counter++)
    {
        // ikteb il-kontenut tat-test fil-console
        System.out.println(response.getTextOccurrences().getList().get(counter).getText());
    }
		  
    System.out.println("Extract Text from PDF successful !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }

Issa ejja nippruvaw nifhmu s-snippet tal-kodiċi speċifikat hawn fuq:

PdfApi pdfApi = new PdfApi(clientSecret,clientId);

Oħloq istanza ta’ PdfApi filwaqt li tgħaddi l-kredenzjali personalizzati bħala argumenti.

File file = new File(name); 
pdfApi.uploadFile("input.pdf", file, null);

Aqra l-PDF tal-input billi tuża l-oġġett tal-File u ittellah fil-ħażna tas-sħab billi tuża l-metodu uploadFile(…) tal-klassi PdfAPi. Jekk jogħġbok innota li l-fajl jittella bl-isem użat fil-metodu uploadFile.

TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);    

Issa sejħa getText(..) metodu fejn aħna jispeċifikaw l-isem tal-fajl PDF input, dimensjonijiet rettangolari fuq il-paġna li minnha għandna bżonn biex estratt il-kontenut testwali u, jirritorna l-kontenut estratt għall-oġġett TextRectsResponse.

response.getTextOccurrences().getList().get(counter).getText()

Fl-aħħarnett, sabiex nipprintjaw il-kontenut tat-test estratt, se ngħaddu minn kull TextOccurances u nuruhom fil-console.

PDF għal Test bl-użu ta’ Kmandi tal-cURL

Minbarra snippet tal-kodiċi Java, nistgħu wkoll inwettqu operazzjoni pdftotext billi tuża kmandi tal-cURL. Issa, wieħed mill-prerekwiżiti għal dan l-approċċ huwa li tiġġenera token ta ‘aċċess JWT (ibbażat fuq kredenzjali tal-klijent) bl-użu tal-kmand li ġej.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Ladarba l-JWT jiġi ġġenerat, jekk jogħġbok tesegwixxi l-kmand li ġej biex tiġbed it-test mill-fajl PDF diġà disponibbli fil-ħażna tas-sħab.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/input.pdf/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Quick Tip

Qed tfittex App ħielsa minn PDF għal Test! Jekk jogħġbok ipprova uża l-[PDF Parser] tagħna (https://products.aspose.app/pdf/parser).

Rimarki tal-Konklużjoni

Bħala konklużjoni, l-estrazzjoni ta ’test minn fajls PDF bl-użu ta’ Java tista ’tkun soluzzjoni qawwija għal dawk li qed ifittxu li awtomatizzaw il-ħtiġijiet tagħhom tal-ipproċessar u l-analiżi tad-dejta. Bl-għajnuna ta ‘din il-gwida, issa għandek pedament sod fuq li tibni u tista’ faċilment timplimenta s-soluzzjoni tiegħek ibbażata fuq Java għall-estrazzjoni tat-test minn dokumenti PDF. Kemm jekk qed tfittex li tiġbed test għall-analiżi tad-dejta, it-tagħlim bil-magni, jew kwalunkwe skop ieħor, Java jipprovdi pjattaforma flessibbli u affidabbli għall-bżonnijiet tiegħek. Allura aqbad u poġġi l-ħiliet akkwistati ġodda tiegħek għat-test!

Jekk inti interessat li tesplora karatteristiċi eċċitanti oħra li qed jiġu offruti mill-API, jekk jogħġbok esplora l-Dokumentazzjoni tal-Prodott. Fl-aħħar nett, jekk tiltaqa’ ma’ xi kwistjoni waqt li tuża l-API, jew għandek xi mistoqsija relatata, jekk jogħġbok tħossok liberu li tikkuntattjana permezz ta’ Forum ta’ Appoġġ tal-Prodott.

Artikoli Relatati

Jekk jogħġbok żur il-links li ġejjin biex titgħallem aktar dwar: