
Oħroġ Test minn PDF f’Java
Ilkoll nafu li PDF fajls huma wieħed mill-formati diġitali l-aktar importanti u użati ħafna biex jiġu ppreżentati u skambjati dokumenti b’mod affidabbli, indipendentement mis-softwer, il-ħardwer, jew is-sistema operattiva. Madankollu, f’xi xenarji, nistgħu nkunu interessati li niksbu silta minn fajls PDF kbar. Jew, jista ‘jkollna rekwiżit li nsalvaw il-PDF għal Test onlajn. Allura f’dan l-artikolu, se nesploraw id-dettalji dwar kif tiżviluppa PDF to Test converter billi tuża Java REST API.
PDF Generator API
Ikseb l-ingranaġġ biex tiġġenera dokumenti PDF billi tuża mudelli jew mill-bidu billi tuża l-API REST tagħna. Fl-istess ħin, l-API jippermettilek ukoll teditja kif ukoll tittrasforma l-fajls PDF għal formati appoġġjati oħra. Tista ‘wkoll tieħu l-benefiċċji ta’ estrazzjoni ta ’test minn PDF, tiddeċifrar u tgħaqqad fajls PDF bl-użu ta’ Java Cloud SDK. Issa, sabiex nużaw l-Aspose.PDF Cloud SDK għal Java, irridu nżidu r-referenza tiegħu fl-applikazzjoni Java tagħna billi ninkludu d-dettalji li ġejjin f’pom.xml (proġett tat-tip maven build).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-cloud-pdf</artifactId>
<version>21.11.0</version>
<scope>compile</scope>
</dependency>
</dependencies>
Wara l-installazzjoni, irridu noħolqu kont b’xejn fuq Cloud Dashboard u niksbu kredenzjali personalizzati tal-klijent.
Oħroġ Test minn PDF billi tuża Java
Ejja nesploraw id-dettalji biex jiġi estratt it-test minn PDF billi tuża Java cloud SDK. F’dan l-eżempju, se nużaw l-input li ġej PdfWithTable.pdf fajl.

Immaġni 1:- Fajl tad-dħul għall-estrazzjoni ta’ PDF għal Test.

Immaġni 2:- Oħroġ it-test minn preview PDF
// għal aktar eżempji, jekk jogħġbok żur https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-java/tree/master/Examples/src/main/java/com/aspose/asposecloudpdf/examples
try
{
// Ikseb ClientID u ClientSecret minn https://dashboard.aspose.cloud/
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// toħloq istanza ta' PdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// isem tad-dokument PDF input
String name = "PdfWithTable.pdf";
// aqra l-kontenut tal-fajl PDF input
File file = new File(name);
// ittella PDF fil-ħażna sħaba
pdfApi.uploadFile("input.pdf", file, null);
// X-koordinata tar-rokna t'isfel - tax-xellug
Double LLX = 500.0;
// Y - koordinat tal-kantuniera t'isfel tax-xellug.
Double LLY = 500.0;
// X - koordinat tal-kantuniera ta' fuq tal-lemin.
Double URX = 800.0;
// Y - koordinat tal-kantuniera ta' fuq tal-lemin.
Double URY = 800.0;
// sejħa API biex Ikkonverti PDF għal Test
TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
// Tgħaddi minn Okkorrenza tat-Test individwali
for(int counter=0; counter <=response.getTextOccurrences().getList().size()-1; counter++)
{
// ikteb il-kontenut tat-test fil-console
System.out.println(response.getTextOccurrences().getList().get(counter).getText());
}
System.out.println("Extract Text from PDF successful !");
}catch(Exception ex)
{
System.out.println(ex);
}
Issa ejja nippruvaw nifhmu s-snippet tal-kodiċi speċifikat hawn fuq:
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
Oħloq istanza ta’ PdfApi filwaqt li tgħaddi l-kredenzjali personalizzati bħala argumenti.
File file = new File(name);
pdfApi.uploadFile("input.pdf", file, null);
Aqra l-PDF tal-input billi tuża l-oġġett tal-File u ittellah fil-ħażna tas-sħab billi tuża l-metodu uploadFile(…) tal-klassi PdfAPi. Jekk jogħġbok innota li l-fajl jittella bl-isem użat fil-metodu uploadFile.
TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
Issa sejħa getText(..) metodu fejn aħna jispeċifikaw l-isem tal-fajl PDF input, dimensjonijiet rettangolari fuq il-paġna li minnha għandna bżonn biex estratt il-kontenut testwali u, jirritorna l-kontenut estratt għall-oġġett TextRectsResponse.
response.getTextOccurrences().getList().get(counter).getText()
Fl-aħħarnett, sabiex nipprintjaw il-kontenut tat-test estratt, se ngħaddu minn kull TextOccurances u nuruhom fil-console.
PDF għal Test bl-użu ta’ Kmandi tal-cURL
Minbarra snippet tal-kodiċi Java, nistgħu wkoll inwettqu operazzjoni pdftotext billi tuża kmandi tal-cURL. Issa, wieħed mill-prerekwiżiti għal dan l-approċċ huwa li tiġġenera token ta ‘aċċess JWT (ibbażat fuq kredenzjali tal-klijent) bl-użu tal-kmand li ġej.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Ladarba l-JWT jiġi ġġenerat, jekk jogħġbok tesegwixxi l-kmand li ġej biex tiġbed it-test mill-fajl PDF diġà disponibbli fil-ħażna tas-sħab.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/input.pdf/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Quick Tip
Qed tfittex App ħielsa minn PDF għal Test! Jekk jogħġbok ipprova uża l-[PDF Parser] tagħna (https://products.aspose.app/pdf/parser).
Rimarki tal-Konklużjoni
Bħala konklużjoni, l-estrazzjoni ta ’test minn fajls PDF bl-użu ta’ Java tista ’tkun soluzzjoni qawwija għal dawk li qed ifittxu li awtomatizzaw il-ħtiġijiet tagħhom tal-ipproċessar u l-analiżi tad-dejta. Bl-għajnuna ta ‘din il-gwida, issa għandek pedament sod fuq li tibni u tista’ faċilment timplimenta s-soluzzjoni tiegħek ibbażata fuq Java għall-estrazzjoni tat-test minn dokumenti PDF. Kemm jekk qed tfittex li tiġbed test għall-analiżi tad-dejta, it-tagħlim bil-magni, jew kwalunkwe skop ieħor, Java jipprovdi pjattaforma flessibbli u affidabbli għall-bżonnijiet tiegħek. Allura aqbad u poġġi l-ħiliet akkwistati ġodda tiegħek għat-test!
Jekk inti interessat li tesplora karatteristiċi eċċitanti oħra li qed jiġu offruti mill-API, jekk jogħġbok esplora l-Dokumentazzjoni tal-Prodott. Fl-aħħar nett, jekk tiltaqa’ ma’ xi kwistjoni waqt li tuża l-API, jew għandek xi mistoqsija relatata, jekk jogħġbok tħossok liberu li tikkuntattjana permezz ta’ Forum ta’ Appoġġ tal-Prodott.
Artikoli Relatati
Jekk jogħġbok żur il-links li ġejjin biex titgħallem aktar dwar: