Digitaalisessa ympäristössä tarve muuntaa PDF [XML]-muotoon (https://docs.fileformat.com/web/xml/) (Extensible Markup Language) ) ei ole koskaan ollut kriittisempi. Vaikka PDF on erinomainen muotojen säilyttämisessä ja jakamisessa, se on usein haaste, kun on kyse tietojen poimimisesta ja jäsentämisestä. Toisaalta XML on monipuolinen merkintäkieli, joka on suunniteltu järjestämään, tallentamaan ja siirtämään tietoja. Muuntamalla PDF-tiedostot XML-muotoon kurotamme umpeen jäsentämättömän sisällön ja strukturoidun tiedon välisen kuilun, mikä mahdollistaa lukuisia sovelluksia data-analyysistä sisällön uudelleenkäytettävyyteen.
Tarkastellaan yksityiskohtia PDF-tiedostojen muuntamisesta XML-muotoon .NET REST API:n avulla.
- REST-sovellusliittymä PDF-muotoon XML-muunnokselle
- Kehitä PDF-XML-tiedostomuunnin C#.NETissä
- Muunna PDF XML-muotoon cURL-komennoilla
REST-sovellusliittymä PDF-muotoon XML-muunnokselle
Hyödyntämällä [Aspose.PDF Cloud SDK for .NET] (https://products.aspose.cloud/pdf/net/) ominaisuuksia muunnosta tulee saumaton ja tehokas. Tämä tehokas SDK tarjoaa paitsi PDF:n XML-muunnoksen, myös erilaisia ominaisuuksia – asiakirjojen käsittelystä tiedon poimimiseen. Tutkitaan prosessia, jolla PDF muunnetaan XML-muotoon, jotta voimme mullistaa tapamme käsitellä ja hyödyntää asiakirjatietoja.
Tee haku “Aspose.PDF-Cloud” NuGet-pakettien hallinnassa Visual Studio IDE:ssä ja napsauta Lisää paketti -painiketta, jotta SDK-viite lisätään projektiin.
Sinun on myös hankittava asiakastunnuksesi [pilvihallintapaneelista] (https://dashboard.aspose.cloud/). Jos sinulla ei ole tiliä, luo ilmainen tili noudattamalla kohdassa [pika aloitus] (https://docs.aspose.cloud/total/getting-started/quickstart/) annettuja ohjeita.
Kehitä PDF-XML-tiedostomuunnin C#.NETissä
Noudata alla annettuja ohjeita muuttaaksesi PDF-tiedoston XML-muotoon tietojen jäsenneltyä esitystä varten.
// Lisää esimerkkejä on osoitteessa https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples
// Hanki asiakkaan tunnistetiedot osoitteesta https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";
// luo PdfApi-esiintymä
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
if (response != null)
{
Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");
// Mukautettu tapa tallentaa suoratoistosisältö tiedostoon paikallisella asemalla
public static void saveToDisk(Stream responseStream, String resultantFile)
{
var fileStream = File.Create(resultantFile);
responseStream.Seek(0, SeekOrigin.Begin);
responseStream.CopyTo(fileStream);
fileStream.Close();
}
Alla on nopeat tiedot yllä mainitusta koodinpätkästä.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Luo PdfApi-luokan objekti samalla kun välität asiakkaan tunnistetiedot syöttöargumentteina.
pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
Soita nyt API muuntaaksesi merkitty PDF-tiedosto XML-muotoon. Sitten käytämme mukautettua menetelmää tulosteen tallentamiseen paikalliselle asemalle.
Muunna PDF XML-muotoon cURL-komennoilla
Muuntaminen PDF-tiedostosta XML-muotoon tulee erittäin tehokkaaksi ja joustavaksi, kun käytetään Aspose.PDF Cloud API yhdessä cURL-komentojen kanssa. Tämä tehokas yhdistelmä paitsi yksinkertaistaa muunnosprosessia, myös parantaa tietojen saatavuutta ja käytettävyyttä useissa eri sovelluksissa. Tarkastellaan nyt joitain lisätietoja tästä muunnoksesta, koska se helpottaa tietojen poiminta, jakamista ja tulkintaa.
Ensimmäinen askel tässä lähestymistavassa on JWT-käyttötunnisteen luominen. Joten suorita seuraava komento:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Kun JWT-tunnus on luotu, meidän on suoritettava seuraava komento muuntaaksesi merkitty PDF-tiedosto XML-muotoon. Muuntamisen jälkeen tuloksena oleva XML tallennetaan paikalliselle asemalle.
curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H "authorization: Bearer {accessToken}" \
-o "Converted.xml"
Korvaa “lähdetiedosto” pilvitallennustilassa jo saatavilla olevan PDF-syötetiedoston nimellä ja korvaa “accessToken” yllä luodulla JWT-käyttötunnuksella.
Johtopäätös
Yhteenvetona voidaan todeta, että valitsemme sitten vankan Aspose.PDF Cloud SDK:n .NET:lle tai käytämme cURL-komentoja yhdessä Aspose.PDF Cloudin kanssa, voimme helposti saavuttaa tavoitteemme muuntamalla PDF-tiedostosta XML-muotoon saumattomasti tiedon hyödyntämisen parantamiseksi. Joten valitusta menetelmästä riippumatta molemmat lähestymistavat ovat tehokkaita työkaluja, jotka mullistavat tavan, jolla rakentelemme ja poimimme tietoja PDF-tiedostoista.
hyödyllisiä linkkejä
Aiheeseen liittyvät artikkelit
Suosittelemme vierailemaan seuraavissa blogeissa: