„Microsoft Word“ plačiai naudojama kuriant, redaguojant ir transformuojant Word dokumentus (DOC/DOCX) į įvairius formatus. Panašiai Markdown yra lengva žymėjimo kalba, kurią galite naudoti norėdami pridėti formatavimo elementus prie paprasto teksto dokumentų. Tai yra paprasto teksto dokumentas, kurį turi būti galima skaityti be žymių, kurios viską supainioja, bet vis tiek turėtų būti būdų, kaip pridėti teksto modifikatorius, pvz., sąrašus, pusjuodį šriftą, kursyvą ir pan. Taigi, jei turime Word dokumentą ir turime sukurti lygiavertį failą Markdown sintaksėje tampa sunku ją sukurti rankiniu būdu. Tačiau programinis sprendimas gali išspręsti problemą. Šiame straipsnyje bus paaiškinta visa informacija, kaip sukurti keitiklį iš žodžio į žymėjimą naudojant „Java Cloud SDK“.
Word į Markdown konversijos API
Mūsų REST pagrįsta API, pavadinta Aspose.Words Cloud, yra nuostabus sprendimas įgyvendinti MS Word dokumentų kūrimo, manipuliavimo ir konvertavimo į įvairius palaikomus formatus operacijas. Dabar, norėdami įdiegti tas pačias dokumentų konvertavimo ir apdorojimo galimybes „Java“ programoje, turime naudoti Aspose.Words Cloud SDK for Java, kuris yra REST API įvyniojimas. Taigi pirmajame SDK naudojimo etape turime įtraukti jo nuorodą į savo Java projektą įtraukdami šią informaciją į pom.xml (maven build tipo projektas).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
Kai SDK nuoroda bus įtraukta į projektą, kitas svarbus veiksmas yra gauti kliento kredencialus iš Cloud Dashboard. Kitu atveju pirmiausia turite užregistruoti nemokamą paskyrą naudodami galiojantį el. pašto adresą.
Word į MD Java
Šiame skyriuje paaiškinami veiksmai ir susijusi informacija, kaip galime konvertuoti Word į MD formatą naudojant Java kodo fragmentą. Naudosime dvi parinktis, kaip įkelti įvesties „Word“ dokumentą, ty formuoti debesies saugyklą arba vietinį diską, o tada pakeisti jį į „Markdown“ formatą.
Įkelti Word dokumentą iš vietinio disko
- Pirmiausia sukurkite WordsApi egzempliorių ir kaip argumentus perduokite asmeninius kredencialus
- Antra, perskaitykite įvesties Word dokumento turinį naudodami Files.readAllBytes(…) metodą ir gaukite grąžintą reikšmę baitų [] masyve
- Trečia, sukurkite ConvertDocumentRequest objektą, kuris kaip argumentus imasi įvesties Word failo, MD formato ir gauto Markdown failo pavadinimo
- Dabar iškvieskite metodą convertDocument (…), skirtą Word konvertavimui į MD. Gautas žymėjimas grąžinamas kaip atsako srautas, kuris turi būti įrašytas į baito[] egzempliorių
- Galiausiai, norėdami išsaugoti gautą žymėjimą vietiniame diske, sukurkite FileOutputStream objektą ir naudokite jo rašymo (…) metodą
// Jei reikia daugiau kodo fragmentų, apsilankykite https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// jei baseUrl yra nulinis, WordsApi naudoja numatytąjį https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// įkelti Word dokumentą iš vietinės sistemos
File file1 = new File("sample_EmbeddedOLE.docx");
// skaityti įvesties Word dokumento turinį
byte[] documentStream = Files.readAllBytes(file1.toPath());
// gautas failo formatas
String format = "md";
// sukurti dokumento konvertavimo užklausą, kurioje pateikiame gauto failo pavadinimą
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// konvertuokite žodį į žymėjimą ir išsaugokite išvestį baitų masyve
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// Išsaugokite gautą žymėjimo dokumentaciją vietiniame diske
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
Galite apsvarstyti galimybę atsisiųsti įvesties „Word“ dokumentą iš sampleEmbeddedOLE.docx.
Įkelkite Word dokumentą iš debesies saugyklos
- Panašiai pirmiausia turime sukurti WordsApi egzempliorių, perduodami asmeninius kredencialus kaip argumentus
- Antra, sukurkite GetDocumentWithFormatRequest objektą, kuris kaip argumentus įveda Word failo pavadinimą, MD formatą ir gautą Markdown failo pavadinimą
- Galiausiai iškvieskite metodą getDocumentWithFormat(..), kuris suaktyvina Word į Markdown konvertavimo operaciją. Gautas MD failas išsaugomas debesies saugykloje
// Jei reikia daugiau kodo fragmentų, apsilankykite https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// jei baseUrl yra nulinis, WordsApi naudoja numatytąjį https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// dabar sukurkite naują GetDocumentWithFormatRequest objektą
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// dabar iškvieskite konversijos operacijos inicijavimo metodą
// gautas failas saugomas debesies saugykloje
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
DOC į Markdown naudojant cURL komandas
REST API taip pat suteikia lankstumo prieigai iš bet kurios platformos naudojant cURL komandas. Taigi šiame skyriuje aptarsime išsamią informaciją apie tai, kaip įkelti Word dokumentą iš debesies saugyklos, atlikti DOCX konvertavimą į Markdown ir išsaugoti gautą MD failą vietiniame diske. Dabar pirmiausia turime sugeneruoti JWT prieigos raktą (pagal kliento kredencialus) naudodami šią komandą ir tada atlikti DOCX konvertavimą į Markdown.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Sugeneravę JWT, vykdykite šią komandą, kad įkeltumėte Word dokumentą iš debesies saugyklos ir atliktumėte Word konvertavimą į Markdown. Tada gautas MD failas išsaugomas vietiniame diske
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
Išvada
Pasiekėme šio straipsnio pabaigą, kur sužinojome, kaip programiškai konvertuoti Word į Markdown naudojant Java. Panašiai mes taip pat ištyrėme veiksmus, kaip konvertuoti DOCX į Markdown naudojant cURL komandas.
Kita galimybė ištirti API galimybes yra SwaggerUI žiniatinklio naršyklėje. Taip pat rekomenduojame ištirti Produkto dokumentaciją, kuri yra nuostabus informacijos šaltinis norint sužinoti apie kitas įdomias funkcijas. Jei reikia atsisiųsti ir modifikuoti Cloud SDK šaltinio kodą, jis pasiekiamas GitHub (paskelbtas pagal MIT licenciją). Galiausiai, jei naudodami API susidursite su problemomis, galite susisiekti su mumis ir greitai išspręsti problemą per nemokamą produkto palaikymo forumą.
susiję straipsniai
Norėdami sužinoti daugiau apie tai, apsilankykite šiose nuorodose: