Microsoft Word wordt veel gebruikt om Word-documenten (DOC/DOCX) in verschillende indelingen te maken, te bewerken en om te zetten. Evenzo is Markdown een lichtgewicht opmaaktaal die u kunt gebruiken om opmaakelementen toe te voegen aan documenten met platte tekst. Het is een document met platte tekst dat leesbaar moet zijn zonder tags die alles in de war brengen, maar er moeten nog steeds manieren zijn om tekstmodificaties toe te voegen, zoals lijsten, vet, cursief, enz. Dus als we een Word-document hebben en we een equivalent bestand moeten maken in Markdown-syntaxis wordt het moeilijk om het handmatig te maken. Een programmatische oplossing kan echter een probleem oplossen. In dit artikel worden alle details uitgelegd over het ontwikkelen van een word-to-markdown-converter met behulp van Java Cloud SDK.
- Word naar Markdown-conversie-API
- Word naar MD in Java
- DOC naar Markdown met behulp van cURL-opdrachten
Word naar Markdown-conversie-API
Onze op REST gebaseerde API met de naam Aspose.Words Cloud is een geweldige oplossing om het maken, manipuleren en converteren van MS Word-documenten te implementeren in verschillende ondersteunde formaten. Om nu dezelfde documentconversie- en verwerkingsmogelijkheden in de Java-applicatie te implementeren, moeten we Aspose.Words Cloud SDK voor Java gebruiken, een wrapper rond REST API. Dus in de eerste stap van SDK-gebruik moeten we de referentie ervan toevoegen aan ons Java-project door de volgende informatie op te nemen in pom.xml (maven build-type project).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
Zodra de SDK-referentie in het project is toegevoegd, is de volgende belangrijke stap het verkrijgen van uw klantreferenties van Cloud Dashboard. Anders moet u eerst een gratis account registreren terwijl u een geldig e-mailadres gebruikt.
Word naar MD in Java
In dit gedeelte worden de stappen en gerelateerde details uitgelegd over hoe we Word naar MD-indeling kunnen converteren met behulp van een Java-codefragment. We gaan twee opties gebruiken voor het laden van het invoer-Word-document, dwz vanuit cloudopslag of lokale schijf, en het vervolgens transformeren naar Markdown-indeling.
Laad Word-document van lokaal station
- Maak allereerst een exemplaar van WordsApi en geef persoonlijke inloggegevens door als argumenten
- Ten tweede, lees de inhoud van het invoer-Word-document met behulp van de Files.readAllBytes(…)-methode en ontvang de geretourneerde waarde in een byte[]-array
- Ten derde, maak een object van ConvertDocumentRequest dat invoer Word-bestand, MD-formaat en resulterende Markdown-bestandsnaam als argumenten gebruikt
- Roep nu methode convertDocument(…) aan voor conversie van Word naar MD. De resulterende Markdown wordt geretourneerd als responsstroom, om te worden opgeslagen in byte[] instantie
- Ten slotte, om de resulterende Markdown op de lokale schijf op te slaan, maakt u een object van FileOutputStream en gebruikt u de methode write(…)
// Voor meer codefragmenten, gelieve https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// als baseUrl null is, gebruikt WordsApi standaard https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// laad een word-document van het lokale systeem
File file1 = new File("sample_EmbeddedOLE.docx");
// lees de inhoud van het invoerwoorddocument
byte[] documentStream = Files.readAllBytes(file1.toPath());
// resulterende bestandsindeling
String format = "md";
// maak een documentconversieverzoek waarbij we de resulterende bestandsnaam opgeven
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// voer conversie van woord naar markdown uit en sla uitvoer op in byte-array
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// Bewaar resulterende markdown-documentatie op de lokale schijf
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
U kunt overwegen het invoer-Word-document te downloaden van sampleEmbeddedOLE.docx.
Laad Word-document uit cloudopslag
- Evenzo moeten we eerst een exemplaar van WordsApi maken terwijl we gepersonaliseerde inloggegevens als argumenten doorgeven
- Ten tweede, maak een object van GetDocumentWithFormatRequest dat de ingevoerde Word-bestandsnaam, MD-indeling en de resulterende Markdown-bestandsnaam als argumenten gebruikt
- Roep ten slotte de methode getDocumentWithFormat(..) aan die de conversie van Word naar Markdown activeert. Het resulterende MD-bestand wordt opgeslagen in cloudopslag
// Voor meer codefragmenten, gelieve https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// als baseUrl null is, gebruikt WordsApi standaard https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// maak nu een nieuw object van GetDocumentWithFormatRequest
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// roep nu de methode aan om de conversie te starten
// het resulterende bestand wordt opgeslagen in cloudopslag
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
DOC naar Markdown met behulp van cURL-opdrachten
De REST API’s bieden ook de flexibiliteit om vanaf elk platform toegankelijk te zijn met behulp van cURL-opdrachten. Dus in dit gedeelte gaan we de details bespreken over het laden van Word-documenten vanuit cloudopslag, het uitvoeren van DOCX naar Markdown-conversie en het resulterende MD-bestand opslaan op een lokale schijf. Nu moeten we eerst het JWT-toegangstoken genereren (op basis van clientreferenties) met behulp van de volgende opdracht en vervolgens DOCX naar Markdown-conversie uitvoeren.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Nadat de JWT is gegenereerd, voert u de volgende opdracht uit om een Word-document uit de cloudopslag te laden en de conversie van Word naar Markdown uit te voeren. Het resulterende MD-bestand wordt vervolgens opgeslagen op de lokale schijf
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
Gevolgtrekking
We zijn aan het einde van dit artikel gekomen waar we de details hebben geleerd over hoe we Word programmatisch naar Markdown kunnen converteren met behulp van Java. Evenzo hebben we ook de stappen onderzocht voor het converteren van DOCX naar Markdown via cURL-opdrachten.
Een andere optie om de mogelijkheden van API te verkennen is via SwaggerUI in een webbrowser. We raden ook aan om de Productdocumentatie te verkennen, een geweldige bron van informatie om meer te weten te komen over andere interessante functies. Als u de broncode van Cloud SDK moet downloaden en wijzigen, is deze beschikbaar op GitHub (gepubliceerd onder MIT-licentie). Als u ten slotte problemen ondervindt tijdens het gebruik van de API, kunt u overwegen ons te benaderen voor een snelle oplossing via het gratis productondersteuningsforum.
gerelateerde artikelen
Bezoek de volgende links voor meer informatie over: