I vårt dagliga liv måste vi hantera Microsoft Word-dokument (DOC/DOCX) både för personliga och officiella ändamål. På samma sätt kan vi ha ett krav på att dela dessa dokument över internet och för att öppna/visa dessa dokument kräver mottagaren särskilda applikationer, t.ex. MS Word, OpenOffice etc. Dessutom kanske vissa restriktiva miljöer inte har behörighet att installera ytterligare applikationer, så i sådana scenarier kan konvertering av Word till HTML vara en hållbar lösning. Med detta tillvägagångssätt kan vi enkelt öppna ett Word-dokument i webbläsaren (utan att installera någon ytterligare programvara). Så den här artikeln kommer att förklara stegen för hur man konverterar Word till HTML med Java Cloud SDK.
- Word till HTML-konvertering REST API
- Konvertera Word till HTML i Java
- DOCX till HTML med hjälp av cURL-kommandon
Word till HTML-konvertering REST API
Aspose.Words Cloud är en REST-baserad lösning som erbjuder möjligheter att programmatiskt skapa, redigera och omvandla MS Word-dokument till olika format som stöds. Nu enligt omfattningen av denna artikel kommer vi att använda Aspose.Words Cloud SDK för Java som gör det möjligt för oss att använda alla Word-dokumentkonverteringsmöjligheter i Java-applikationen. Så för att kunna använda denna SDK måste vi lägga till dess referens i vårt Java-projekt genom att inkludera följande information i pom.xml (projekt av maven-byggtyp).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
Nästa viktiga steg är att få dina kunduppgifter från Cloud Dashboard. Om du inte redan är registrerad måste du först registrera ett gratiskonto via en giltig e-postadress och sedan skaffa dina referenser.
Konvertera Word till HTML i Java
Vi kommer att diskutera stegen och deras relaterade detaljer om hur man konverterar Word till HTML med Java-kodavsnitt.
- Skapa ett WordsApi-objekt där vi skickar personliga referenser som argument
- Ladda nu inmatat Word-dokumentinnehåll med metoden readAllBytes(…) och få returnerat värde i byte[] array
- Nästa steg är att skapa ett objekt av klassen ConvertDocumentRequest, som tar indata Word-fil, HTML-format och resulterande filnamn som argument
- Till sist, anropa metoden convertDocument(…) för att utföra Word till HTML-konvertering. Efter lyckad konvertering lagras det resulterande HTML-dokumentet i molnlagring
// För fler kodavsnitt, vänligen https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// om baseUrl är null använder WordsApi standard https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// ladda word-dokument från det lokala systemet
File file1 = new File("test_multi_pages.docx");
// läs innehållet i inmatat word-dokument
byte[] documentStream = Files.readAllBytes(file1.toPath());
// resulterande filformat
String format = "html";
// skapa dokumentkonverteringsbegäran där vi tillhandahåller det resulterande filnamnet
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, "output.html",null, null, null);
// utföra omvandling av ord till html
wordsApi.convertDocument(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
Exempel på Word-dokument som används i ovanstående exempel kan laddas ner från testmultipages.docx.
DOCX till HTML med hjälp av cURL-kommandon
REST API:erna ger enkel åtkomst via cURL-kommandon på vilken plattform som helst. Så i det här avsnittet kommer vi att diskutera detaljerna om hur man konverterar DOCX till HTML med hjälp av cURL-kommandon. Så det första steget är att generera JWT-åtkomsttoken (baserat på klientuppgifter) med följande kommando.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Nu måste vi köra följande kommando för att utföra Word till HTML-konvertering där det ingående Word-dokumentet förväntas vara tillgängligt i molnlagring och efter konverteringen kommer vi att spara det resulterande HTML-dokumentet på lokal enhet.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.html"
Vi kan också spara den resulterande filen direkt i molnlagring och av den anledningen behöver vi helt enkelt ange värde för outPath-parametern (som visas nedan)
curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html&outPath=output.html" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Slutsats
Nu när vi har nått slutet av den här artikeln har vi lärt oss detaljerna om hur man programmässigt konverterar Word till HTML med Java. Vi har också sett alternativen att konvertera DOCX till HTML via cURL-kommandon. För snabba teständamål kan du också prova att komma åt API:et via SwaggerUI i en webbläsare och samtidigt kan du överväga att utforska Produktdokumentationen som är en fantastisk informationskälla.
Om du behöver ladda ner och ändra källkoden för Cloud SDK, är den fritt tillgänglig på GitHub (publicerad under MIT-licens). Slutligen, om du stöter på några problem när du använder API:t eller om du har någon relaterad fråga, kan du överväga att kontakta oss för en snabb lösning via det kostnadsfria produktsupportforum.
relaterade artiklar
Besök följande länkar för att lära dig mer om: