
Конвертер PDF в Word | API конвертации PDF в DOC
PDF — один из широко используемых форматов файлов для обмена информацией. Он популярен, поскольку сохраняет точность документа на всех платформах и устройствах (настольных компьютерах, мобильных устройствах и т. д.).Однако, если нам нужно внести какие-либо изменения в файл PDF, нам нужно использовать специальные приложения для открытия и редактирования документов PDF. Но для большого количества обновлений преобразование файлов PDF в документы Word является одним из жизнеспособных решений. Кроме того, для массового преобразования эффективным решением является программный SDK. В этой статье мы рассмотрим подробности того, как преобразовать PDF в Word с помощью Python SDK.
API обработки текста
Aspose.Words Cloud — это наш отмеченный наградами API на основе REST, предлагающий возможности создания, редактирования и преобразования файлов Word HTML, JPEG, PNG и других поддерживаемых форматов файлов. В то же время он также поддерживает возможности загрузки документов PDF и их отображения в MS Word (DOCX, DOC, DOT, RTF, DOCM) или OpenDocument (ODT, OTT).Для выполнения этого преобразования не требуется загрузка или установка стороннего программного обеспечения, а все преобразования выполняются с помощью нашего движка обработки документов в облаке. Теперь для реализации операции преобразования документа в приложении Python вам нужно попробовать использовать Aspose.Words Cloud SDK для Python, который является оболочкой вокруг API облака.
Установка
SDK доступен для загрузки на PIP и GitHub. Выполните следующую команду в терминале командной строки, чтобы установить SDK
pip install aspose-words-cloud
PyCharm-IDE-среда
Если вы используете PyCharm IDE, вы можете напрямую добавить SDK в качестве зависимости в свой проект.
Файл ->Настройки ->Проект ->Интерпретатор Python ->asposewordscloud

Изображение 1:- Параметры настройки PyCharm.

Изображение 2: Пакет Python Aspose.Words.
Конвертер PDF в Word с использованием Python
Чтобы преобразовать файл PDF в формат Word, следуйте инструкциям ниже.
- Сначала нам необходимо создать объект ApiClient, передав данные ClientID и ClientSecret в качестве аргументов.
- Во-вторых, создайте экземпляр WordsApi, передав экземпляр ApiClient в качестве аргумента.
- В-третьих, загрузите PDF-файл в облачное хранилище с помощью метода UploadFileRequest(..).
- Теперь создадим объект SaveOptionsData, где определим docx как формат экспорта.
- Следующим шагом является создание экземпляра SaveAsRequest, который принимает в качестве аргументов имя PDF-файла и объект SaveOptionsData.
- Наконец, вызовите метод saveas(..) класса WordsApi для выполнения операции преобразования.
# Для получения дополнительных примеров посетите https://github.com/aspose-words-cloud/aspose-words-cloud-python
# Инициализировать объект Python Aspose.Words
words_api = WordsApi("6185429e-17ce-468d-bb81-a51ac9d96c16","73a07e2fb010f559e482d854fe5a8f49")
# Входной PDF-документ
inputFileName = 'awesome_table_in_pdf.pdf'
# Имя полученного документа Word
resultantFile = 'Converted.docx'
# Загрузить PDF-документ в облачное хранилище
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open(inputFileName, 'rb'), "", None))
# Варианты экспорта документов
request_save_options_data = asposewordscloud.SaveOptionsData(save_format='docx', file_name=resultantFile)
# Создать запрос «Сохранить как документ» с передачей входного имени PDF-файла и параметров экспорта Word
request = asposewordscloud.models.requests.SaveAsRequest(name=inputFileName,
save_options_data=request_save_options_data,
folder=None)
# инициировать операцию преобразования
result = words_api.words_api.save_as(request)
# Вывести результат в консоль
print("Result {}".format(result))
Примеры файлов, использованные в приведенном выше фрагменте кода, можно загрузить с awesometableinpdf.pdf и Converted.docx.
PDF в DOC с помощью команды cURL
Как и другие REST API, Aspose.Words Cloud также может быть доступен через команды cURL. Но прежде чем мы перейдем к доступу API, нам нужно сгенерировать токен доступа JWT на основе учетных данных клиента, указанных в панели управления Aspose.Cloud. Пожалуйста, выполните следующую команду cURL, чтобы сгенерировать токен доступа JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Теперь мы можем использовать следующую команду для преобразования файлов PDF, доступных в облачном хранилище, в формат Word. В следующей команде мы использовали параметр -o для сохранения вывода на локальном диске.
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o Converted.docx
Используйте следующую команду, если вам нужно напрямую сохранить выходной текстовый документ в облачном хранилище. Обратите внимание на параметр запроса outPath в следующей команде.
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx&outPath=newResultant.docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Заключение
В этой статье мы изучили удивительные возможности Aspose.Words Cloud по конвертации PDF в Word с использованием Python API. Аналогичным образом мы также изучили детали экспорта PDF в DOC или другие поддерживаемые форматы с использованием команд cURL. Кроме того, вы также можете попробовать получить доступ к API в веб-браузере с помощью интерфейса Swagger. Кроме того, Cloud SDK разработан под лицензией MIT, поэтому его полный исходный код доступен в репозитории GitHub.
Если у вас возникнут какие-либо проблемы при использовании API или возникнут какие-либо вопросы, свяжитесь с нами через бесплатный форум поддержки продукта.
Похожие статьи
Мы рекомендуем посетить следующие ссылки, чтобы узнать больше о: