Разработайте конвертер PDF в Excel с использованием Python Cloud SDK.

Как конвертировать PDF в Excel | Экспорт PDF в Excel с помощью Python SDK
Файлы PDF отлично подходят для сохранения форматирования документа, но извлечение и использование данных из них может быть сложным. Вот где необходимость преобразования PDF в Excel становится очевидной. Книга Excel с ее форматом электронной таблицы предлагает структурированный способ организации и обработки данных. Представьте себе, как легко извлекаются таблицы, рисунки и текст из PDF и аккуратно располагаются в ячейках Excel, готовые к анализу. Такое преобразование не только упрощает обработку данных, но и повышает эффективность и производительность.
Кроме того, Excel в основном используется для хранения и организации данных, таких как доходы, заработная плата и бухгалтерская информация. Они позволяют пользователю производить расчеты с этими данными и создавать графики и диаграммы. Теперь в этой статье мы собираемся обсудить детали того, как преобразовать PDF в формат Excel.
- Python Cloud SDK для обработки PDF-файлов
- Конвертировать PDF в Excel на Python
- Преобразование PDF в XLS с помощью команды cURL
Python Cloud SDK для обработки PDF-файлов
Aspose.PDF Cloud SDK для Python выступает в качестве мощного инструмента для оптимизации процесса преобразования PDF в XLS. Он не только облегчает бесшовное преобразование «pdf в excel», но и предлагает множество других возможностей. Представьте себе, как легко вы можете управлять PDF-файлами, извлекать определенные данные и создавать файлы, готовые к Excel.
Первый шаг — установить Python Cloud SDK, который доступен для загрузки через репозиторий PIP и GitHub. Поэтому выполните следующую команду в терминале/командной строке, чтобы установить последнюю версию Cloud SDK.
pip install asposepdfcloud
MS Visual Studio
Если вам нужно напрямую добавить ссылку в ваш проект Python в Visual Studio IDE, найдите asposepdfcloud как пакет в окне среды Python. Пожалуйста, следуйте шагам, пронумерованным на изображении ниже, чтобы завершить процесс установки.

Изображение 1:- Пакет Aspose.PDF Cloud SDK для Python.
PyCharm
PyCharm — популярная IDE для разработки на Python. В этом разделе мы обсудим настройки PyCharm на платформе Windows.
- Откройте меню Файл и выберите пункт Настройки….

Изображение 2:- Пункт меню «Настройки PyCharm».
- Разверните дерево проекта слева и выберите опцию Python Interpreter.
- Нажмите на знак + (плюс) в правой части и введите asposepdfcloud в поле поиска в диалоговом окне доступных пакетов.
- Теперь нажмите кнопку «Установить пакет».

Изображение 3:- Пакет Aspose.PDF Cloud для Python.
После установки SDK отобразится сообщение об успешной установке.

Изображение 4: Сообщение об успешном завершении установки Aspose.PDF Cloud for Python.
- Если у вас нет существующей учетной записи на облачной панели управления, вы можете создать бесплатную учетную запись, используя учетные данные GitHub или Google. Теперь войдите в панель управления и получите ваши персонализированные учетные данные клиента.

Изображение 5: Учетные данные клиента на панели управления Aspose.Cloud.
Конвертировать PDF в Excel на Python
Пожалуйста, следуйте инструкциям ниже, чтобы преобразовать PDF в книгу Excel (XLSX) с помощью фрагмента кода Python. Обратите внимание, что следующие фрагменты кода предполагают, что входной PDF будет доступен в облачном хранилище.
- Сначала создайте экземпляр класса ApiClient, указав в качестве аргументов Client ID и Client Secret.
- Во-вторых, создайте экземпляр класса PdfApi, который принимает объект ApiClient в качестве аргумента.
- Теперь укажите имя входного PDF-файла и имя результирующего файла XLSX.
- Наконец, вызовите метод putpdfinstoragetoxlsx(..), который принимает входной PDF-файл, результирующее имя XLSX-файла и необязательный параметр для генерации единообразных рабочих листов.
# Для получения дополнительных примеров кода посетите https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Для получения учетных данных клиента посетите https://dashboard.aspose.cloud/
def pdf2xlsx():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# создать экземпляр PdfApi, передав PdfApiClient в качестве аргумента
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'awesomeTable.pdf'
# имя результирующей книги Excel
resultant_file_name = 'Resultant.xlsx'
# Вызов API для преобразования PDF в формат Excel
response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')
# вывести сообщение в консоль (необязательно)
print('PDF successfully converted to Excel format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))

Изображение 6: Предварительный просмотр преобразования PDF в Excel.
Образцы файлов, использованные в приведенном выше примере, можно загрузить с awesomeTable.pdf и Resultant.xlsx.
Преобразование PDF в XLS с помощью команды cURL
Преобразование PDF в XLS можно легко выполнить с помощью Aspose.PDF Cloud вместе с командами cURL, поскольку это представляет собой оптимизированный и автоматизированный подход. Используя команды cURL в сочетании с Aspose.PDF Cloud, мы не только упрощаем процесс преобразования, но и обеспечиваем бесшовную интеграцию в различные рабочие процессы.
Первым в этом подходе является генерация JSON Web Token (JWT) на основе учетных данных клиента. Поэтому, пожалуйста, выполните следующую команду для генерации токена JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Получив токен JWT, выполните следующую команду для преобразования PDF в формат XLS.
curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Заключение
В заключение, независимо от того, выбираем ли мы надежный Aspose.PDF Cloud SDK для Python или используем команды cURL в тандеме с Aspose.PDF Cloud, мы можем легко достичь нашей цели по преобразованию PDF в формат Excel. Aspose.PDF Cloud SDK для Python предлагает комплексное и удобное для разработчиков решение, предоставляя вам ряд функций помимо преобразования. С другой стороны, использование команд cURL обеспечивает универсальный и скриптовый подход. Независимо от выбранного метода, оба подхода являются мощными инструментами, революционизирующими то, как мы структурируем и извлекаем данные из PDF-файлов.
- Если у вас возникнут какие-либо проблемы при использовании Python Cloud SDK, свяжитесь с нами через бесплатный форум поддержки клиентов.
Похожие статьи
Мы рекомендуем вам ознакомиться со следующими статьями, чтобы узнать больше о: