Розробіть конвертер PDF у Excel за допомогою Python Cloud SDK.

Перетворення PDF в Excel

Як конвертувати PDF в Excel | Експорт PDF в Excel за допомогою Python SDK

Файли PDF чудово підходять для збереження форматування документа, але вилучення та використання даних із них може бути складним. Тут стає очевидною необхідність конвертації PDF в Excel. Робоча книга Excel із форматом електронної таблиці пропонує структурований спосіб організації та обробки даних. Уявіть собі, що таблиці, малюнки та текст без проблем витягуєте з PDF-файлу та акуратно розташовуєте їх у клітинках Excel, готових для аналізу. Це перетворення не тільки спрощує обробку даних, але й підвищує ефективність і продуктивність.

Крім того, excel переважно використовується для зберігання та організації даних, таких як доходи, заробітна плата та бухгалтерська інформація. Вони дозволяють користувачеві робити розрахунки з цими даними та створювати графіки та діаграми. Тепер у цій статті ми збираємося обговорити деталі того, як перетворити PDF у формат Excel.

Python Cloud SDK для обробки PDF

Aspose.PDF Cloud SDK для Python стає потужним інструментом для оптимізації процесу перетворення PDF у XLS. Це не тільки полегшує безпроблемне перетворення «pdf в excel», але й пропонує безліч інших можливостей. Уявіть собі, що ви використовуєте можливість маніпулювати PDF-файлами, витягувати певні дані та легко створювати готові до Excel файли.

Першим кроком є встановлення Python Cloud SDK, який доступний для завантаження в PIP і GitHub репозиторії. Отже, виконайте наступну команду в терміналі/командному рядку, щоб інсталювати останню версію Cloud SDK.

pip install asposepdfcloud

MS Visual Studio

Якщо вам потрібно безпосередньо додати посилання у свій проект Python у Visual Studio IDE, виконайте пошук asposepdfcloud як пакет у вікні середовища Python. Щоб завершити процес встановлення, виконайте кроки, пронумеровані на зображенні нижче.

Збережіть PDF в Excel

Зображення 1:- Aspose.PDF Cloud SDK для пакета Python.

PyCharm

PyCharm — це популярне середовище розробки для Python. У цьому розділі ми обговоримо налаштування PyCharm на платформі Windows.

  • Клацніть меню «Файл» і виберіть пункт «Параметри…».
Налаштування PyCharm

Зображення 2: - Пункт меню налаштувань PyCharm.

  • Розгорніть дерево проекту зліва та виберіть опцію Інтерпретатор Python.
  • Натисніть знак + (плюс) у правій частині та введіть asposepdfcloud у полі пошуку над діалоговим вікном доступних пакетів.
  • Тепер натисніть кнопку «Установити пакет».
Перетворення PDF на Excel SDK

Зображення 3:- Aspose.PDF Cloud для пакета Python.

Після встановлення SDK з’явиться повідомлення про успішне виконання.

PDF в Excel SDK

Зображення 4: - Повідомлення про успіх після встановлення Aspose.PDF Cloud для Python.

  • Якщо у вас немає облікового запису на хмарній інформаційній панелі, ви можете створити безкоштовний обліковий запис за допомогою облікових даних GitHub або Google. Тепер увійдіть на інформаційну панель і отримайте персоналізовані облікові дані клієнта.
Облікові дані клієнта

Зображення 5: облікові дані клієнта на інформаційній панелі Aspose.Cloud.

Перетворіть PDF на Excel на Python

Дотримуйтеся наведених нижче інструкцій, щоб перетворити PDF на книгу Excel (XLSX) за допомогою фрагмента коду Python. Зауважте, що слідувати фрагментам коду очікується, що вхідний PDF буде доступним у хмарному сховищі.

  • По-перше, створіть екземпляр класу ApiClient, надаючи як аргументи Client ID Client Secret.
  • По-друге, створіть екземпляр класу PdfApi, який приймає об’єкт ApiClient як аргумент.
  • Тепер укажіть ім’я вхідного PDF-файлу та ім’я отриманого файлу XLSX.
  • Нарешті, викличте метод putpdfinstoragetoxlsx(..), який приймає вхідний PDF-файл, результуюче ім’я файлу XLSX і необов’язковий параметр для створення уніфікованих аркушів.
# Для отримання додаткових зразків коду відвідайте https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Щоб отримати облікові дані клієнта, відвідайте https://dashboard.aspose.cloud/

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # створити екземпляр PdfApi, передаючи PdfApiClient як аргумент
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # назва отриманої книги Excel
        resultant_file_name = 'Resultant.xlsx'
    
        # Виклик API для перетворення PDF у формат Excel
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # друкувати повідомлення в консолі (необов'язково)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
Попередній перегляд PDF у XLSX

Зображення 6: попередній перегляд перетворення PDF у Excel.

Зразки файлів, використаних у наведеному вище прикладі, можна завантажити з awesomeTable.pdf і Resultant.xlsx.

Перетворення PDF у XLS за допомогою команди cURL

Перетворення pdf на XLS можна легко здійснити за допомогою Aspose.PDF Cloud разом із командами cURL, оскільки це спрощений та автоматизований підхід. Використовуючи команди cURL у поєднанні з Aspose.PDF Cloud, ми не лише спрощуємо процес перетворення, але й забезпечуємо плавну інтеграцію в різні робочі процеси.

Першим у цьому підході є створення JSON Web Token (JWT) на основі облікових даних клієнта. Отже, будь ласка, виконайте наступну команду, щоб згенерувати маркер JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Отримавши маркер JWT, виконайте наступну команду, щоб конвертувати PDF у формат XLS.

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Висновок

Підсумовуючи, незалежно від того, чи обираєте ви надійний Aspose.PDF Cloud SDK для Python чи використовуєте команди cURL у тандемі з Aspose.PDF Cloud, ми можемо легко досягти нашої мети – перетворити PDF у формат Excel. Aspose.PDF Cloud SDK для Python пропонує комплексне та зручне для розробників рішення, яке надає вам низку функцій, крім перетворення. З іншого боку, використання команд cURL забезпечує універсальний і сценарійний підхід. Незалежно від обраного методу, обидва підходи є потужними інструментами, кардинально змінюючи структуру та вилучення даних із PDF-файлів.

Схожі статті

Рекомендуємо переглянути такі статті, щоб дізнатися про: