Швидкий і простий підхід до вилучення сторінок із документів Word за допомогою Python SDK.

розділений документ Word | Витягніть сторінки з документа Word як окремий файл
У сфері керування документами часто виникає потреба розділити, відокремити або витягти певні розділи з документа Word. Незалежно від того, чи маєте ви справу з великими дослідницькими статтями, всебічними звітами чи великими рукописами, завдання розбити їх на більш зрозумілі частини може бути трудомістким і складним. У цій статті ми розглянемо кроки для досягнення цієї вимоги за допомогою Python Cloud SDK, що дозволить вам оптимізувати завдання керування документами та працювати ефективніше.
- API обробки тексту
- Розділіть сторінки в документі Word за допомогою Python
- Розділити документ на основі вибраних сторінок
- Витягніть сторінки з документа Word за допомогою команд cURL
API обробки тексту
Aspose.Words Cloud — це наше спеціальне рішення для обробки MS Word (DOCX, DOC, DOT, RTF, DOCM) або OpenDocument (ODT, OTT).Для обробки документів Word не потрібне стороннє програмне забезпечення чи автоматизація MS Office. Просто викличте REST API, щоб виконати свої вимоги. Оскільки API базуються на REST, тож ви можете отримати доступ до них на будь-якій платформі, включаючи настільний комп’ютер, веб, мобільний додаток тощо. Тепер відповідно до змісту цієї статті ми обговоримо подробиці того, як розділити сторінки у файлі Word як окремий документ Word. API також забезпечує гнучкість налаштування операції поділу, тобто розділення кожної сторінки, парної та непарної, за кількістю сторінок, за діапазоном сторінок.
Щоб ще більше полегшити роботу наших клієнтів, ми створили Aspose.Words Cloud SDK для Python, який є оболонкою Cloud API, тож ви можете скористатися всіма перевагами обробки документів Word у своїй улюбленій мові програмування. Тож перш ніж продовжувати, першим кроком є встановлення SDK у локальній системі. Він доступний для завантаження на PIP і GitHub. Виконайте таку команду в терміналі командного рядка, щоб інсталювати SDK:
pip install aspose-words-cloud
Якщо ви використовуєте Visual Studio як IDE, ви можете безпосередньо додати посилання на SDK у проект.
Клацніть Перегляд ->Інші Windows ->параметр Середовища Python. Як показано нижче.

Зображення 1: - Параметр меню середовища Python.
Введіть aspose-word-cloud у полі Packages у вікні Python Environments. Потім натисніть посилання Install aspose-word-cloud (21.11.0).Номер версії може змінюватися залежно від останньої/поточної версії випуску. Дивіться зображення нижче.

Зображення 2: - пакет python aspose-words-cloud.
Розділіть сторінки в документі Word за допомогою Python
Дотримуйтеся наведених нижче інструкцій, щоб розділити всі сторінки документа Word, який уже доступний у хмарному сховищі.
- По-перше, нам потрібно ініціалізувати об’єкт WordsApi, передаючи ідентифікатор клієнта та секрет клієнта як аргументи.
- По-друге, вкажіть ім’я вхідного файлу Word, результуючий вихідний формат, ім’я результуючого файлу та параметр для архівування результату.
- Завантажте вхідний документ Word у хмарне сховище за допомогою об’єкта UploadFileRequest.
- Тепер створіть екземпляр SplitDocumentRequest, передаючи деталі, визначені на другому кроці.
- Нарешті, викличте метод splitdocument(…) класу WordsApi, щоб розділити документи Word. Отримані файли зберігаються в картографованому хмарному сховищі.
try:
# створити екземпляр WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# Назва вхідного документа Word
inputFileName = 'source.doc'
# результуючий формат файлу
resultantFormat = 'DOCX'
# Назва результуючого документа після операції. Якщо цей параметр опущено
# тоді результуючий файл буде збережено з назвою вхідного документа
resultantFile = 'Split-File'
# Прапорець, який вказує, чи слід архівувати вихідні дані.
zipOutput = 'false'
# Завантажте вихідний документ Word у Cloud Storage
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# Створіть об’єкт для розділення документа
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,None, None, zipOutput, None)
# ініціювати операцію Word Split
result = words_api.split_document(request)
# друкувати повідомлення в консолі (необов'язково)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

Зображення 3: - Попередній перегляд операції розділення документа.
Розділити документ на основі вибраних сторінок
У цьому розділі ми збираємося обговорити деталі того, як розділити документ на основі вибраних сторінок і зберегти результат як ZIP-архів. Фрагмент коду майже такий самий, як наведено вище, за винятком того, що нам потрібно вказати значення «Сторінка з», «Сторінка до» та «Правдиве» для виведення, яке буде архівовано.
try:
# створити екземпляр WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# Назва вхідного документа Word
inputFileName = 'source.doc'
# результуючий формат файлу
resultantFormat = 'DOCX'
# Назва результуючого документа після операції. Якщо цей параметр опущено
# тоді отриманий файл буде збережено з назвою вхідного документа
resultantFile = 'SplitOutput'
# Прапор, що вказує на вихід, має бути в архіві ZIP.
zipOutput = 'false'
# Завантажте вихідний документ Word у Cloud Storage
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# Створіть об’єкт для розділення документа
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,pageFrom, pageTo, zipOutput, None)
# ініціювати операцію Word Split
result = words_api.split_document(request)
# друкувати повідомлення в консолі (необов'язково)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

Зображення 4: - Попередній перегляд операції розділення документа для вибраних сторінок.
Витягніть сторінки з документа Word за допомогою команд cURL
Як і інші REST API, доступ до Aspose.Words Cloud можна отримати за допомогою команд cURL у терміналі командного рядка. Однак перш ніж продовжувати, нам потрібно спочатку згенерувати маркер доступу JWT на основі облікових даних клієнта.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Після створення маркера виконайте наведену нижче команду, щоб видобути сторінки з документа Word і зберегти результат у хмарному сховищі.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>"
Висновок
У цій статті ми досліджували можливість створення розділювача документів, який може розбивати документ Word на окремі файли сторінок за допомогою Python SDK. Крім того, відповідно до ваших вимог ви можете використовувати Python SDK або видобувати сторінки з документа Word за допомогою команд cURL. Зверніть увагу, що ми віримо в колективне зростання та співпрацю. Таким чином, наші SDK розроблено відповідно до ліцензії MIT, і їх повний вихідний код доступний для завантаження на Github. Якщо вам потрібно, ви можете завантажити та змінити код відповідно до ваших вимог. Якщо у вас виникнуть проблеми чи додаткові запитання, зв’яжіться з нами через безкоштовний форум підтримки продуктів.
Схожі статті
Рекомендуємо перейти за наведеними нижче посиланнями, щоб дізнатися більше про: