PowerPoint presentations thường được sử dụng cho báo cáo kinh doanh, tài liệu đào tạo và kể chuyện bằng hình ảnh. Trong nhiều kịch bản tự động—như lập chỉ mục nội dung, phân tích tài liệu hoặc quy trình di chuyển—bạn có thể cần trích xuất văn bản từ các slide PowerPoint thay vì sao chép thủ công nội dung từ mỗi slide.

Hướng dẫn này giải thích cách trích xuất văn bản từ các bản trình chiếu PowerPoint bằng C# .NET REST API, cho phép các nhà phát triển lấy nội dung slide một cách lập trình mà không cần cài đặt Microsoft PowerPoint hoặc các công cụ desktop khác.

PowerPoint Processing API

Aspose.Slides Cloud SDK for .NET cung cấp một giải pháp dựa trên REST đáng tin cậy và có khả năng mở rộng để trích xuất văn bản từ các bản trình chiếu PowerPoint. API cho phép truy cập chính xác vào văn bản của slide đồng thời duy trì hiệu năng và bảo mật trong môi trường đám mây.

Vì việc xử lý diễn ra trên đám mây, cách tiếp cận này là lý tưởng cho các ứng dụng đa nền tảng, dịch vụ nền, và các nhiệm vụ tự động hoá quy mô lớn.

Tính năng chính

  • Trích xuất văn bản từ tệp PPT và PPTX.
  • API REST dựa trên đám mây với xác thực OAuth.
  • Không phụ thuộc vào Microsoft PowerPoint.
  • Hỗ trợ toàn bộ bản trình chiếu hoặc các slide riêng lẻ.
  • Tích hợp đơn giản với các dự án C# .NET.

Để bắt đầu, cài đặt Aspose.Slides-Cloud từ NuGet Package Manager và tạo một tài khoản miễn phí trên Aspose Cloud Dashboard để lấy thông tin xác thực API của bạn.

  • Bạn có thể xem bài viết này để biết thông tin về việc tạo tài khoản và lấy thông tin xác thực khách hàng.

Trích xuất văn bản từ PowerPoint bằng C# .NET

Ví dụ sau đây minh họa cách trích xuất toàn bộ văn bản từ một bản trình bày PowerPoint được lưu trữ trong lưu trữ đám mây bằng C#.

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);  

Tạo một thể hiện của lớp SlidesApi bằng cách sử dụng thông tin xác thực client.

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);  

Yêu cầu tất cả các mục văn bản từ bản trình bày.

foreach (var textItem in textItems.Items)
{
    // save each occurrence of text to the text file.
    sw.WriteLine(textItem.Text);
}  

Duyệt qua các văn bản đã trích xuất và lưu chúng cục bộ.

Trích xuất văn bản từ PowerPoint

Xem trước văn bản đã được trích xuất từ PowerPoint.

Trích xuất văn bản từ một slide PowerPoint cụ thể bằng cURL

Nếu bạn muốn làm việc trực tiếp với các endpoint REST, bạn có thể trích xuất văn bản từ một slide cụ thể bằng các lệnh cURL. Cách tiếp cận này rất hữu ích khi bạn muốn xử lý hàng loạt qua giao diện dòng lệnh.

Tạo JWT Access Token
Bước đầu tiên trong cách tiếp cận này là tạo một JWT access token. Vì vậy, vui lòng thực thi lệnh sau:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=XXXXX-XXXXXX-XXXXXX&client_secret=XXXXXXXXX" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Trích xuất văn bản từ một slide riêng lẻ
Bây giờ, thực hiện lệnh sau để trích xuất văn bản từ slide thứ 2 của bản trình chiếu PowerPoint.

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-o "Extracted.txt"

Thay thế sourceFile bằng tên tệp PowerPoint được lưu trữ trong bộ nhớ đám mây và ACCESS_TOKEN bằng token đã tạo.

Kết luận

Trích xuất văn bản từ các bản trình bày PowerPoint bằng C# .NET REST API cho phép các nhà phát triển tự động lấy nội dung slide, thực hiện phân tích văn bản và tích hợp dữ liệu trình chiếu vào các ứng dụng hiện đại. Với Aspose.Slides Cloud SDK for .NET, bạn có thể hiệu quả trích xuất văn bản từ toàn bộ bản trình bày hoặc các slide cụ thể bằng các quy trình dựa trên SDK hoặc dựa trên REST.

Liên kết hữu ích

Câu hỏi thường gặp (FAQs) ❓

  1. Tôi có thể trích xuất văn bản từ cả tệp PPT và PPTX không?
    Có. API hỗ trợ trích xuất văn bản từ cả định dạng PPT cổ điển và PPTX hiện đại.
  2. Tôi có cần cài đặt Microsoft PowerPoint không?
    Không. Tất cả việc trích xuất văn bản được thực hiện trên đám mây mà không cần phần mềm máy tính để bàn.
  3. Có thể trích xuất văn bản từ một slide duy nhất không?
    Có. Bạn có thể trích xuất văn bản từ các slide riêng lẻ bằng các endpoint REST API hoặc lệnh cURL.
  4. Tôi có thể thử trích xuất văn bản PowerPoint miễn phí không?
    Có. Aspose cung cấp bản dùng thử miễn phí để bạn có thể đánh giá các tính năng trích xuất văn bản trước khi nâng cấp.

Bài viết liên quan

Bạn nên ghé thăm các bài đăng blog sau để biết thông tin về: