PowerPoint presentations は、ビジネスレポート、トレーニング資料、ビジュアルストーリーテリングで一般的に使用されます。多くの自動化シナリオ(コンテンツインデックス作成、ドキュメント分析、またはマイグレーションワークフローなど)では、各スライドから手動でコンテンツをコピーする代わりに PowerPoint スライドからテキストを抽出 する必要がある場合があります。

このチュートリアルでは、C# .NET REST API を使用して PowerPoint プレゼンテーションからテキストを抽出する方法を説明し、Microsoft PowerPoint やその他のデスクトップツールをインストールせずに、開発者がプログラムでスライドの内容を取得できるようにします。

PowerPoint Processing API

Aspose.Slides Cloud SDK for .NET は、PowerPoint プレゼンテーションからテキストを抽出するための信頼性が高くスケーラブルな REST ベースのソリューションを提供します。この API は、クラウド環境におけるパフォーマンスとセキュリティを維持しながら、スライドテキストへの正確なアクセスを可能にします。

処理がクラウドで行われるため、このアプローチはクロスプラットフォームアプリケーション、バックグラウンドサービス、そして大規模な自動化タスクに最適です。

主な機能

  • PPT と PPTX ファイルからテキストを抽出します。
  • OAuth 認証を使用したクラウドベースの REST API。
  • Microsoft PowerPoint への依存はありません。
  • プレゼンテーション全体または個々のスライドをサポートします。
  • C# .NET プロジェクトへの簡単な統合。

開始するには、NuGet パッケージ マネージャーから Aspose.Slides-Cloud をインストールし、Aspose Cloud Dashboard で無料アカウントを作成して API 資格情報を取得してください。

  • アカウントの作成とクライアント認証情報の取得に関する情報は、この記事をご覧になることをご検討ください。

C# .NET を使用して PowerPoint からテキストを抽出

以下の例は、C# を使用してクラウドストレージに保存された PowerPoint プレゼンテーションからすべてのテキストを抽出する方法を示しています。

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);  

クライアント認証情報を使用して SlidesApi クラスのインスタンスを作成します。

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);  

プレゼンテーションからすべてのテキスト項目を取得します。

foreach (var textItem in textItems.Items)
{
    // save each occurrence of text to the text file.
    sw.WriteLine(textItem.Text);
}  

抽出されたテキストを反復処理し、ローカルに保存します。

Extract text from PowerPoint

PowerPoint から抽出されたテキストのプレビュー。

cURL を使用して特定の PowerPoint スライドからテキストを抽出する

REST エンドポイントを直接操作したい場合は、cURL コマンドを使用して特定のスライドからテキストを抽出できます。この方法は、コマンドラインでバッチ処理を行いたい場合に非常に便利です。

JWT アクセストークンの生成
この手順の最初のステップは JWT アクセストークンを生成することです。以下のコマンドを実行してください。

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=XXXXX-XXXXXX-XXXXXX&client_secret=XXXXXXXXX" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

個別スライドからテキストを抽出する
PowerPoint プレゼンテーションの 2 番目のスライドからテキストを抽出するには、次のコマンドを実行します。

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-o "Extracted.txt"

sourceFile をクラウドストレージに保存されている PowerPoint ファイル名に置き換え、ACCESS_TOKEN を生成されたトークンに置き換えてください。

結論

C# .NET REST API を使用して PowerPoint プレゼンテーションからテキストを抽出することで、開発者はスライドコンテンツの取得を自動化し、テキスト分析を実行し、プレゼンテーションデータを最新のアプリケーションに統合できます。
Aspose.Slides Cloud SDK for .NET を使用すれば、SDK ベースまたは REST ベースのワークフローを利用して、プレゼンテーション全体または特定のスライドからテキストを効率的に抽出できます。

便利なリンク

よくある質問 (FAQs) ❓

  1. PPT と PPTX の両方のファイルからテキストを抽出できますか?
    はい。API はレガシー PPT とモダン PPTX の両方の形式からテキスト抽出をサポートしています。

  2. Microsoft PowerPoint をインストールする必要がありますか?
    いいえ。すべてのテキスト抽出はクラウド上で実行され、デスクトップソフトウェアは不要です。

  3. 単一のスライドからテキストを抽出することは可能ですか?
    はい。REST API エンドポイントや cURL コマンドを使用して、個々のスライドからテキストを抽出できます。

  4. PowerPoint のテキスト抽出を無料でテストできますか?
    はい。Aspose は無料トライアルを提供しており、アップグレード前にテキスト抽出機能を評価できます。

関連記事

以下のブログ記事をご覧になることを強くお勧めします: