extraer texto de powerpoint

Cómo extraer texto de PowerPoint usando .NET REST API.

En el ámbito del procesamiento de información moderno, las presentaciones de PowerPoint se han convertido en un medio omnipresente para compartir información, realizar presentaciones impactantes y transmitir ideas. Ahora bien, si busca descubrir tendencias ocultas, reutilizar contenido u obtener una comprensión más profunda, la capacidad de extraer texto de PowerPoint es una habilidad asombrosa. Sin embargo, extraer el texto de estas presentaciones puede ser una tarea desafiante, especialmente cuando se trata de archivos grandes o complejos. Este artículo presenta una poderosa solución para extraer texto de PowerPoint y explica las capacidades innovadoras del SDK de Aspose.Slides Cloud para .NET.

API REST para extraer texto de PowerPoint

Cuando se trata de extraer texto de presentaciones de PowerPoint, Aspose.Slides Cloud SDK para .NET se destaca como una herramienta potente y versátil. Con su amplio conjunto de funciones y su API integral, este SDK permite a los desarrolladores extraer texto de presentaciones sin esfuerzo, con precisión y eficiencia.

El primer paso es la instalación del SDK. Entonces, primero debemos buscar Aspose.Slides-Cloud en el administrador de paquetes de NuGet y hacer clic en el botón Agregar paquete. En caso de que no tenga una cuenta existente en panel de control en la nube, simplemente cree una cuenta gratuita siguiendo las instrucciones especificadas en [inicio rápido](https://docs.aspose .cloud/slides/quickstart/).

Extraiga texto de PowerPoint usando C# .NET

Exploremos los detalles sobre cómo podemos extraer eficientemente el texto de PowerPoint completo usando un fragmento de código C# .NET.

// Para obtener más ejemplos, visite https://github.com/aspose-slides-cloud
// Obtenga credenciales de cliente desde https://dashboard.aspose.cloud/
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";

// crear una instancia de SlidesApi
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

// nombre de la presentación de PowerPoint de entrada
string sourcePPTX = "Inspirational bookmarks.pptx";

// Llame a la API para extraer todo el texto de la presentación de PowerPoint
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

// Crea un objeto de StreamWriter para que podamos guardar el contenido extraído.
StreamWriter sw = new StreamWriter("Test.txt");

// Iterar a través de cada instancia de texto extraído
foreach (var textItem in textItems.Items)
{
    // escribir cada aparición de texto en un archivo de texto en el sistema
    sw.WriteLine(textItem.Text);
}
// cerrar el StreamWriter 
sw.Close();

Ahora desarrollemos nuestra comprensión sobre el fragmento de código indicado anteriormente.

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

Cree un objeto de la clase SlidesApi donde pasamos las credenciales del cliente como argumentos.

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

Llame a la API para extraer todo el contenido textual de la presentación de PowerPoint disponible en el almacenamiento en la nube.

StreamWriter sw = new StreamWriter("Test.txt");

Cree StreamWriter que nos ayudará a guardar el contenido extraído en el disco local.

foreach (var textItem in textItems.Items)
{
    sw.WriteLine(textItem.Text);
}
sw.Close();

Repita cada aparición de texto extraído y guarde el resultado en un archivo de texto.

Extraer texto de PowerPoint

Vista previa de extracción de texto de PowerPoint.

Puede considerar descargar el PowerPoint de muestra utilizado en el ejemplo anterior desde Inspirational bookmarks.pptx .

Extraiga texto de una diapositiva particular usando comandos cURL

Otra alternativa para extraer texto de diapositivas de PowerPoint es utilizar comandos cURL. Con cURL, puede interactuar con la API de la nube Aspose.Slides directamente a través de solicitudes HTTP, lo que la convierte en una opción flexible y accesible para las capacidades de extracción de texto. Entonces, al construir el punto final API apropiado y especificar los parámetros deseados, puede enviar un comando cURL para recuperar texto de diapositivas específicas o de toda la presentación.

El primer paso de este enfoque es generar un token de acceso JWT. Entonces, ejecute el siguiente comando:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Ahora, ejecute el siguiente comando para extraer texto de la segunda diapositiva de una presentación de PowerPoint.

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-o "Extracted.txt"

Reemplace sourceFile con el nombre de un PowerPoint de entrada disponible en el almacenamiento en la nube y accessToken con el token de acceso JWT generado anteriormente.

Conclusión

En conclusión, hemos aprendido que la capacidad de extraer texto de diapositivas de PowerPoint es una característica valiosa que nos permite acceder y utilizar el contenido textual de las presentaciones para diversos fines. Ya sea para análisis de datos, análisis de contenido o cualquier otra aplicación, extraer texto de diapositivas de PowerPoint nos permite desbloquear la información contenida en estos archivos. Al aprovechar el SDK de Aspose.Slides Cloud para .NET, podemos realizar operaciones de extracción de texto de manera fácil y eficiente en la aplicación .NET o, el uso de comandos cURL proporciona un enfoque conveniente e independiente de la plataforma.

Enlaces útiles

Artículos relacionados

Recomendamos encarecidamente visitar los siguientes blogs: