Nós frequentemente precisamos converter PDF em arquivos de texto para uso em análise de dados, indexação de busca ou reaproveitamento de conteúdo. Além disso, se você deseja construir um conversor de PDF para texto, automatizar OCR online ou copiar texto de documentos PDF para processamento posterior, nossa API REST fornece uma solução confiável e amigável para desenvolvedores.
- API de Conversão de PDF
- Conversão de PDF para Texto usando C# .NET
- Converter PDF para arquivo TXT usando cURL
API de Conversão de PDF
O Aspose.PDF Cloud SDK for .NET é uma API baseada em nuvem que simplifica a extração de texto de documentos e o processamento de PDFs. Ele lida inteligentemente tanto com PDFs baseados em texto quanto em imagem, fornecendo uma saída precisa e estruturada no formato TXT.
Os principais recursos incluem:
- Extração de PDF para arquivo TXT com alta precisão.
- API REST multiplataforma — funciona perfeitamente em C#, .NET Core ou em qualquer ambiente com suporte a HTTP.
- Suporte para extração parcial — defina regiões e extraia texto de áreas específicas.
Para começar, adicione o SDK ao seu projeto .NET usando o NuGet:
Install-Package Aspose.PDF-Cloud
Em seguida, visite o Aspose Cloud Dashboard para obter suas credenciais de ID do Cliente e Segredo do Cliente.
Conversão de PDF para Texto usando C# .NET
Vamos olhar como converter um PDF em um arquivo de texto em C# usando a API REST .NET.
Passo 1. - Crie uma instância da classe PdfApi
usando credenciais do cliente.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Etapa 2. - Leia o arquivo PDF de entrada e envie para o armazenamento em nuvem.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
Passo 3. - Especifique a região retangular no PDF e extraia o texto usando o método GetText(...)
.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
Passo 4. - Iterar através da lista contendo ocorrências de texto e salvá-la no disco local.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// Para exemplos completos e arquivos de dados, por favor vá para https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet
// Obtenha credenciais de cliente em https://dashboard.aspose.cloud/
// Crie uma instância da classe PdfApi
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// Carregue o PDF para o armazenamento em nuvem
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// Salve o texto extraído localmente
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
Converter PDF para arquivo TXT usando cURL
Para desenvolvedores que preferem um fluxo de trabalho de script ou multiplataforma, a Aspose.PDF Cloud REST API também pode ser acessada usando comandos cURL.
Passo 1. – Gere um Token de Acesso:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Passo 2. – Extrair Texto do PDF Uma vez que o token JWT foi gerado, por favor, execute o seguinte comando para extrair o texto do documento PDF.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
Este comando cURL recupera o conteúdo textual do seu arquivo PDF e o armazena em um arquivo .txt, tornando-o um método ideal para conversão de PDF para arquivo de texto em ambientes automatizados.
Tente o conversor de PDF para texto gratuito
Você está procurando conversão de PDF para TXT sem codificação? Experimente nosso Conversor de PDF para Texto Online gratuito — alimentado pelo Aspose.PDF Cloud. Basta enviar o seu PDF e baixar o arquivo de texto extraído em segundos.

Conclusão
Neste artigo, aprendemos que a conversão de PDF para texto é essencial para extrair e reutilizar informações de maneira eficiente. Com o Aspose.PDF Cloud, você pode automatizar o processo de copiar texto de PDFs, lidar com arquivos digitalizados usando OCR online e exportar dados como texto estruturado para análises ou indexação de busca.
Perguntas Frequentes (FAQs)
-
Can I copy text from PDF programmatically? Absolutamente. A API permite que você copie texto de arquivos PDF recuperando todas as ocorrências de texto ou extraindo de regiões específicas usando coordenadas.
-
Qual é a diferença entre PDF para texto e texto para PDF? PDF para texto extrai dados textuais de documentos, enquanto texto para PDF cria um novo documento PDF a partir de entrada de texto simples. Aspose.PDF Cloud suporta ambas as operações.
-
Do I need Adobe Acrobat installed? Não. O Aspose.PDF Cloud SDK opera independentemente do Adobe Acrobat ou qualquer outro software. Todas as operações de conversão de PDF para texto ocorrem na nuvem.
-
O texto extraído é preciso para layouts complexos? Sim. A API pode extrair texto com precisão de layouts de várias colunas, tabelas e PDFs com conteúdo misto, mantendo uma estrutura limpa e legível no arquivo TXT resultante.
Links Úteis
Artigos Relacionados
Recomendamos fortemente visitar os seguintes blogs: