Sıklıkla PDF dosyalarını veri analizi, arama dizinleme veya içerik yeniden kullanımında kullanılmak üzere metin dosyalarına dönüştürmemiz gerekiyor. Ayrıca, bir PDF’den metin dönüştürücü oluşturmak, çevrimiçi OCR’ı otomatikleştirmek veya PDF belgelerinden metin kopyalamak istiyorsanız, REST API’miz güvenilir ve geliştirici dostu bir çözüm sunmaktadır.
- PDF Dönüştürme API’si
- C# .NET kullanarak PDF’den Metin Dönüşümü
- PDF’yi TXT Dosyasına Dönüştürmek için cURL Kullanma
PDF Dönüşüm API’si
Aspose.PDF Cloud SDK for .NET, belge metin çıkarımı ve PDF işleme süreçlerini basit hale getiren bulut tabanlı bir API’dir. Hem metin tabanlı hem de görüntü tabanlı PDF’leri zeki bir şekilde işleyerek, TXT formatında doğru ve yapılandırılmış çıktı sağlar.
Anahtar özellikler şunlardır:
- PDF’den TXT dosyasına yüksek doğrulukla çıkarım.
- Çapraz platform REST API — C#, .NET Core veya HTTP desteği olan herhangi bir ortamda kesintisiz çalışır.
- Kısmi çıkarım desteği — bölgeleri tanımlayın ve belirli alanlardan metin çıkarın.
Başlamak için, SDK’yı .NET projenize NuGet kullanarak ekleyin:
Install-Package Aspose.PDF-Cloud
Sonra, Aspose Cloud Dashboard ziyaret ederek Client ID ve Client Secret kimlik bilgilerinizi alın.
C# .NET kullanarak PDF’den Metin Dönüşümü
PDF’yi C# kullanarak .NET REST API’si ile metin dosyasına nasıl dönüştüreceğimize bakalım.
Adım 1. - Müşteri kimlik bilgilerini kullanarak PdfApi
sınıfının bir örneğini oluşturun.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Adım 2. - Girdi PDF dosyasını okuyun ve bulut depolama alanına yükleyin.
var sourceFile = File.OpenRead(inputFile);
pdfApi.UploadFile("inputPDF.pdf", sourceFile);
Adım 3. - PDF’de dikdörtgen bölgeyi belirtin ve metni GetText(...)
yöntemiyle çıkarın.
TextRectsResponse response = pdfApi.GetText("inputPDF.pdf", LLX, LLY, URX, URY, null, null, null, null, null);
Adım 4. - Metin occurrences içeren Listeyi dolaşıp yerel sürücüye kaydedin.
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
// Tam örnekler ve veri dosyaları için lütfen https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet adresine gidin.
// Müşteri kimlik bilgilerini https://dashboard.aspose.cloud/ adresinden alın.
// PdfApi sınıfının bir örneğini oluşturun
var pdfApi = new PdfApi("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
// PDF'yi bulut depolama alanına yükleyin.
using (var fileStream = File.OpenRead("inputPDF.pdf"))
{
pdfApi.UploadFile("inputPDF.pdf", fileStream);
}
// Extract text from the uploaded PDF
var response = pdfApi.GetText("inputPDF.pdf", 0, 0, 800, 800, null, null, null, null, null);
// Yerel olarak çıkarılan metni kaydedin.
using (StreamWriter output = new StreamWriter("output.txt"))
{
foreach (var textFragment in response.TextOccurrences.List)
{
output.WriteLine(textFragment.Text);
}
}
Console.WriteLine("PDF to text conversion completed successfully!");
PDF’yi TXT Dosyasına dönüştürmek için cURL kullanın
Geliştiriciler için komut dosyası veya çok platformlu bir iş akışını tercih edenler, Aspose.PDF Cloud REST API’sine cURL komutları kullanarak da erişebilir.
Adım 1. – Bir Erişim Jetonu Oluşturun:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXXXX-XXXXXX-ff5c3a6aa4a2&client_secret=XXXXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Adım 2. – PDF’den Metin Çıkarma JWT token oluşturulduktan sonra, lütfen PDF belgesinden metni çekmek için aşağıdaki komutu çalıştırın.
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "resultant.txt"
Bu cURL komutu, PDF dosyanızdan metin içeriğini alır ve bunu .txt dosyasına kaydeder, bu da otomatik ortamlarda PDF’den metin dosyasına dönüşüm için ideal bir yöntemdir.
Ücretsiz PDF’den Metne Dönüştürücü’yü Deneyin
PDFyi TXT
ye kodlama olmadan mı dönüştürmek istiyor musunuz?
Ücretsiz Çevrimiçi PDF’den Metne Dönüştürücü hizmetimizi deneyin — Aspose.PDF Cloud tarafından desteklenmektedir. PDF’nizi yükleyin ve saniyeler içinde çıkarılan metin dosyasını indirin.

Sonuç
Bu makalede, PDF’den metne dönüşümün bilgileri etkili bir şekilde çıkarmak ve yeniden kullanmak için hayati öneme sahip olduğunu öğrendik. Aspose.PDF Cloud ile, PDF’lerden metin kopyalama, taranmış dosyaları çevrimiçi OCR kullanarak işleme alma ve verileri analitik veya arama dizinlemesi için yapılandırılmış metin olarak dışa aktarma sürecini otomatikleştirebilirsiniz.
Sıkça Sorulan Sorular (SSS)
-
Can I copy text from PDF programmatically? Kesinlikle. API, PDF dosyalarındaki metinleri tüm metinOccurrences’ı alarak veya belirli bölgelerden koordinatlar kullanarak çıkartarak kopyalamanıza olanak tanır.
-
PDF’den metne ve metinden PDF’ye arasındaki fark nedir? PDF’den metin, belgelerden metin verisi çıkarır, metinden PDF’ye ise düz metin girdisinden yeni bir PDF belgesi oluşturur. Aspose.PDF Cloud her iki işlemi de destekler.
-
Do I need Adobe Acrobat installed? Hayır. Aspose.PDF Cloud SDK, Adobe Acrobat veya başka bir yazılımdan bağımsız olarak çalışır. Tüm PDF’den metne dönüştürme işlemleri bulutta gerçekleşir.
-
Çıkarılan metin karmaşık düzenler için doğru mu? Evet. API, çok sütunlu düzenlerden, tablolar ve karışık içerikli PDF’lerden metni doğru bir şekilde çıkarabilir ve sonuçtaki TXT dosyasında temiz ve okunabilir bir yapı koruyabilir.
Faydalı Bağlantılar
İlgili Makaleler
Aşağıdaki blogları ziyaret etmenizi şiddetle tavsiye ediyoruz: