画像 PDF から検索可能な PDF

画像 PDF を検索可能な PDF に変換

書籍や文書を長期保存するには、画像としてスキャンするのが最も手っ取り早い方法の 1 つです。また、小冊子として保管する必要がある場合は、すべての画像を 1 つの PDF ドキュメントとして結合できます。しかし、PDF ドキュメントが画像で構成されている場合、さらに操作するためにテキスト情報をコピー/抽出することは非常に困難です。この記事では、Java クラウド SDK を使用して PDF ファイルを OCR し、検索不可能な PDF を検索可能な PDF に変換する方法について詳しく説明します。

OCR PDF Java SDK

PDF ファイルを作成、操作、およびさまざまな サポートされている形式 に変換するために、Aspose.PDF Cloud を開発しました。 OCR PDF Free を Java アプリケーションに実装するには、Java Cloud API のラッパーである Aspose.PDF Cloud SDK for Java を使用する必要があります。 SDK を使用するための最初のステップは、インストールです。そのため、maven ビルド タイプのプロジェクトの pom.xml に次の詳細を追加してください。

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

JDK リファレンスが追加されたら、Aspose Cloud で無料のアカウントを作成してください。新しく作成したアカウントを使用してログインし、クラウド ダッシュボード でクライアント ID とクライアント シークレットを検索/作成します。これらの詳細は、以降のセクションで必要になります。

スキャンした PDF を Java を使用して検索可能な PDF に変換

このセクションでは、Java コード スニペットを使用して、スキャンした PDF を検索可能な PDF に変換する方法について詳しく説明します。 Java Cloud SDK は次の言語の認識をサポートしていることに注意してください: eng、ara、bel、ben、bul、ces、dan、deu、ell、fin、fra、heb、hin、ind、isl、ita、jpn、kor、nld 、nor、pol、por、ron、rus、spa、swe、tha、tur、ukr、vie、chisim、chitra、またはこれらの組み合わせ (eng、rus など)。

  • 最初のステップは、ClientID とクライアント シークレットの詳細を引数として受け取る PdfApi オブジェクトを作成することです。
  • 次に、OCR PDF をロードするファイル インスタンスを作成します。
  • 3 番目に、uploadFile(…) メソッドを呼び出して、入力 PDF をクラウド ストレージにアップロードします。
  • 画像 PDF には英語のテキストが含まれているため、値「eng」を保持する文字列オブジェクトを作成する必要があります。
  • 最後に、入力 PDF と言語コードを引数として必要とする putSearchableDocument(…) メソッドを呼び出します。結果の検索可能な PDF は、同じクラウド ストレージに保存されます。
try
    {
    // https://dashboard.aspose.cloud/ から ClientID と ClientSecret を取得します。
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // createPdfApi インスタンス
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
	    				
    // 入力画像PDF文書
    String name = "ScannedPDF.pdf";	        
	    			    
    // ローカル システムからファイルをロードする
    File file = new File(name);
    // ファイルをクラウド ストレージにアップロードする
    FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
	    				
    // 画像 PDF で使用される言語
    String lang = "eng";
	    				
    //  画像 PDF ドキュメントで OCR を実行する
    AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
	    
    // 成功メッセージを出力する
    System.out.println("OCR PDF successfull !");
    }catch(Exception ex)
    {
        System.out.println(ex.getMessage());
    }
画像 PDF から検索可能な PDF

Image1:- 検索可能な PDF プレビュー

上記の例で使用されているスキャンした PDF は BusinessReport.pdf からダウンロードでき、結果の検索可能な PDF は Converted.pdf からダウンロードできます。

cURL コマンドを使用した OCR オンライン

cURL コマンドは、コマンド ライン ターミナルから REST API にアクセスするための便利な方法の 1 つです。したがって、このセクションでは、オンラインでの OCR に cURL コマンドを使用します。前提条件として、次のコマンドを実行する際に、最初に (クライアントの資格情報に基づいて) JWT アクセス トークンを生成する必要があります。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWTトークンを取得したら、次のコマンドを実行してオンラインでOCRを実行し、画像PDFを検索可能なPDFドキュメントに変換してください。結果のファイルは、クラウド ストレージに保存されます。

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

結論

この記事では、Java Cloud SDK を使用して画像 PDF を検索可能な PDF に変換するための、シンプルでありながら驚くべき手順について説明しました。そのため、Java コード スニペットまたは cURL コマンドを使用して OCR PDF を実行するオプションがあります。このアプローチとは別に、swagger インターフェイス を介して Web ブラウザー内で API にアクセスすることを検討することもできます。さらに、SDK は MIT ライセンスの下で構築されているため、GitHub から完全なソース コードをダウンロードできます。 API の使用中に問題が発生した場合は、製品サポート フォーラム からお気軽にお問い合わせください。

関連記事

詳細については、次のリンクにアクセスすることを強くお勧めします。