PDF OCR
スキャンPDFや画像内の文字までブラウザ内で認識し、テキストとして保存できます。
PDF内の選択可能な文字だけを取り出す場合は、 PDFテキスト抽出 をご利用ください。
- 登録不要
- インストール不要
- ブラウザ内で処理
使い方
- PDFまたは画像を選択します。
- 必要に応じて読み取るページ範囲と言語を選びます。
- OCR結果を確認し、TXTファイルをダウンロードします。
対応ファイルと注意点
- 対応形式: PDF、JPG、JPEG、PNG、WebP
- 上限: 1ファイル120MB、最大40ページまたは40画像
- 日本語、英語、中国語の読み取り設定を選べます。
ご利用前の確認
- OCR結果は完全ではありません。提出、契約、請求などに使う前に必ず内容を確認してください。
- 文字が小さい、傾いている、低解像度、手書き、背景が濃い画像では認識精度が下がります。
- 初回はOCRモデルの読み込みに時間がかかります。
- 大きなPDFや複雑なPDFでは、処理に時間がかかる場合があります。
- 重要なファイルは、元ファイルのバックアップを残してから処理してください。
PDF OCRのFAQ
スキャンPDFの文字を抽出できますか?
はい。画像として保存されたスキャンPDFをページごとにOCRし、読み取った文字をTXTで保存できます。PDF内の選択可能な文字だけを取り出したい場合は、PDFテキスト抽出をご利用ください。
OCR結果は正確ですか?
文字の大きさ、解像度、傾き、背景、フォントによって精度が変わります。重要な用途では必ず目視で確認してください。
PDFや画像はアップロードされますか?
いいえ。OCR処理はブラウザ内で行います。OCRモデルはサイトから読み込みますが、選択ファイルはサーバーへ送信しません。