PDF Word変換ベンチマーク

PDF内の選択可能な文字を読み取り、DOCX文書として保存した結果を確認します。 元PDFの見た目をそのまま再現する変換ではなく、ページごとの文字抽出として確認しています。

確認結果

入力 出力 確認ポイント
PDF 865KB / 4ページ DOCX 9KB / 4ページ抽出 PDF内の文字情報をDOCX文書として抽出しました。表、画像、段組み、図形の完全な再現ではありません。

向いているPDF

  • 文字を選択できるPDF
  • ページごとの本文をDOCXとして取り出したいPDF
  • 抽出後にWordで編集・整理する前提のPDF