Development Concept
小説や同人誌のPDFは縦書きで組まれていることが多くあります。そのPDFからテキストをコピーすると、ページ上の位置情報をもとに文字が抽出されるため、縦方向・横方向の順序が混在してしまい、まともに読めない状態になります。
文章を引用したい、感想を書くために本文を手元に置きたい、原稿の一部を文字起こししたい……そういった場面で、縦書きPDFのテキスト抽出は思いのほか壁になります。手で打ち直すのは時間がかかりますし、スキャンしたPDFではそもそもコピーができません。
このツールは縦書きPDFを読み込み、文字の並び順を解析して横書きの読み順に並べ替えてテキストを出力します。完全に正確な変換は難しい場合もありますが、手で打ち直すよりもずっと早く、引用や参照に使えるテキストを取り出せます。
また、PDFのデータはブラウザ内のみで処理されるため、外部サーバーへの送信は一切ありません。未発表の原稿や非公開のPDFも安心して使えます。
Features
How to Use
※ スキャンPDF(画像として保存されたPDF)はテキスト抽出に対応していません。
※ 文字の配置によっては変換精度が下がる場合があります。参考情報としてご利用ください。