pdf2htmlあるいはpdf2txt

pdfからの書き出しが可能なこれ。
ググッてもWindows版のフリーウェアは探せなかったんだけど。
pdftotxt、でした。
相変わらず続く特許調査。
データベースから返答として送られてくるPDFファイル。
今まではそれを手動で、
セレクトオール、Wordにペースト、不要分の削除、見やすいように成型、
と言う作業をしていた。
俺がやってたわけじゃないけど。
で、再編集の話になって、
割り振られてきた仕事を全置換を繰り返して成型して、
さくっと終わらせた。
そういうのは、先輩は知らなかった。
普通、知らないか。
正規表現なんて、日常生活じゃ使わないもんなのかな。
そもそもWordの置換も使った事無かったらしい。
それはびっくり。
で、話が進んで、今あるPDFファイルを変換してよ、と言う話になった。
で、処理、出力したテキストファイルを渡す。
当然レイアウト崩れてるわけだが、
納得できないらしい。
うーむ。
やるんじゃなかった。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です