AcrobatでPDFの編集をしてはいけない。

2017年11月1日

英語版のボードゲームの翻訳作業をしている。幸いなことに英語版のPDFファイルがあったので、これを元に日本語化を進めている。

手順としては、英語の部分を消して、日本語に書き換える。それだけなんだけど、これがとてつもなく大変な作業だった。

Acrobatでテキストを入力、保存。後から再編集するためにファイルを開く。すると文字が段落ごとにバラバラになってしまうのだ。例えば10行入力していたものが、2行、3行、4行、1行みたいにバラバラの矩形エリアになってしまう。それらは繋がっていないから前後の行を調整なんてしようとすると手間がかかって仕方がない。

何度やっても同じになってしまうので調べてみたところ、これはAcrobatの仕様だった。マジか!

どうやらAcrobatは文章エリアというような概念がなくて、各文字を位置情報と保存しているようなのだ。それで編集しようとすると「ここら辺、固まっているな」と自動判別で文字エリアを確定するようになっている。

そのため、空行があったり、先頭文字位置が違うと分割して認識してしまうのだ。もともとエリア情報を持っていないのだからバラけるのは正常な動作。つまりはAcrobatで編集作業すること自体がナンセンスなのだ。ちょっとした微調整ぐらいにしか使ってはいけない。

じゃーどうする?ということなのだが、なかなかPDFを編集できるものはない。というか、構造的に不可能だ。やるとしたらPDF化される前のファイルを手に入れることだ。それって厳しい。

しばらくあれこれトライアンドエラーを繰り返しながら方策を見つけた。

まずは英語PDFで文字を消す。文字の入力は地獄の作業だが削除はそれほどでもない。文字全部消していいのならば、「選択」の中に「すべてのテキストオブジェクトを選択」があるので、これで選択後に削除すれば一発だ。

もし小まめに削除する必要がある場合はページをバラバラにした方がいい。クソ重くて効率が悪いし、最悪動かなくなるから。これで何度泣いたか…。「PDFの整理」の中に分割機能がある。

さて、ここまでできたらあと少し。ここからはinDesignというアドビのアプリを使う。

inDesignでPDFと同じページ数を事前に作っておく。次に「ファイル」にある「配置」でPDFを読み込む。そのままでも開けないんだよね。なのでリンクは貼り付けという形で使う。配置はページごとに配置してから、中央寄せするといい。「ページを基準」にすることを忘れずに。

配置したものをロックしておくとうっかり動かしてしまったりすることがないのでオススメ。MacだとCommand+Lだよ。

で、あとはテキストエリアを指定してサクサクと作業。実に快適。あの混沌とした世界が嘘のようだ。PDFをここまでガッリ編集することはないが知れないけど、参考にしてね。