サイト公開までの裏話・・・それはヘビーな校正との戦いだった

2015年9月27日
オープンから3日目を迎えた「インタラクティブ☆マーケティングまとめサイト」。今日は一昨日のテスト版公開に至るまでのちょっと恥ずかしい裏話を、披露しようと思います。

当サイトの企画に着手したのは、昨年の秋のこと。私の中で大枠のイメージを固めた上で、以前から弊社のWebサイト運営のサポートをしてくださっていた会社の社長にご相談し、細部を詰めた上で、実際の作業に入ったのは、今年に入ってからのことでした。しかし、そこから公開日に至るまでには、いくつもの壁を乗り越えなければなりませんでした。

中でも最大の壁は、雑誌記事のデータを、当サイトで使用しているWord Pressに移行することの難しさ。月刊『アイ・エム・プレス』自体は、創刊準備号から最終号に至るまでの計216号をすべてMacで制作していたのですが、最近のIn Designでレイアウトした号は良いものの、Page MakerやQuark Expressなど昔のレイアウトソフトについては、当時と同じ環境を確保するのが難しく、Indesignで読み込んだ結果、大量の文字化けが発生してしまいました。

雑誌に掲載されていた記事だとは信じられないような大量の文字化けが発生
雑誌に掲載されていた記事だとは信じられないような大量の文字化けが発生
さらには、20年の歳月の中でデータが失われたり、壊れたりしている号があったため、これらの号については、雑誌をスキャンしてテキスト化する方法を採ったたものの、その認識率が低く、ここでも大量の文字化けを余儀なくされました。(皆さん、PDFをテキスト化すると、見た目には問題がないように見えるのですが、Wordなどにコピペしてみると、実は多くの文字が誤認識されていることをご存じでしょうか?)

つまり、当初はサクっと確認するだけで良いかなと思っていた掲載記事のすべてを、雑誌と照らし合わせて、逐一、確認することなしには、とても公開できないという事態に陥ったのです。<汗>

今回UPした約200記事について、雑誌と見比べての校正を余儀なくされました
今回UPした約200記事について、雑誌と見比べての校正を余儀なくされました
そこで弊社では、限られた予算の中で問題を最小限にするべく、Quark Expressでレイアウトした中でも事情が複雑と見られる号については、この分野のノウハウをお持ちの企業にデータの抽出をお願いする一方、Page Makerでレイアウトした号、およびデータが壊れていたり、見当たらなくなったりしていた号については、地道な校正により文字化けを1つ1つ、つぶしていくという方針を決定。以降、数カ月に及び、私自身はもちろんですが、弊社スタッフの手を借りての文字化けとの戦いを繰り広げてきました。

深夜のシェアオフィス風景
深夜のシェアオフィス風景
レイアウトソフトが2種類、さらにそれらのバージョンも加味すると数多くのバリエーションがあるため一概には言えませんが、Page Makerで制作した号は文字化けのみならず、時には行の欠落や入れ替わりなども発生。Quark Expressで制作した号では、特定のいくつかの漢字がことごとく抜け落ちるという現象が多発していたのですが、中でも「通」の文字がそれに該当していたことは、弊社にとって不幸な出来事でした。というのは、弊誌の記事には“通信販売”や“通話料”“データ通信”など、「通」という文字が大量に含まれていたからです。<笑>

「別」「量」などの漢字が欠落した例
「別」「量」などの漢字が欠落した例
一方で、雑誌からスキャンしてテキスト化した号については、あくまでも読み違えているわけですから、形が類似した文字に置換されたり、漢字をへんとつくりに分解して認識したり、隣接する文字と組み合わせて認識したり・・・・。最初はそのミスの壮絶さに驚いてばかりいましたが、慣れてくると「ふーん、こんな風に読み取るわけね」などと、多少の余裕も生じてきました。

「社」という文字が「ネ」と「土」の2つに分解された事例
「社」という文字が「ネ」と「土」の2つに分解された事例
このようなハードな校正を強いられた原因は、とりもなおさず弊社、ならびに関係先のデータ検証の甘さにあるわけですが、もしも最初のデータ検証時にもっと広範囲で緻密な確認を行っていたならば、Word Pressによる記事公開は断念していたかもしれません。がしかし、PDFによる記事公開では、本サイトでチャレンジしたいと思っていることの一部は断念せざるを得なかったのも事実であり、そこはなんとも言えないのですが・・・。

そんなこんなで、本サイトには、まだまだつぶしきれていない文字化けが残されているであろうことをお詫びすると共に、もしも校正ミスにお気づきの際は、右上のお問い合わせフォームからご連絡いただければ幸いです。毎日、というわけにはいかないのですが、ある程度、定期的に修正を施していきたいと思っております。

本サイト立ち上げに当たっての苦労話はまだまだ尽きないのですが、今日のところはこのぐらいで。いずれにせよ、こうして苦労を積み重ねて作り上げたサイトだけに、1人でも多くの方々のお役に立てれば、本サイト運営者である私はもちろん、苦労を共にした外注先、校正手伝ってくれたスタッフたちも浮かばれるというもの。実際、すでに多くの方々にお声を頂戴していますので、次回のこのコラムでは、それらを取りまとめてご紹介したいと思っています。

校正作業に精を出すスタッフ。本当にお疲れさまでした。
校正に精を出すスタッフの後ろ姿。本当に、本当に、お疲れさまでした!
※この記事は私自身によるコラムの初投稿になります(一昨日の投稿は、制作会社の方に一部サポートしていただきました)。行替えの仕方、写真の入れ方はなんとかわかりましたが、写真のキャプションのフォントをどうやって下げたらいいのかがわからず、自ら本サイトのトーン&マナーにかかわるルールを逸脱しての投稿です。こんな感じですが、Word Pressの使い方も少しずつ学習していきますので、よろしくお付き合いください。