レポート 公共サイト運営の最前線
第6回「10万を超える”浮遊ファイル”の洗い出し・削除を実現した仙台市」
[ 2013年6月5日 ]
ゲスト
仙台市総務企画局広報課 主事
武内愛美さん
10万を超える浮遊ファイルの存在が明らかに
アライド:浮遊ファイル特定の手順をお聞かせください。

浮遊ファイルイメージ
武内:まず、仙台市の公開ウェブサーバーに存在する全ファイルのリストを作成しました。先ほどHTMLページが約5万と申しあげましたが、画像やPDFなどを含む全ファイルとなると、23万以上の膨大なファイル数です。
アライド・ブレインズにお願いして、それら23万強のファイルリストと全ファイル解析システム「CRONOS2」による解析結果約13万ファイルのリストを突き合わせ、「仙台市の公開ウェブサーバーに存在する」かつ「CRONOS2でトップページからリンクをたどっていった際には到達できない」ファイル注3をリスト化していただきました。
アライド:浮遊ファイルリストをご覧になっていかがでしたか?
武内:A.A.O.セミナーの資料でHTML約2万ページのギャップを知ったときも驚きましたが、さらに驚愕させられたのは、PDFや画像を含めたら何と10万ものファイルが浮遊しているという現実でした。解析前の段階ではまさかそんな数だとは想像していなかったので、浮遊ファイルリストを配布し各課で修正してもらうつもりでしたが、ひと目で無理だと思いましたね。
アライド:各課ではどのような作業を実施されたのですか。
武内:各課ではそれぞれ担当するページのリンク切れの状況を確認してもらいました。各課のリンク切れの修正によってリンクがつながったファイルを浮遊ファイルのリストから外し、最終的にリストに残ったファイルをすべて浮遊ファイルと判断することにしました。
注3 「CRONOS2」は、対象サイトのトップページからリンクが有効なファイルを巡回し解析する。
各課への説明にひと工夫
アライド:ご苦労はありましたか?
武内:CMSのユーザーアカウントとしては約200ですが、実際にはその2~3倍の職員がホームページ更新に携わっていますので、その各課担当者に「浮遊ファイルとは何か」を説明し理解してもらうのはとても大変でしたね。「公開していると思っていないファイルが沢山ありますよ、古い情報や誤った情報が利用者の目に触れる可能性があるので危険ですよ!」、といってもピンと来ないらしく、問い合わせの電話が沢山かかってきました。浮遊ファイルはなぜ生まれるのか、どうして浮遊ファイルが危険なのか、丁寧な説明が必要でした。
実際に確認を始めてもらってわかりましたが、組織変更や人事異動もあるため、浮遊ファイルや「リンク切れ」の存在を担当課はほとんど把握していませんでした。多くは忘れ去れられたページだったのです。だからこそ整理すべきコンテンツなのだということを説明して、理解を求めました。
アライド:工夫された点を教えてください。
武内:浮遊ファイル確認作業を依頼した際、ウェブサイトの問題としてより理解してもらいやすい「リンク切れ」と併せて案内を行ったことでしょうか。
CRONOS2の解析結果から「リンク切れ」の発生状況が明らかになっていたので、リンク切れの修正だけは各課で作業してもらうことにしました。リンク切れは2,300ページ以上見つかりましたが、具体的なページが示されていることですし、1ヶ月間で修正できる範囲だと判断しました。
アライド:浮遊ファイルの整理はどうなさったのでしょう?
武内:浮遊ファイルの内訳は、HTMLが約2万ページ、PDFが約10万ファイルありました。約12万にもおよぶ浮遊ファイルは一つ一つ確認して要不要を判断できる数ではありません。各課から申請のなかった浮遊ファイルは全て不要と判断して広報課で削除することにしました。