ポイント2. URLから記号を排除
P_BLOGは動的にページを生成しているため、URLに”?”や”=”といった記号が入っています。これらの記号が入らないように、シンプルなURLでアクセスできるように修正してみます。
具体的には、 http://www.naotaka.com/macosx/article.php?id=1 を、 http://www.naotaka.com/macosx/article-1 に。
http://www.naotaka.com/macosx/category.php?k=P_BLOG を、 http://www.naotaka.com/macosx/category-P_BLOG に変更します。
この機能はApacheのmod_rewriteモジュールで提供されているので、まず自分の利用しているサーバーでこの機能が提供されているかをチェックします。さくらのレンタルサーバは対応していました。
.htaccess
RwriteEngine on
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^article-([0-9]+)$ article.php?id=$1 [PT,L]
RewriteRule ^category-([^/]+)$ category.php?k=$1 [PT,L]
mod_rewriteはMac OS X 10.4で標準で使用できるので、あらかじめローカル環境でテストしておきます。
これで短くなったURLでもアクセスできるようになりましたが、P_BLOG内のリンクが記号を使った形式のままなので、そちらも修正しておきます。
インストールしたp_blogのディレクトリに移動し、 grep -nR ‘article.php?id=’ * と grep -nR ‘category.php?k=’ * で、修正が必要なファイルを見つけます。include以下にある複数のファイルを修正する必要があるので、処理はRubyのスクリプトで’article.php?id=’を’article-’に、’category.php?k=’を’category-’に一括置換しました。この辺はもうちょっときちんと確認した方が良かったかもしれません。作業前のバックアップは必須ですね。
P_BLOGのフォーラムにも書かれていますが、Google Botなどは動的なページに負荷をかけすぎないようにアクセスを遠慮してしまうようなので、検索されやすくするためには不利だといわれています。
Google のインデックスには動的なページも登録されますが、動的なページは Google インデックスのほんの一部です。 URL に疑問符を含むページなど、動的に生成されるページによってクローラの問題が発生していると考えられる場合は、これらのページの静的なバージョンも作成することをお勧めします。
また、P_BLOGで使われている”?id=”とは違いますが、
URL で “&id=” パラメータを使用しない。このパラメータを含むページは Google のインデックスに登録されません。
- ウェブマスター向けヘルプ センター – Google のウェブマスター向けのガイドラインはどのようなものですか。
- ウェブマスター向けヘルプ センター – クロールが完了できなかった URL エラーとは何ですか。
という記述もあるため、一応URLに”id”は含まないようにしておきました。
単語の区切り文字は”-”を使用します。Google Guyによれば、Googleは”_”だと区切り文字とは見なされないそうです。”mac-os-x”なら三語ですが、”mac_os_x”だと”macosx”と認識するとか。ただ、効果のほどは不明です。
こちらも参考までに


Recent Comments