いきなりですが、みなさんは知りたい情報があった時、どのようにしてウェブサイトにアクセスするでしょうか?
頻繁に見るサイトであれば、お気に入りに登録してダイレクトにアクセスしたり…。
あるいはSNSを通じてウェブサイトにアクセスしたり…。
でも一番多いのは、やはりGoogleやYahoo!などの検索エンジンで見たいウェブサイトを探すケースが圧倒的に多いのではないでしょうか。
ウェブサイト制作者だって、いかにして検索エンジンを通じてアクセス数を稼げるかを念頭に置いて設計、制作していくことは今や基本中の基本ですよね。
いわゆる「SEO(Search Engine Optimization/検索エンジン最適化)」ってやつです。
ウェブサイトを制作する上でSEOは非常に重要な役割を担っています。
ウェブサイトは、どんなにデザイン性に優れていて見映えがよくても、見てもらわなければ存在する意味がないのですから。
「今回はSEOの話題?」と思いきや、その逆のお話しです。
ウェブサイトを意図的に検索されないようにするにはどうすればよいのでしょうか?
「そんなことやる必要ってあるの?」って思われるかもしれません。
プロトタイプのようなテスト用ページ、あるいは編集中のページ、またはページが存在しない時などに表示するエラーページなどをイメージしてみてください。
こういったウェブページは検索エンジンで検索されると都合が悪くありませんか?
ウェブサイトを制作していると、不特定多数の人に見られると都合が悪いウェブページ、人目にさらされたくないウェブページってあるんですよね。
今回はウェブページが検索エンジンで検索されないようにする方法について、少し掘り下げて解説していきます。
どうぞ最後までお付き合いください。
インデックスとクロールとは?
ウェブページが検索エンジンで検索されないようにする具体的な方法を解説する前に、ちょっと専門用語を整理しておきましょう。
「インデックス」と「クロール」って聞いたことありませんか?
ウェブサイトを作ったことがあって、SEOの基礎くらいわかっている方であれば、聞いたことがあるかもしれません。
今回の記事を理解する上で、切っても切り離せない「インデックス」と「クロール」。
本題に入る前にこれら「インデックス」と「クロール」について、まず解説しておきます。
ウェブサイトが検索エンジンの検索結果に表示されるようにするためには、そのウェブサイトの情報を検索エンジンに登録しなければなりません。
検索エンジンは世界中のウェブサイトをデータベース化してるんですね。
だからGoogleやYahoo!で検索キーワードを入力すると該当するウェブサイトの一覧が出てくるのです。
データベース化するばかりでなく、検索結果の表示順位も付けています。
検索結果を上位に表示させるための施策のことを「SEO」といいます。
また、このデータベースにウェブサイトの情報が登録されることを「インデックス」といいます。
では、どのようにしてウェブサイトはインデックスされるのでしょうか?
世界中のウェブサイトをデータベースに登録するわけですから、到底、マンパワーでできるだけの作業量でないことは容易に想像できます。
ここで「ロボット(クローラーとも呼ばれます)」というプログラムの出番です。
インターネットの世界は「ワールドワイドウェブ(world wide web/略して「www」)」と呼ばれるように、蜘蛛の巣のようにお互いがつながっているため、ネットワーク網をたどっていけば世界中どのウェブサイトでもアクセスすることができます。
そして、このネットワーク網をたどって、世界中のウェブサイトと通信するのが「ロボット(クローラー)」の役割です。
通信すると同時にウェブサイトの情報を取得(収集)し、それを自動的に検索エンジンのデータベースに登録しています。
この「ネットワーク網をたどってウェブサイトの情報を取得(収集)」することを「クロール」と呼びます。
これらの用語を使ってまとめると…
このようにして、検索エンジンが成り立っているのです。
検索されないようにするために
では、本題に入ります。
検索エンジンでウェブページが検索されないようにするためにはどうすればいいのでしょうか?
答えは簡単!
そのウェブページがインデックスされなければいいのです。
noindexタグを使います。
使い方はとても簡単です。
headタグ内に以下のように書きます。
<meta name="robots" content="noindex">
このnoindexタグを書いたウェブページはインデックスされなくなります。
noindexタグを書いておくと、クロールしてきたロボットに、インデックスする意思がないことを伝えることができるのです。
評価を落とさないために
ウェブページのどこかにリンクが貼ってあった場合、ロボットはリンク先のウェブページもついでにクロールします。
「リンクを貼るくらいなんだから、良質なウェブページだろう」とロボットはリンク先のウェブページを評価します。
リンクを貼られていることって、検索エンジンがウェブページを評価する上でとても大事な評価基準なわけです。
しかし、逆にリンク先のウェブページが悪質なページだったらどうなるでしょうか?
リンク先のウェブページが評価を落とすのと同時に、リンクを貼った自分のウェブページの評価も落とされてしまうんです。
実際、リンク先のウェブページがロボットにどんな評価を受けているかなんて、わかりませんよね。
ですから、リンクを貼ることってリスクがあるんです。
とは言ってもウェブサイトで有益な情報を提供するために、リンクを貼ることって必要不可欠なはずです。
そこで、リンクを貼ったとしても、リンク先をロボットがクロールしないようにしてあげることがセオリー。
思い切って、リンク先のサイトとの関連性を断ち切ってしまうことが重要なんです。
そこで、nofollowタグを使います。
headタグ内に書くと、ページ全体のリンクに対し、リンク先をクロールしないようロボットに伝えることができます。
書き方はこんな感じです。
<meta name="robots" content="nofollow">
一方、リンクを貼る時に使うアンカータグ(aタグ)内で書くと、個別にリンク先をクロールしないようロボットに伝えることができます。
書き方はこんな感じ。
<a href="リンク先URL" rel="nofollow">
ただし、自分のウェブサイト内の相互リンクにわざわざnofollowタグを書く必要はないと思います。
主に、外部サイトへリンクする場合にだけ、nofollowタグを書いてあげましょう。
自分のウェブサイトの評価に関わることですので、面倒くさがらずに、積極的にnofollowタグを使うことをおすすめします。
まとめ
今回は、noindexタグとnofollowタグについて解説しました。
最後に一つだけ。
headタグ内に書く場合、noindexタグとnofollowタグを一緒に書くことができます。
<meta name="robots" content="noindex,nofollow">
このようにnoindexとnofollowをカンマで区切ることで、インデックスさせないのと同時に、リンク先との関係性を断ち切り、評価を落とすリスクを減らすことができます。
ウェブサイトを制作する上での基本となりますので、意味を理解した上で使い分けることができるようにしておきましょう。
最後までお付き合いいただき、ありがとうございました。