どうも、しょみです。
今日はインデックスとキャッシュについて説明していきます。
ちょっと専門用語の匂いがして身構えてしまうかもしれませんが、最初はなんとなくの意味を理解すればOKなので一読しておいてください。
インデックスとは
インデックスを一言でいうと、「グーグルやヤフーといった検索エンジンに、自分のサイトを認識してもらうこと」になります。
ヤフー・グーグルなどの検索エンジンは、利用者が何かを検索すると、自分たちの持っている情報(サイト)を検索結果に表示させています。
例えば、「キジムナー」と検索すると、こうやって検索結果にずらっとサイトが表示されますよね。
(ちなみに、キジムナーとは沖縄の妖怪みたいなものですw)
この検索結果には「インデックスされているサイト」を表示させています。
という事は…
いくら綺麗で凝ったデザインのサイトを作成しても、グーグルにインデックスされていなかったら、検索結果にはいつまでたっても表示されないんです。
サイトがインデックスされるのは重要という事ですね。
では、サイトをインデックスさせるにはどうすればよいのでしょう?
インデックスされるまでの仕組み
毎日何万ものサイトがインターネット上には作成されていますので、それをいちいち人がチェックして「あっ、新しいサイトを作ったんだね。新規サイトとしてインデックスしてあげよう」と確認することは不可能です。
なので、インターネット上に人の代わりに「クローラー」と呼ばれる自動巡回ロボットを走らせています。
このクローラーは、サイトや記事内容、画像などの情報を収集して検索エンジンのデータベースに登録しているんですね。
が、新規にドメインを取得して作成したばかりの新しいサイトには回ってきません。なぜなら、クローラーは既にインデックスされているサイトしか回らないからです。
では、どうすればクローラーに自分のサイトを見つけてもらえるのか?
いくつか方法がありまして、グーグルに「自分は新しいサイトを作成しましたよ」とお知らせする方法があります。
グーグルサーチコンソールで、自分のサイトのURLを登録すれば、あなたのサイトの存在を認識してもらえます。
他にも、既にインデックスされているサイトから新規サイトへリンクを送る事で、クローラーがそのリンクを辿って「新しいサイト発見!」と、情報を持ち帰って検索エンジンのデータベースに登録(インデックス)してくれます。
ひとまずインデックスの仕組みはこんな感じです。また追記か別記事にて書いていきますね。
インデックスとキャッシュの違い
個人的には、インデックスもキャッシュも同じ意味合いのもので、言い方に違いがあるぐらいの認識でしたが、厳密には違うようです。
検索エンジンに認識されれば、インデックスされた(キャッシュされた)という感じで言ってたんですよね。
ですが、実際には、
・インデックスされる=グーグル検索で表示されるようになる。
・キャッシュ=グーグルに自分のサイトのデータを取得してもらう
ことのようです。
データが収集されたとしても検索結果に表示はされていない状態が「キャッシュ」ですね。
なんだかややこしいですが、同じ意味の言葉として使っても、稼ぐ上では大きな問題ではないので気にしないでくださいw