検索エンジンがWebを見る方法:
検索エンジンは、Web上のページに重み付けや評価を行うための高度な手法を数多く開発してきました。しかし、それらはすべて基本的に2つのカテゴリに分類されます。
- Webページには何と書いてありますか?
WebページとHTMLコードの実際のテキストコンテンツ。サイトはユーザーにどのようなコンテンツを伝えますか? - 誰があなたにリンクしていますか?
他のどのWebページがあなたのページにリンクしていますか?同じトピックまたは関連トピックがありますか?
内容
Webページを見ると、コンピュータの画面にそのページが表示されています。テキストを読んだり、画像を見て、そのページの内容を理解したりできます。
検索エンジンはWebページを人と同じようには見ません。実際、検索エンジンは実際には、少なくとも視覚的にはまったく見えません。代わりに、WebページのHTMLコードと、そこに含まれる実際のテキストを読み取ります。
検索エンジンが読み取ることができるのはテキストだけです。また、サイトのHTMLコード(これもテキストです)を調べて、そのテキストの意味や最も重要なテキストについての手掛かりを得ることができます。
検索エンジンは、HTMLコードを使用して、画像やアニメーションなど、ページ上の他の要素についての手掛かりを得ることができます。たとえば、ページ作成者が画像タグを確認して、代替テキスト
属性を読み取ると、画像の内容を把握できます。
img src = "cowpicture.jpg" alt = "牛の画像"
ただし、これは実際のテキストコンテンツの代わりにはなりません。
リンク集
他のサイトからのWebリンクも、検索エンジンがページの内容を把握したり、特定の検索クエリに対してページがどのくらい重要であるかを把握したりするための重要な手がかりとなります。検索エンジンから見た場合、あるページから別のページへのリンクは、基本的にそのページの「投票」です。
牛についてのページがあり、地元の農家のWebページが牛のトピックに関する詳細情報を提供するWebサイトから自分のページにリンクしている場合は、そのページへの追加投票となります。
より多くのリンク=より多くの票。
ただし、すべての票が同数であるとは限りません。最も重要なのは、リンクの関連性です。たとえば、ビデオポーカーソフトウェアについてのページからのリンクは、乳製品や牛とはほとんど関係がないので、そのページからWebサイトへの牛についてのリンクは、たとえあったとしても、あまりカウントされません。
一部のWebページの所有者は、他のWebページの作成者からのリンクを追跡したり、リンクを入れ替えたり、ディレクトリに登録したり、DiggやRedditなどのサイトに記事を投稿したりすることに多くの時間と労力を費やしています。これはサイトにとっては役立ちますが、最初に自分のページのコンテンツに注目することを忘れないでください。 Webページが他のサイト作成者にとってあまり価値がない場合、リンクを張る可能性は低いです。