Home> SEM > | SEO > 重複コンテンツ&複数サイトの問題 / SES サンフランシスコ
重複コンテンツ&複数サイトの問題 / SES サンフランシスコ
免責事項:この記事はSESのセッション内容の正確性・完全性に関していかなる保証も行いません。著者及び現時点での信頼できる情報源からの意見・考えなどが反映された内容となっています。
Duplicate Content & Multiple Site Issues
重複コンテンツとは
同じドメイン内、複数のドメインに存在し、他のコンテンツと完全に同じもしくは、非常によく似たコンテンツのまとまりです。
※http://www.google.com/support/webmasters/bin/answer.py?hl=ja&answer=66359
なぜ重複コンテンツが問題なのか?
検索エンジンは検索ユーザの利便性を考え、検索結果に同じようなページが多数出てこないよう、非常に似たコンテンツを持つページをフィルタリングして検索結果をなるべく、ユニークなページの一覧を返すように努めています。
その結果、重複コンテンツを持つページは、検索結果に表示されなくなります。
※これは検索エンジンからペナルティを受けてページが削除される訳ではありません。
例えば、自サイトのコンテンツを他のサイトへ提供している場合、他のサイトと自サイトのコンテンツが重複し、自サイトが検索結果に表示されなくなり、検索エンジンからのトラフィックを失うことになります。また、自サイト内でも重複コンテンツがあることで、想定しているページへターゲット・ユーザのトラフィックを誘導できず、折角の見込み客を囲い込み機会を逸してしまう可能性もあります。これらは検索エンジンからのトラフィックをほとんど適切に誘導できていないことを意味しています。
コンテンツはとは
検索エンジンが見ているWEBページのコンテンツとは次の部分のみです。
他のページで共通に利用されているヘッダーやフッター、ナビゲーション、広告などのテキスト部分などを除いたブロック部分のテキスト情報を抽出して検索エンジンは比較しています。
どんなコンテンツが重複コンテンツと判定されるのか?
- 全く同じテキスト
東京は今日も雨でした。Vs. 東京は今日も雨でした。
- 並び替えたテキスト
東京 大阪
大阪 Vs. 京都
京都 東京 - 置換されたテキスト
東京は今日も雨でした。 Vs. 大阪は今日も雨でした。
こんなサイトは要注意!
- プレス・リリースなど複数のサイトへコンテンツを提供
- コンテンツ配信など複数のサイトへコンテンツを提供
- 製品の一覧ページ(ソート別に複数のURL)などを提供
- メーカの製品情報などをそのまま引用して製品説明を提供
どんな基準で選ぶのか?
検索エンジンは重複コンテンツが見つかった場合、以下の要因などを用いて検索結果に表示するページを選んでいるようです。
- PageRank
- Trust authority
- Recency
- Original author
これらの事が配慮されるため、オリジナルのコンテンツであれば必ず検索結果に表示されるのではなく、トータルとして最も検索エンジンに権威があると判定されたページが検索結果に表示されることになります。
対処方法など
では、重複コンテンツに対して、サイト運用者が出来ることは何でしょう?- 重複ページを削除して、トラフィックを誘導すべきページへ301リダイレクトを設定
- rel=canonicalタグを利用
- Googleのウェブマスター・ツールの利用
- meta タグのnoindexの利用
- robots.txtの利用
以上、重複したコンテンツは、複雑な問題です。重複コンテンツと判定されることでSEOの努力が損なわれる危険性が常にあります。検索結果に意図してページが表示されるようにまずは、重複コンテンツの場所を特定することが重要です、サイト内部に重複コンテンツが疑われる場合は、それらを取り除くこと、サイトのコンテンツ管理を怠わらないでください。
より正確なセミナーの内容は以下のLiveブログを参照されることをおすすめします。
SES Live: Duplicate Content & Multiple Site Issues
BruceClay - Duplicate Content & Multiple Site Issues