【SEO】「検索エンジン」への「インデックス登録」を「拒否」する方法
【SEO】
「検索エンジン」への「インデックス登録」を「拒否」する方法
はじめに
「Google」への「インデックス登録」を「拒否」する方法には、
・「robots.txt」ファイルで拒否する方法
・「METAタグ」で「インデックス登録」を拒否する方法
などがある。
「robots.txt」ファイルで指定すると、
「サイト全体」「ディレクトリ」「ファイル」を指定して、
「インデックス登録」を「拒否」する指定ができる。
「METAタグ」を使用する場合は、
記述した「ファイル」のみ、「インデックス登録」を「拒否」することができる。
詳しくは、下記をご覧ください。
Back
「検索エンジン」への「インデックス登録」を「拒否」する方法
「Google」への「インデックス登録」を「拒否」する方法は、
・「robots.txt」ファイルで拒否する方法
・「METAタグ」で「インデックス登録」を拒否する方法
などの方法を使用する。
「インデックス登録」を「拒否」する方法の特徴
| |
| |
| |
| |
「robots.txt」ファイル |
「サイト全体」「ディレクトリ」「ファイル」を指定して、
「インデックス登録」を「拒否」する指定ができる。
|
「META」タグ |
記述した「ファイル」のみ、「インデックス登録」を「拒否」することができる。
|
Back
「robots.txt」ファイルで「検索エンジン」への「インデックス登録」を拒否する
「検索エンジン」への「インデックス登録」を「拒否」することもできる。
「検索エンジン」への「インデックス登録」を「拒否」するには、
「robots.txt」ファイルを使用して、
「拒否」する「内容」「ページ」などを記述する。
Back
「robots.txt」ファイルとは
robots.txtは、自動にWebを検索して検索エンジンに登録してくれる検索ロボットに残している手紙です。
どの検索エンジンロボットに、自分のWebを検索して欲しいか、どのページを検索して欲しいか、逆に検索して欲しくないページを指定するなど、
色々なことを検索エンジンロボットへ伝えることができます。
記述方法は、下記を参照ください。
Back
「robots.txt」ファイルの「配置場所」
robots.txt ファイルは、必ずサイトのトップに置く。
サイトのトップとは、ドメインだけでURLをしていたときに開くindex.htmlファイルがあるディレクトリです。
Back
「robots.txt」ファイルの「インデックス登録」を「拒否」する「書式」
「robots.txt」ファイルには、
「インデックス登録」を「拒否」する「書式」がある。
その書式通りに記述することで、
「Google」への「インデックス登録」が拒否することが可能。
記述内容は、
比較的簡単。
ロボット検索、検索データベースへの登録を拒否
User-agent・・・登録を拒否したい検索エンジンの User-Agent 名を記述。
Disallow・・・ 登録拒否したいディレクトリやファイル名を記述。
すべて(*)のロボットに対して、/ ではじまるファイル(つまりはすべてのファイル)を拒否。
User-agent:*
Disallow:/
ロボットを指定しての拒否。
User-agent:検索エンジン名
Disallow:/ディレクトリ名/ディレクトリ名/
検索エンジン User-agentの一覧
Ah-ha = ah-ha.com
Alexa = ia_archiver
Altavista = Scooter
Ask Jeeves = Jeeves askjeeves
Inktomi = slurp
infoseek = Sidewinder
Naver.com = NaverRobot, dloader, dumrobo
Google = googlebot
おまけ:米Microsoft開発中の新検索エンジンは「MSNBOT」
Back
「<meta>」タグによる指定を行えば、
各ページに対する設定を行うことができます。
「meta」タグで、
「name="robots"」を指定し、
「Content属性」に値を指定する。
<meta name="robots" content="noindex,nofollow">
「Content属性」の「値」の意味
値 | 意味 |
index | 検索データベースへの登録を許可する。 |
noindex | 検索データベースへの登録を禁止する。 |
follow | このページに含まれるリンクをたぐることを許可する。 |
nofollow | このページに含まれるリンクをたぐることを禁止する。 |
Back