クリックで懸賞やお小遣い: ノウハウ習得でインカム増やそう! ネット収入への道に踏み出しませんか?
YST対策:ページ検索の"謎" 〜YST対策についての疑問を整理してみました〜
1 YSTの基本アルゴリズムはInktomi+HITS?
2 YSTはページ内要因を重視する?
3 ページキャッシュの"謎"(1)
4 ページキャッシュの"謎"(2)
5 リンクポピュラリティは重視されない?
6 Yahoo!にリンクを張ると効果がある?
7 過剰な相対リンク/被リンクはスパム?
8 Update Tim〜インデックス変動の"謎"
9 Update Tim〜新たなアルゴリズムへの布石?
10 Update Tim〜「基本に立ち返れ!」ってこと?

YSTのキャッシュ更新速度はGoogleなどと比べて早いのか遅いのかどちらでしょう?
キャッシュ更新の日付は、サイト内の各ページがYSTにクローリングされる速度や順序を把握する目安となるので重要なのですが、ネット上には"遅い"派と"速い"派の両方の書込みがあります。

この傾向はサイトによって違うかも知れないので、自サイトの全ページに更新を掛けてアップロードし、暫く日数を置いてインデックスされているページのキャッシュ日付を調べて見てください。
ブラウザのアドレス欄に http://search.yahoo.co.jp/bin/query?p=http://www.click-de.com&n=100(※www.click-de.comの部分は自サイトのURL)を入力して検索するとすぐに解ると思います。

なお、ジュチが調べた範囲では、トップページのキャッシュの更新はGoogleよりも速いいくらいですが、それ以外のページ(特にネストの深い位置にあるページ)のキャッシュ更新はかなり遅いです。
YSTのクローリングには、デイリークロールとメインクロールの2つ("Site Match"を含めると3つ)があり、「デイリークロールでは、頻繁に更新されるURLへの訪問とリンク経由により新しく発見したWebページを追加する」だけのようですから、「デイリークロールは速く、メインクロールは非常に遅い」と云えそうです。

YSTはGoogleなどと比べてインデックスする速度が非常に遅いのですが、この"メインクロール"がクセモノですね。
キャッシュされた内容に基いてインデックス更新が行われる訳ですから、メインクロールがこれほど遅いとインデックスの更新も非常に遅くなり、検索エンジンの"性能"に大きな影響を与えてしまいます。
技術上の問題かビジネス上の思惑がない限り、メインクロールをこれほど遅くする理由が解りません。
 ※インデックスする速度が遅いのはInktomi系に共通の特徴。 有料の"Site Match"を普及させるための陰謀??

なぜこんなに遅いのかは"謎"ですが、キャッシュ更新の遅いページのページ内要因をいくら調整しても、忘れたころにしか効果が出ないのは確かです。
YSTの場合、サイト内でインデックスされたページ数が増えるとそれに伴って検索順位がアップするようなので、ページ内要因のチューニングよりもクローラー対策を考えた方が良いかも知れませんね。

ジュチが調べたとおりであるとすれば答えは簡単で、トップページからサイト内の各ページにリンクを張って、リンクのネストを出来るだけ浅くすることことと、外部ドメインからのバックリンクを増やしてデイリークロールを確実に捉えることが、YST対策上必要となってきます。
但し、どうもそんなに単純でもなく、同じネストの深さにあるページでもかなりバラツキが出ていることからみてこれ以外の要因もありそうに思えます。 (例えば更新頻度が高いページとか、リンク/被リンク数の多いページなど)
この点については、もう少し時間を掛けて"謎解き"をして見るつもりです。


ページキャッシュに関連した"謎"の続きですが、同じドメインの同じページでも、キーワードによってキャッシュ日付が異なるものが複数存在することがあります。

例えば"インカム"で検索した場合と"クリック インカム"で検索した場合とで、キャッシュの日付が違ったりすることがあるので、この辺に何か鍵があるのではと"妄想"してしまいます。
 ※妄想−1; キーワードによって、クローリングされるパスが違う??
 ※妄想−2; アルゴリズムの異なる複数のクローラーがいる???
 ※妄想−3; 検索するキーワード(または単語か複数語か)によってデータベースが違う????

同じような現象を報告したページを時々見かけるので、この現象自体は他の人も気づいておられるようですが、まだまだ断片的な情報しかないので、今のところは"バグ"と思って無視するほうが良いのかも知れませんね。
通常の検索時に表示される"キャッシュ"の内容がキャッシュ日付の時点のものではないうえ、link: の特別構文検索でリンク元のキャッシュ日付を何日間か続けてみていると、昨日調べた時より今日の方が旧いキャッシュ日付になっているページもあるので、何となく怪しげです。

ただ、ちょっと気になるのは、以下のように見られる現象が観察されることです。("妄想"の続きかも)
1.新しい方の日付=デイリークロール、旧い方の日付=メインクロール
2.単一ワードで検索した場合;旧い方の日付、複数ワードで検索した場合;新しい方の日付
3.単一ワードで検索した場合;ページ内要因から見て検索順位が低い(何らかのフイルターが掛っている)
  複数ワードで検索した場合ページ内要因から見て妥当な検索順位

まだ充分なデータが無いので確証は持てませんが、これが正しいとすれば、「ページ内要因を、複数キーワードでチューニングすれば効果がある」ことになります。
Yahoo!の場合、単一ワードの検索では、"スポンサーサイト"や"Yahoo!ディレクトリ登録サイト"が前の方に表示される可能性が高いですから、始めから複数キーワードに絞った対策をすべきなのかも知れません。