[注意]9/6現在、ここから下記に言及されたことの多くはすでに解決済みです。(詳しくは■追記4をご覧ください)

mixiページにおける問題の記録の推移と、かつてどういうことがあったか、ということを確認できるよう、本記事を残しておきます。

---

8月31日、mixiよりmixiページが発表されました。

mixiページnavi

僕もmixiページを作ってみました!

[mixi] 赤沼俊幸の最新情報
(URLのmodule_id=373351というのは必要なのでしょうか…? なくてもアクセスできます)
そもそもmixiにはmixiコミュニティがあります。

mixiはSNSということで"人"が単位になっているのですが、mixiコミュニティは人以外が単位となり、それぞれの興味関心が単位となったコミュニティがあり、それこそ企業や商品単位のコミュニティといったものもあります。

ただ、企業自身が公式にmixiコミュニティを作るとなると、mixiの許可とmixiにお金を払わなければいけないのです(50万〜)。(※この点については僕の情報が古いかもしれないです。もし変わっていれば、教えてください)

では今回発表されたmixiページは今までのmixiコミュニティと何が違うのでしょうか。

公式ページによると、、、
・検索にヒットする
・人から人へ"うわさ"広がる
・機能を追加できる
・好きなデザインがつくれる
・アクセス分析ができる
・工夫次第で"話題のページ"に

(引用)mixiページnavi

これはみなさんご存知だと思いますが、「Facebookページ」を意識した機能群です。企業がユーザーとのコミュニケーションを取る場所がオフィシャルサイトから、Facebookページへ移行している世界が少しずつ進んでおり、mixiページはその流れに参入するべく、今回のmixiページがリリースとなったと思います。

Facebookの各ユーザーのプロフィールページが検索にヒットするかどうかは設定で変えることができるのですが、Facebookページは基本的には検索にヒットします。検索にヒットするということはFacebookユーザーではなくても、見ることができるということです。一方、mixiコミュニティは検索にヒットしません。mixi会員にしか見れないサービスです。

ですので、mixiページnaviで真っ先に書いてある通り、[検索にヒットする]というのはmixi非会員にも見ることができる大事な点なのです。

932ff8a846d9443870ab9f1948e1e024

(引用)mixiページnavi

しかし、実際、mixiページを作ってみて、不思議なことに気づいてしまいました。

「mixiページは検索にヒットしない」

どうしてか。mixiページのhtmlソースを見ていただきたいのですが、

(7行目のrobotsタグです)
e0176c13dbb06b4b8267b0350583eabd


このmeta robotsタグを何を表しているか。

これは検索エンジンに対して、「このページをインデックスすることはやめてください。この先のコンテンツもクロールすることはやめてください」ということを示しています。

(※インデックスするとは、検索エンジンのデータベースに登録することをいいます)

※参考 Meta robots noindex/nofollow/noarchiveタグの使い方 | 海外SEO情報ブログ

mixiページ自体で、検索エンジンにインデックスさせることを拒否しているのです。

つまり、mixiページは検索エンジンには引っかからないように、mixiが設定しているのです。

証拠としては、「site:」という特定のドメインやディレクトリ以降のインデックスを一覧を見ることができる検索コマンドがあります。mixiページのあるディレクトリを検索してみましょう。

(下記を検索コマンドを検索してみましょう)
site:http://page.mixi.jp/

58869fa2ab1f1fdf223ec96ca44245ac


シーン、、、という感じですね。

検索というのは、mixi内だけの検索なのでしょうか?
下記の図をご覧ください。

001_001

(引用)mixiページとは | mixiページnavi

はっきりと右下に「mixi以外のインターネットユーザー」というように書いており、検索/情報取得という線が書いています。

mixi以外のインターネットユーザーはmixiの会員ではありませんから、mixiにログインすることができません。そうなると、mixiページはmixiにログインせずに見ることができる仕様ではないといけませんが、mixiページはログインも必要です。なおかつ、通常の検索エンジンに引っかかってきません。

説明する図が間違っているのでしょうか? robotsタグの仕様を開発者が理解せずに使っているのでしょうか。

なぜ、こうなっているのでしょうか。mixi得意のベータ版なのでしょうか。

僕はまったく不明で理解に苦しみます。今後、仕様変更があるかもしれませんが、ここを見ている方はお客様に説明したり、上司に説明したりすることあると思いますので、(9/1時点では)mixiページは通常の検索エンジンに引っかからない、ということを認識したほうがいいと思います。

まとめます。
・mixiページはFacebookページを意識し、mixiなりのアレンジでmixiページを作った。
・Facebookページは検索エンジンに引っかかることがうりであり、なおかつログインしなくも見ることができる。
・しかし、mixiページは検索エンジンに引っかからず、なおかつログインしないと見れない。
・しかし、mixiページnaviを見ると、非mixi会員でもmixiページが見れるような説明が書いている。
・mixiページが検索エンジンに引っかからないようになっているのはmixi自身のmeta robotsタグの設定によるもの。


■追記1 (9/1 15:30)
「mixiページ」ついにリリース。現時点の情報まとめ | 一騎当千×仕事術を見て気づいたのですが、mixi、ログインしなくても(mixi会員ではなくても)、見ることができるページがありました。
下記のように/public/recent_page_feed.pl形式にURLをすれば、非mixiユーザーでも見ることができるようです。

ログインユーザ(mixiユーザー)向けのURL
http://page.mixi.jp/recent_page_feed.pl?page_id=70996

非ログインユーザ(非mixiユーザー)向けのURL
http://page.mixi.jp/public/recent_page_feed.pl?page_id=70996

mixiさん、それ、どこに書いてますか・・・?

非mixiユーザーにもアクセスできるURL存在しますが、そのURLでアクセスできるページも俄然、robotsタグでインデックスを拒否しているため、検索エンジンで検索されることはありません。

■追記2 (9/2 13:00)
@hoshinotsuyoshさんから情報をいただいたのですが、9/1 20時の時点では、http://page.mixi.jp/以下のサイト全体をコントロールさせるrobots.txtは以下のようになっていたようです。
0022391fd3bbcdea84dd5e121727e636

引用 http://gyazo.com/0022391fd3bbcdea84dd5e121727e636

解説しますと、
User-Agent: * Googleのクローラーを含む全てのユーザーエージェントに、
Disallow: /   全ての階層のクロールを拒否する。(つまりインデックスされない)

というように前述させていただいたmeta robots以前に、robots.txtでインデックスさせることを拒否していたわけです。(Googleは個別ページのmetaよりもrobots.txtを優先させているはずです)

つまり、検索エンジンからの検索されることをサイト全体で拒否しつつ、ページでも拒否していたわけです。

ただ、9/2時点では下記のようにrobots.txtが直っています。まずいと思って修正したのでしょうね。

User-Agent: *
Disallow: /
Allow: /public/

http://page.mixi.jp/robots.txt

しかし、個別ページのmetaタグは変わらずなので、以前、検索エンジンに表示されません。

■追記3 (9/3 6:00)

本エントリ指摘のmeta robotsタグにつきまして、mixi側から公式の発表と謝罪がありました。

『「インターネット上で検索にヒットすること」をご紹介させていただいておりますが、現段階ではサービス開始直後のサーバーへの負荷を考慮し、mixiページへの流入量をコントロールさせていただいておりました。その結果、検索にヒットしない仕様となっております。』
mixiページのインターネット公開について | THINK SOCIAL

この説明を信じるか信じないかは読者の方々の判断にお任せしますが、ただ、この仕様は改善されるようです。9/3 6時、時点ではまだ修正はされていません。

IT Mediaにも取り上げられていました。

■追記4 (9/6 13:00)

meta robotsにおけるインデックス拒否については修正が行われたようです。
※参考 ミクシィ、mixiページをウェブ検索がクローリングできるよう修正 ::SEM R

記事にありましたように「site:http://page.mixi.jp/public/」でインデックスされているので、検索エンジンに引っかかる仕様には修正されたようです。

[注意]
公開用の下記のURLから見られるところに関しましては、robotsタグの修正はありましたが、
http://page.mixi.jp/public/recent_page_feed.pl?page_id=70996
mixiユーザー用の下記のURLはmetaはそのままです。これは修正がされていない、というわけではなく、こういう仕様なのでしょうか。
http://page.mixi.jp/recent_page_feed.pl?module_id=373351&page_id=70996

しかし、SEMリサーチに言及されているようなリダイレクトの仕様は、筋が悪いとも思います。

ぜひ@toshiyuki83のフォローを!

  • 「mixiページの問題点・検索にヒットしないmixiページ」を読んで興味を持った方はTwitterアカウントの@toshiyuki83をぜひフォローしてください。

  • Facebookユーザーの方はakanuman.comへの「いいね!」をお願いします。