livedoor labs EDGE

Livin' on the Edge

livedoorから研究用データを提供します

こんにちは、EDGE担当の櫛井です。

研究データの公開場所として「EDGE Datasets(データセット)」を開始
いたしましたのでお知らせいたします。

今回は、DLsiteなどでもご活躍中のrefeia氏にキャラクタを書き下ろして
いただきました。ありがとうございます。
■左(緑の髪):ディタ
■右(赤い髪):セト
という名前です。夏コミに期待ですね。


以下、プレスリリースより抜粋
ソーシャルブックマークサービス「livedoor クリップ」のサイト上で公開されているURL等のデータを、学術目的として研究機関や法人機関の研究者や個人などにCSV形式で無料提供するサービス「EDGE Datasets(エッジ データセット)」を1月15日(木)から開始します。尚、本サービスは事業者による初めてのオープン公開となります。

現在、国立の研究機関や大学、大手通信企業などでもソーシャルブックマークの研究が進み、携わる研究者も増加傾向にあります。しかしながら、今までソーシャルブックマークに関する研究は、事業者のサイトを巡回してクロールしなければならず、非常に手間隙がかかる作業でした。このため研究手段や範囲が大きく制限されていました。そこで、「EDGE Datasets」では、研究機関・研究者を対象に「livedoor クリップ」で培ってきたソーシャルブックマークの生データを提供します。これにより、研究者はURL、タグ、作成時刻をCSVで取得でき、簡単に研究用の集計や加工ができ、レコメンデーションやデータマイニングの研究に活かすことができます。今回のデータセット公開により、同一時刻のブックマーク数のデータ比較が可能になるなど、初めて全ての研究者が同じ条件で実験や追試を行うことが可能となります。これは、研究者から要望が高かった、データの汎用性・再現性・更新性・ID秘匿性などの条件をクリアすることとなり、ソーシャルブックマーク研究の方法論と実績の確立に大きく貢献できるといえます。ライブドアでは、研究結果の正確性、作業効率の向上を支援し、本分野の研究が進むことで、将来的に一般ユーザーに向けた質の高いソーシャルブックマークサービスの提供とサービス活性化につなげていきたいと考えています。

尚、データの利用は学術研究目的を前提とし、指定の問い合わせフォームからリクエストを行った個人に対してダウンロード用のURLとパスワードを返信する形で提供されます。2008年12月版のデータセットには約157万行のクリップのデータが入っています




EDGE Datasetsはこちらです。

べっ、別にあんたのために公開するんじゃないんだからねっ・・・!

CSSをオフにしたりとかしないでくださいね。


EDGEのTOPにあるDatasetsへのリンクはスパ○ボとかの超必殺技っぽい雰囲気で
やってみましたのでこちらも是非ご覧下さい。
livedoor labs EDGE

コメントする

名前
 
  絵文字
 
 
Archives