The First Cry of Atom Today is the first day of the rest of my life.

マイノリティ・リポート

この夏にあったことだ。 一般的に社会人が半ズボンを履いて会社へ行くことは「正しくない」ことだと考えられている。 でもこの夏はとっても暑かったので、半ズボンがどれだけ許されるのか知りたいということもありいろいろなズボンで会社に行ってみた。 長ズボン、七分丈、膝の見える短パン。長さや柄を混ぜこぜにして出勤してみた。 そうしたところ、柄やメーカーにかかわらず膝が見えると「それ、(会社に履いてくるの)大丈夫?」と聞いてくる人がいることがわかった。 なるほど、膝が見えるとダメらしい。というわけでいちいちめんどくさいので夏の後半はどんなに暑くても七分丈にすることにした。 「正しい」と「正しくない」 ところでどうして、短パンは「正しくない」と判断されて、長ズボンは「正しい」と判断されるん... Read more

Developing Jenkins plugin on Vagrant

Recently I investigate the scalability of Jenkins. In my idea, I want to make hot standby Jenkins server with NFS. So the plugins which enable us to do that are required. And for my study, I decided to develop on Vagrant and VirtualBox. It costs me very little because there is no need to get real server. So in this post, I will describe how to ... Read more

頑張る理由

読んだ。 http://karigari.hatenablog.com/entry/2013/11/06/000000 全く自分にとって新しいことでなくても、文字に起こされると驚くことがある。概念は知っていても言葉は知らない、そんな感じだ。自分が何か努力したり頑張ったり、そういったことを何のためにしているか。 答えは「自分のため」いつもそう答えていた。その答えは今でも変わらないけれど、その概念のエイリアスがあるとしたら、「やった事実はなくならないから」じゃないだろうか。 僕自身は今まで努力してきたことが報われることもあったし、報われないこともあった。努力でなんでも叶えられるとも思わないけれど、努力してやってやれないこともないんじゃないかと漠然と感じている。 だから僕はやりたいこ... Read more

scikit-learnでCross Validation

だんだんとscikit-learnとMachine Learningに慣れてきた。 今回はCross ValidationとGrid Searchをやってみた。 Cross Validation 詳しいことはWikipediaに書いてある。 Cross Validationはモデルの妥当性を検証する方法のひとつ。一般的に開発用のデータは訓練データと検証データに分かれる。 しかし、このまま行ってしまうと折角の訓練データが減ってしまうことになる上に、訓練データの選び方によって汎化性能が下がってしまう可能性がある。 Wikipediaに書いてあるもののホールド・アウト検定がこれに当たる。一般にはこれはCross Validationにはあたらない。 ここに書いてあるK-分割交差検定がこ... Read more

TF-IDFでタグ付け

Kaggleで挑戦できそうな問題があったのでチャレンジしてみた。 http://www.kaggle.com/c/facebook-recruiting-iii-keyword-extraction Stack Exchange(Stack Overflowみたいなもの)にあるテキストとそのタグデータを訓練データとして 同様にStack Exchangeにあるページからタグを類推せよという問題。 多分キーワード抽出を行う方法がうまく行くんじゃないかと思いやってみた。 TF-IDFアルゴリズム 基本的にはTF-IDFを使ってみる。これは文書中のtokenの重要度をその頻度と、他の文書にどれくらいないかの指標 の積として表すアルゴリズム。コードで書くと下のような感じ。 imp... Read more