Analyze Twitter Trends
新年あけまして………おめでとうございます!
明けた感じがしませんね、いやそもそも明けた感じとは?
さて、本題に入ります。
12/31の夜。
Twitterをやっているとα改(@alpha_kai_NET)さんが、Twitterのstatuses/filterを使って遊んでいるのを検知しました。
そこで、私も何か遊ぼうと思ってTweetDeckを眺めていると、トレンドが紅白とガキ使関係ばかりになっていることに気が付きました。
ん。
これだ!
ひらめきました。
トレンドを解析して何に関係してるか判別するプログラムを書こう。
今回は紅白かガキ使か、どちらに関係してるか解析してみよう。
ということで書きました。
Yuiki/AnalyzeTwitterTrends Github
Javaです。
Twitter4J使いました。
コードの説明は後でにして、
まず、結果と、その評価実験をしてみようと思います。
※評価実験とは
https://twitter.com/yuikibis/status/682571206034198528
https://twitter.com/tomox_mc/status/682571403963445248
結果と評価実験
1位~4位
https://twitter.com/yuikibis/status/682568829642223617
1位は当たり前。
2位のPerfumeは紅白出場
3位、ラスボスはあの人
4位も出た。
ここまでは紅白しか出てないですね。
一応全問正解。
5位~8位
https://twitter.com/yuikibis/status/682568916271411201
5位、6位、出場しました。
7位はもちろん、8位ももちろん
ここまで正解しています。
9位~12位
https://twitter.com/yuikibis/status/682568972949037057
ここで失敗に気が付きます。
そう、今日は格闘技もやっていたということ。
9位は格闘技ですね。
1ミス
10位、11位12位は紅白出場
ここらへんで気が付きます。
ガキ使この時間全然トレンドに上がってないやん!
考察
とても失敗しました。
作っている途中にテストしている頃はもっといい結果出てたのに…。
まあしょうがないですね。
でも結構制度は良いように感じました。
何故か。
それはTwitterちゃんに頑張ってもらってるからです。
仕組み
コードを読んでね♡
簡単なので読めばわかります。
因みに、どうやって判別しているかというと、カテゴリーの文字とトレンドの文字列を、それぞれAnd検索して、どっちのほうのツイートの流れが速いかを出して、そのスコアを評価しているだけです。
後、今回Enumが如何に最高か、再度気が付きました。