このBLOGはもうあんまり更新されませんよ?
せいぜい、大きい画像掲載に使うくらいかな?
twitterに移行してますんで・・・知ってますよね?
知らない奴はモコに興味がないか、洞察力が欠如してる奴なので注意
モコ(@mokoaki)です
TwitterのBOT、「あさりよしとったー」の仕様とか。
あさりよしとったー(@asariyositotter)は、
Twitterのタイムライン内から あさりよしとお作品タイトル関係の文言を見つけてはそれをつぶやきます。
とてもニッチなBOTです。
ちなみに
Rubyのスクリプトを自鯖でcron(現状10分間隔)してます
twitterへのアクセスはこちらを利用しています
MySQL使ったりして結構がんばってます
タイムラインデータは
公式である、Twitter Search
有志のサイト、Twitter検索
こちらの2サイトの情報を拝借しております。
●Twitter Search
「あさり」の検索結果のうち、「よしとお」を含むもの
「よしとお」の検索結果のうち、「あさり」を含むもの
「まんがサイエンス」
「カールビンソン」の検索結果のうち、「空母」を含まないもの
「ワッハマン」
●Twitter検索
「浅利」の検索結果のうち、「義遠」を含むもの
「あさり」の検索結果のうち、「よしとお」を含むもの
「あさり」の検索結果のうち、「よしとを」を含むもの
「あさり」の検索結果のうち、「よしとう」を含むもの
「よしとお」の検索結果のうち、「あさり」を含むもの
「カールビンソン」の検索結果のうち、「空母」を含まないもの
「ロケット」の検索結果のうち、「なつのロケット」を含むもの
「サイエンス」の検索結果のうち、「まんがサイエンス」を含むもの
「サイエンス」の検索結果のうち、「がんまサイエンス」を含むもの
「サイエンス」の検索結果のうち、「ガンマサイエンス」を含むもの
「ラジヲマン」
「ピケットライン」の検索結果のうち、「木星ピケットライン」を含むもの
「ピケットライン」の検索結果のうち、「月面ピケットライン」を含むもの
「寄生」の検索結果のうち、「ただいま寄生中」を含むもの
「防衛」の検索結果のうち、「中空知防衛軍」を含むもの
「防衛」の検索結果のうち、「地球防衛少女」「イコちゃん」を含むもの
「細腕」の検索結果のうち、「細腕三畳紀」を含むもの
「蒸気娘」
「事件簿」の検索結果のうち、「金田はじめ」を含むもの
「迷走学園」
「世界冥作劇場」
「ヴァイス」の検索結果のうち、「ヴァイスの空」を含むもの
「アステロイド」の検索結果のうち、「マイナーズ」を含むもの
「asteroid」の検索結果のうち、「miners」を含むもの
「パトロール」の検索結果のうち、「それ行け」「宇宙パトロール」を含むもの
「パトロール」の検索結果のうち、「それいけ」「宇宙パトロール」を含むもの
「ファウスト」の検索結果のうち、「メッチェン」を含むもの
「あかでみっく」の検索結果のうち、「はいぱ」「らぼ」を含むもの
「アカデミック」の検索結果のうち、「ハイパ」「ラボ」を含むもの
「るくるく」の検索結果のうち、「るくるくる」「くるくるく」「るくるくりすか」「かすりるくるく」を含まないもの
「うなぎ」の検索結果のうち、「let」「go」「うなぎちゃん」を含むもの
「うなぎ」の検索結果のうち、「レッツ」「ゴ」「うなぎちゃん」を含むもの
「くわがた」の検索結果のうち、「くわがたツマミ」を含むもの
「魔黒州城」
「宇宙刑事」の検索結果のうち、「宇宙刑事バスター」を含むもの
「自衛官」の検索結果のうち、「たたかう自衛官」を含むもの
「ゾンビ」の検索結果のうち、「ゾンビの七人」を含むもの
「ゾンビ」の検索結果のうち、「ゾンビの用心棒」を含むもの
「恩返し」の検索結果のうち、「地上最大の恩返し」を含むもの
「巨大戦闘兵器」の検索結果のうち、「無節操超超巨大戦闘兵器」を含むもの
「新世界壮健社」
※あまりにもPOSTされなそうなマイナー作品は省いています
※「これが抜けてるよ!」とかありましたら気軽にお知らせください
何故 2サイトかと言いますと、「検索されないPOST」の問題です。
少しでも取りこぼしが少なくなるように、複数サイトを頼っています。
また、発言される頻度が少ないと思われる文言については「Twitter Search」は使用していません。
検索の回数制限があるためです。
また、漫画の発売日を告げる系のBOTは見つける度に除外リストに入れます。
それ系のBOTは一斉に発言するため、TLが埋まったり怖いからです。
●Twitter Searchでの
「あさりよしとお」の検索結果 → 検索されない
「あさり」の検索結果 → 検索されるも、検索されないPOSTがある
「よしとお」の検索結果 → 検索されるも、検索されないPOSTがある
というように、ぱっと見、バグじゃねえかと突っ込みたくなるような感じです。
twitterに「検索機能どうにかならないの?」とメールしたら、
「いやー、ごめんねー。検索機能はまだうまく動いてないんだ。がんばってるからもうちょっと待ってよ」
と帰ってきたので待つしかないかもしれません。
早くGoogleがどうにかしてくれればいいんですけどね
それで、この取りこぼしへの対策は、
「Twitter検索」という有志のサイトのデータを使用することにしました。
が、ここでも問題が発生します。
●Twitter検索での
「あさりよしとお」の検索結果 → 検索されるも、検索されないユーザがある
というように、ぱっと見、バグじゃねえかと突っ込みたくなるような感じです。
が、どうやら、このサイトは日本語のみを対象としていて、日本語のユーザなのか、それ以外なのかは機械的に判断しているそうです。
それで、その判断に漏れてしまったユーザはこの検索から外れてしまうようなのです。
管理人さんが「検索されない人はユーザ名を教えてくれー」と言っていたので、
検索されないユーザのIDを通報したところ、検索されるようになった事から、
多分この予想は合っていると思われます。
残念ながら「あさりよしとお」を含むPOSTしても検索に漏れてしまい、
「あさりよしとったー」が補足しない
そういう方は次の行動が考えられます。
1 こんな糞BOTに引っかからなくても問題ない、無視する。
2 「Twitter検索」の管理人に自分のIDを通報して対策してもらう
3 「Twitter Search」の仕様が変更されるのを待つ
この辺りだと思われます。そんな感じです。
ぶっちゃけ、公式の検索がマトモになれば問題はないんですけどねぇ。
どうぞ、この検索周りについての情報をお持ちの方は知らせて頂ければ幸いです。
では「あさりよしとったー」をよろしくお願いします。