SATwi:察威 の使い方を模索する
(ここに要約コメントを入力)
課題
- いまのところ証拠保全にしか使えない
- → 活用できる人材が限られる
- まだこれでも一般人には扱いづらい?
- → 解説動画とか必要なんだろうか……
- 結果的に何が得られるのか想像できない
- が、それを見せると規約違反になってしまいダメ
- 何がどうなると嬉しいのか(というビジョンに乏しい)
- 一定水準の見識がある人にしか価値を認められない
↑パンピーをクソバカにしとるんか?(していません)
用途が限られている ← 証拠保全にしか使えない問題
ツイート、メンション、いいねという三種類すべてをガバッと集められる上に定期的に自動収集もできちゃうのだから、それだけでなんとなく嬉しい気がしてしまうのだけれど、それは私がそのデータから導かれる可能性について想像することが出来るから?
キーワードは「想像」だったりするのかしら?
さらに詳細な解説が必要 ← まだ一般人には扱いづらい?
たしかに note にかいた記事では2つ合わせて一万文字を超える文章を読ませることになるし、独特のクセというか、""強めの思想"" が端々に感じられてお腹いっぱいになりやすい可能性はあるのかも…
かといって、これ以上どうすればいいんや……という諦観もある
基本的にテキストでしか伝達をやってこなかったが、重い腰を上げて動画を作る必要が出てくるのかなぁなどと……(まぁ最終手段として後回しにしたい気持ち OR 誰か強力な Follower がやってくれるやろの気持ち)
で?どんなものが得られるの ← 提示できないジレンマ
データを得るために Twitter API v2 を利用しているが、そのために開発者利用規約を遵守せねばならない
得たデータは公開範囲においてはならないとされているため、例え自分自身のツイートデータであっても、それを例示として公開しておくことはできないはずだ(こんくらい許してほしいが)
そういう理由もあり、生データの例示ができるのは Twitter 公式のサイトだけなのだが、そちらの方をわざわざ見に行く人は少ないし、そもそも充実もしていない
で、ぶっちゃけた話、一般の方々が生データを見たところで得られる感動は少なく、理解するのも少々難しい可能性も残されている
結局のところ、生データそのものを見せるのはどうでも良くて、それを加工してどのように分析できたのか?みたいなデータビジュアライゼーションやらインフォグラフィックスみたいな話に落ち着くのだと思う
ビジョンに乏しい ← 何がどうなると嬉しいのか
きちんとした静的なデータとしてツイート履歴が残るということは、もしいざ訴訟するとなったときの強力な証拠として作用すると考えられるが、フツーの人々はいちいち裁判リスクなんて考えて生活していない
こういうのに興味がある一定のクラスタであれば、RT でさえも個々人の ID が振られておりスクショよりも再現性(蓋然性?)に勝る客観証拠となりうるってハナシなのだが、それで喜ぶ人々は全体から見るとごくごくマイノリティなのである…
だから、もっと一般的にウケる需要を考えて掘り起こす必要がありそうだ
……というかもっと志向を尖らせれば一定の層にぶっ刺さることは請け合いなのだが、初めからそういうイロを出して進めていくと確実によろしくないという直感がある
ので、少しずつ着実に正道に歩を進めて、時折「陰の者たちが裏で悪用してしまうことがあるよね~(黙殺)」ぐらいのスタンスでいきたい
目指すべき姿
例えば、whotwi: グラフィカル ツイッター分析なんかはいい先行事例だとおもう
- FF 分析(仲良しグループを可視化)
- ワードクラウド(頻出単語を可視化)
- 統計分析
- ツイート傾向の推定
- ハッシュタグ分析
等々、考えうることはだいたい実現している
ただし、気になったのはその分析ソースだ
直近の600ツイートおよびFFを10万人分までしか取得していない
whotwi はおそらく Twitter Enterprize API を利用しているが、それでもこの程度の制限はあるということだろう
SATwi であればこの制限は回避できるはずだ
最低 3200 ツイートは確保できるし、FF分析については(時間をかければ)10万以上もたやすく目指せる(未実装)
企業APIの限界と勝負できるというのは、かなり魅力的なのだが…
みんなでつくる、というゴール
もしたくさんの人々がこの SATwi を利用し、各々のリポジトリを作成してデータを集めてくれれば、それを個々人で分析して公開することが出来るはず(生データは公開NGだけど、きちんと二次加工されていれば問題はない……はず?)
で、現状その「個々人での分析」と「外部公開」は、GitHub Actions + GitHub Pages で実現できるはず
その公開ページに RSS 機能とか、結果をまとめた JSON とかが置いてあれば、そのリンクを集積するだけでいい感じのサイトが作れてしまうのでは………?(もちろん誰も何も規約に違反していないし法に触れてもいない)
- 個人のページで得られたデータを分析し外部公開する
- 中央サーバは分析結果を取りに行く+検索しやすいようにする
これで「みんなでつくる」が実現できそうじゃない?
まぁこれは理想論に過ぎず、実際には「仕様どうするの」とか「分析結果の整合性は?」とかいろいろ問題はありそう
でもなんか解決に近づきそうだぁ……(恍惚)
悪意に対抗する方法
中央サーバにデータを集めるのはいいとして、その結果に悪意を含ませることは容易い気がする
- 複数の結果があれば比較する(外れ値を検出できる?)
- 結果データの出所はきちんと紐づける
あくまでデータの出所は「個人」側にあり、中央サーバに責任はないという仕組みを確保する必要がありそうだ