アクチュアリーはデータサイエンスの夢を見るか?

Rで保険数理と機械学習をやっています

【API不要】Twitter上のtweetデータを自動収集する方法

本記事ではTwitter上のtweetデータを自動収集する方法をご紹介します。APIを使用しなくても、tweetデータを簡単に自動収集することができます。今回はグーグルスプレッドシート上のTwitter Archiverというアプリを利用します。

Twitter Archiverの使い方

使い方の手順は次のとおりです。

1. まずグーグルスプレッドシートで空のシートを開きます。

f:id:r_std:20200510034835p:plain
空のグーグルスプレッドシート

2. Ad-onsを開きます

f:id:r_std:20200510034932p:plain
Ad-onsを開きます

3. "Twitter Archiver"で検索をかけます。

f:id:r_std:20200510035044p:plain
検索結果

4. ダウンロードして、twitterアカウントと連携させます。

f:id:r_std:20200510035150p:plain
twitterアカウントとの連携

5. 検索条件を設定します。

f:id:r_std:20200510035334p:plain
検索条件の設定

6. 設定した検索条件に従って、1時間おきに100件のツイートを自動収集することができます。

例えば、「アクチュアリー」で検索すると、次のようなデータを自動取得することができます。

f:id:r_std:20200510035414p:plain
データ取得結果

直近のツイート数を集計してみると、次の通りになりました。

f:id:r_std:20190318033003p:plain
アクチュアリー」を含むツイート数
合格発表時(2019/02/14)のツイート量が多いことが確認できます。

自動取得できるデータ

APIを利用する場合に比べ自由度は落ちますが、既存のアプリケーションを使用すれば、面倒な設定なしでツイートデータを自動取得することができます。

使い方も直感的で難しいところはありません。添付メディアやリツイート数、ファボ数、フォロー/フォロワー数の情報等も取得出来るので、一通りの用途は満たせそうです。

ツイートデータをお手軽に分析してみたい方は是非利用してみてはいかがでしょうか?