アクチュアリーはデータサイエンスの夢を見るか?

Rで保険数理と機械学習をやっています

Twitter上のtweetデータを自動収集してみる

Twitter上でtweetデータを簡単に収集する方法をご紹介します。APIを使用せずともtweetデータを収集することができます。
This article is a tutorial for how to collect Tweet data by Google sheet application, Twitter Archiver.


1. まずグーグルスプレッドシートで空のシートを開きます。

f:id:r_std:20190318032350p:plain
空のグーグルスプレッドシート

2. Ad-onsを開きます

f:id:r_std:20190318032439p:plain
Ad-onsを開きます

3. "Twitter Archiver"で検索をかけます。

f:id:r_std:20190318032532p:plain
検索結果

4. ダウンロードして、twitterアカウントと連携させます。

f:id:r_std:20190318032609p:plain
twitterアカウントとの連携

5. 検索条件を設定します。

f:id:r_std:20190318032706p:plain
検索条件の設定

1時間おきに100件のツイートを収集することができます。
例えば、「アクチュアリー」で検索すると、次のようなデータを得ることができます。

f:id:r_std:20190318033650p:plain
データ取得結果

直近のツイート数を集計してみると、次の通りになります。

f:id:r_std:20190318033003p:plain
アクチュアリー」を含むツイート数
合格発表時(2019/02/14)のツイート量が多いことが確認できます。