アクチュアリーはデータサイエンスの夢を見るか?

Rで保険数理と機械学習をやっています

【ベイズ推定入門】「二度あることは三度ある」確率はXX%

本記事はベイズ推定の入門記事です。ベイズ推定を用いて「二度あることは三度ある」確率を定量的に評価し、どんな場合に「三度目の正直」の方が信頼できるかを明らかにします。 1.ベイズ推定でできること 2.「二度あることは三度ある」確率 2.1.フラ…

アクチュアリー試験の合格率を予測してみた

今回の記事では2019年度のアクチュアリー試験の合格率や受験者を予測してみます。 受験生の間では「今年度はあの科目が難化した」「昨年度は合格率が低かったから今年は易化するだろう」といった噂を耳にすることがありますが、将来の合格率を合理的に予測す…

Twitter上のtweetデータを自動収集してみる

Twitter上でtweetデータを簡単に収集する方法をご紹介します。APIを使用せずともtweetデータを収集することができます。 This article is a tutorial for how to collect Tweet data by Google sheet application, Twitter Archiver. 1. まずグーグルスプレ…

アクチュアリー試験の合格年数シミュレーター

アクチュアリー試験合格までに何年かかるかをシミュレーションするプログラムを作成しました。※実際の合格年数を保証するものではありませんので、ご承知おきください。 計算前提 1. 毎年2科目を受験する。(残り科目数が1科目の場合は1科目) 2. それぞれ…

機械学習でサザエさんと本気でじゃんけんしてみた②

前回の記事からの続編です。機械学習の手法を用いてサザエさんのじゃんけんの手を予測します。 r-std.hatenablog.com 2017年はいくつかの機械学習の手法を適用して終了してしまいましたが、2018年は予測手法をさらに高度化してみたいと思います。 1.予測を…

機械学習と保険数理の違い(バイアス、バリアンス分解との比較)

今回は機械学習と保険数理の違いについて、数式を用いて比較してみます。 1.機械学習の汎化誤差 2.保険数理の推定二乗誤差 3.両者の数式の比較 1.機械学習の汎化誤差 まずは機械学習で扱われる汎化誤差(Test error)について数式を見てみます。汎化誤…

アクチュアリーが学ぶべき英語・英単語

今回は、アクチュアリーが英語を使うときに役立つかもしれないリンク集をまとめてみます。 Wikipediaの略語集 保険業界に限定されるものではないですが、ビジネス・金融関係の略語が充実しています。 List of business and finance abbreviations - Wikipedi…

Rで異常値検出してみた(MT法、One Class SVM)(スイス銀行紙幣③)

今回は初心に帰ってスイス銀行紙幣を取り扱います。使用するデータは以前の記事と同じものです。 r-std.hatenablog.com 真札と偽札が含まれるスイス銀行紙幣のデータについて、線形判別分析、二次判別分析を行って識別したところ、高い精度で識別を行うこと…

アクチュアリー試験の勉強法(一次試験)

本記事ではアクチュアリー試験(一次試験)の勉強法をまとめます。アクチュアリー試験を初受験の方、勉強科目を迷っている方向けに、受験科目の選び方、勉強の進め方や参考書の情報などをまとめます。個人の主観が含まれますのでお含みおきください。 1.受…

アクチュアリー試験合格には何年かかるかシミュレーションしてみた

今回はアクチュアリー試験に合格するまでには何年かかるかをシミュレーションし、最適な受験戦略を考えてみました。 1.アクチュアリー試験について 2.試算結果 (1)複数科目への分散戦略を取らない場合 ①毎年1科目を集中して勉強した場合 ②人並みの努…

機械学習でサザエさんと本気でじゃんけんしてみた①

本記事は以下のサイトに掲載されている知見およびデータを参考に執筆しています。 www.asahi-net.or.jp サザエさんじゃんけん研究所公式ウェブサイト(Sazaesan-janken laboratory official website) yaju3d.hatenablog.jp 1.はじめに 本記事では機械学習の…

Rで株価変動を分析してみた(隠れマルコフモデル, Regime-Switching Model)

今回は隠れマルコフモデルを利用して、個別銘柄の株価リターンを評価してみます。隠れマルコフモデルの概要については下記などをご参照ください。 https://www.slideshare.net/thinkn1108/150719-hmm 隠れマルコフモデルでは、実際には観測できない状態があ…

Rで葉っぱを分類してみた②(SVM, randomForest, Naive Bayesなど)

前回の記事からの続編になります。 r-std.hatenablog.com 前回は36種の葉っぱの形状データと手触り(texture)データについて、k近傍法による識別を行いました。今回はSVMやRandomForest, Naive Bayesなどの手法により、識別を行います。 今回使用する ソース…

Rで学ぶ損保数理②(パンジャーの再帰式とは?)

以前の記事(Rで学ぶ損保数理① - アクチュアリーはデータサイエンスの夢を見るか) の続編になります。第2回目はクレーム総額の確率分布の導出を扱います。 クレームモデル② from std r 損害額Xを指数分布、クレーム件数Nを負の二項分布とする複合分布につ…

Rを使って葉っぱを分類してみた①(k近傍法)

今回はk近傍法をRで動かしてみます。 使用するデータセットは以下のサイトから引用します。 https://archive.ics.uci.edu/ml/datasets/Leaf UCI Machine Learning Repository: Leaf Data Set 40種の葉っぱについて、形状データと手触り(texture)データが記録…

統計検定準1級に効率的に合格する勉強方法と参考書籍

本記事では自分が統計検定準1級を受験した際の勉強方法についてまとめます。 1.試験の特徴 2.使用した参考書 3.終わりに 1.試験の特徴 統計検定は専用の参考書などがまだ少なく、独学を中心に勉強を進める必要があります。その一方で試験範囲は非常…

Rで学ぶ損保数理①(クレームモデルとは?)

「Rで学ぶ損保数理」と称して記事を書いてみます。損保数理は一次試験の中では難易度も高く、過去問以外の勉強方法が確立されていませんが、学習中の方の理解の助けになれば幸いです。第一回目はクレームモデルの導入を扱います。 クレームモデル① from std …

ネット麻雀「天鳳」を統計的に分析してみた(後編)

前回に引き続いて、天鳳強者のデータを分析します。今回は主成分分析、因子分析を行って、プレーヤーを打ち筋の観点から分類することを試みます。 1.主成分分析、因子分析 2.結果 3.考察 4.総論 1.主成分分析、因子分析 主成分分析は多くの変数を…

ネット麻雀「天鳳」を統計的に分析してみた(前編)

本記事では、オンライン麻雀ゲーム「天鳳」の成績データを分析し、良い戦績をあげているプレーヤーの特徴を明らかにします。 1.天鳳について 2.用いたデータ 2-1.成績データ 2-2.和了データ 2-3.放銃データ 2-4.打ち回しデータ 3.重回…

統計検定準1級に合格しました

先日、統計検定準1級の合格発表がありました。大変うれしいことに評価Sをいただいて合格することができました。引き続き1級の受験も目指して勉強していきたいです。 www.toukei-kentei.jp 試験の難易度としては、アクチュアリー基礎科目の数学をやや難しくし…

アクチュアリー試験 損保数理の問題をRで解いてみる①

今回は、アクチュアリー試験の問題をRで解きます。 取り上げるのはH25年度の損保数理の第二問Ⅲ 非斉次ポアソン過程の問題です。 (1)の答えはオペレーショナルタイムの定義通りなので、上記の通りとなります。tが1/3乗されているため、時間が経過するほど…

2次判別分析をRでやってみた(スイス銀行紙幣②)

前回の記事に引き続いて機械学習のトピックを取り上げます。今回は2次判別分析を行います。 r-std.hatenablog.com 線形判別分析では、「群団間で分散が等しい」という前提を用いる弱点があることは前回お話ししました。一方で、「群団間で分散が異なる」場…

線形判別分析をRでやってみた(スイス銀行紙幣①)

はじめまして。 当ブログでは小生の独学した内容(主に機械学習)などについて備忘録をかねてまとめていきたいと考えています。多分に誤りが含まれることが予想されますので、お含みおきください。また、先人の皆様にとっては稚拙な内容にはなりますが、至ら…

お問い合わせ

読み込んでいます...

プライバシーポリシー

当サイトに掲載されている広告について 当サイトでは、第三者配信の広告サービス(Googleアドセンス、Amazonアソシエイト)を利用しています。 このような広告配信事業者は、ユーザーの興味に応じた商品やサービスの広告を表示するため、当サイトや他サイト…