ポアソン 回帰。 (D)ポアソン分布・ポアソン回帰・ポアソン過程(平成27年度)

今さら人に聞けない「重回帰分析の各手法の使い分け」

ポアソン 回帰

Contents• ポアソン回帰とは ポアソン回帰とは、カウントデータを予想するために影響しそうな変数との関係を分析する手法の一つです。 カウントデータというのは、 ある現象が一定時間内に起こった回数を数えたデータのことで、具体例では事故の件数や一日に受け取るメールの数やらいろいろあるらしいです。 一般的な回帰分析は目的変数 つまり残差 が正規分布に従っていると仮定しているに対して、ポアソン回帰はポアソン分布を仮定していると言えます。 ポアソン分布に従っている変数に対して正規分布を仮定してしまうとまずそうですね。 どうやって予測するのか 回帰分析は以下のように係数を用意して予想していましたね。 さらにポアソン分布の平均は非負なので、それを考慮した関数にすると以下のようなものが考えられます。 このとき以下のように変換できます。 そして右辺のことを 線形予測子といいます。 じつは 1-1 も、なにも変換していないんですがこれらの関係が成り立っていて、なにも変換していないリンク関数のことを 恒等リンク関数と言います。 具体的に以下の数式を最大にすればよさそうです。 このままでは計算しづらいので、 2-1 の式に対数変換をすると簡単になります。 これは最大化するときは省いてよいです。 Pythonで実装 数式 2-2 を最大化するようにpythonで実装してみます。 まず初めにデータのダウンロードからです。 今回はこちらからデータを拝借しました。 data3a. csv 「データ解析のための統計モデリング入門」で使用されているデータセットです。 ダウンロードが終了したらさっそくデータを読み込んでみます。 csv' そして今回最大化したい対数尤度関数を定義します。 さらに添え字で一つ一つアクセスして合計し、最後にマイナスします。 このマイナスですが、scipyの最適化関数が最小化する関数しか見当たらなかったのでマイナスにして、最小化するようにしました。 最適化する前に、係数が必要ですね。 ひとまずランダムで定義しておきます。 random. rand , np. random. そして以下のように最適化します。 optimize. import matplotlib. x プロットを表示 plt. plot data['x'], data['y'], 'o' plt. plot data['x'], np. format a, b plt. show そうするとこんな感じのグラフが表示されると思います。

次の

(D)ポアソン分布・ポアソン回帰・ポアソン過程(平成27年度)

ポアソン 回帰

R ネタです。 一般化線形モデル(Generalized linear mixed model : GLMM)をベイズ推定する MCMCglmm というパッケージを使ってポアソン回帰をするためのメモです。 もしかすると MCMCglmm の入門的、あるいはチュートリアル的なものになっている、かもしれません。 MCMCglmm について• 基本的にギブスサンプラー。 一部(狭い意味の)メトロポリス・ヘイスティング、スライスサンプラー。 パラメータの事前分布はデフォルトで平均ゼロ、分散 10 8 の正規分布。 分散は逆ウィッシャート。 001 でゼロの周りでピーキーな分布)。 lmer とかと大体同じ使い方だけど、random effect の設定はかなりちがう。 指定の仕方は豊富だけども、そのぶん理解するのが大変。 使える family がかなり豊富。 罰則スプライン回帰(additive model)もできるっぽい• rcov をきちんと書けばマルチレスポンスな回帰もできるみたい。 空間統計もできるかな?• イテレーション回数は nitt、バーンインは burnin、サンプリング間隔は thin で指定します。 ということで、使いこなせればいろいろできそうなのだけれども、やってみると結構つまずいたりする。 それが MCMCglmm。 一番簡単と思われるポアソン回帰でもかなりハマりました(4時間!!)。 この記事はその点について書いてみます。 ポアソン回帰 ポアソン回帰はこんな感じのモデル式です。 random effect はとりあえず考えません。 library MASS x z Intercept 1. 09239 0. 04224 25. 86 OK! posterior. 000000000 -0. 38218637 Lag 10 0. 174746578 -0. 23397818 Lag 50 0. 030926348 -0. 01045872 Lag 100 0. 008258976 -0. 03562686 Lag 500 -0. 034086677 0. 04925067 , , x Intercept x Lag 0 -0. 382186365 1. 000000000 Lag 10 -0. 216486193 0. 252820118 Lag 50 -0. 056063463 -0. 039203250 Lag 100 -0. 000795888 -0. 005915734 Lag 500 0. 011238684 -0. 000000000 Lag 10 0. 225311785 Lag 50 -0. 039435254 Lag 100 -0. 008188887 Lag 500 0. 048201071 これでも自己相関が高すぎる!と思う場合は thin 引数を大きな値に変更しましょう。 まとめ というわけで本質的な解決はしていないような気がしますが、一応、個人的には納得したのでこのあたりで終わりにします。 MCMCglmm を使ってポアソン回帰をしてみた• MCMCglmm はポアソン分布などでも線形予測子の後に正規誤差を仮定する。 これは現実的なデータに対して over dispersion を回避するという意味では有用かもしれないが、テスト問題や一部の non-over dispersion なデータでは収束性が悪くなるかもしれない(もしかすると収束性を改善するワザがあるかもしれない)。 すこし書き方が冗長だったかもしれない。 最後まで読んでくださった方、ありがとうござます。 実は MCMCglmm で罰則付きスプライン回帰なども簡単に実装できるので、そのあたりのこともいつか書いてみたいとおもいます。 Categories• 1 Popular Posts All time• Archives•

次の

ポアソン回帰

ポアソン 回帰

この章ではポアソン回帰分析の原理と結果の解釈方法、ロジスティック回帰分析との比較と使い分けについて解説します。 1 ポアソン回帰分析の原理 1 カウントデータとポアソン分布 一般に、ある現象が一定時間内に起こった回数を数え上げたデータのことを カウントデータ count data といいます。 そしてカウントデータの発生頻度と、それに影響する要因との関係を分析する手法のことを カウントデータ分析 analysis of count data といいます。 その代表的なものが ポアソン回帰分析 Poisson regression analysis です。 ポアソン回帰分析は稀にしか起こらない現象に関するカウントデータを分析するための手法であり、その時のカウントデータが近似的に ポアソン分布 Poisson distribution する性質を利用しています。 例えば図15. 例えば近似的にポアソン分布する現象として交通事故の発生件数、地震の発生件数、サッカーの得点数、馬に蹴られて死亡した兵士数などが有名です。 これらは発生率を求める時の分母が不特定多数または非常に膨大で、事実上無限大に近い現象です。 医学分野におけるカウントデータの例として、一定時間内に疾患を発症した例数や疾患による死亡例数があります。 そのため疫学分野では、これらのカウントデータを分析する時にポアソン回帰分析を適用することがよくあります。 しかしこれらのカウントデータは疾患を発症しない例数や疾患によって死亡しない例数を特定することができるので、全体の例数nを特定することが可能です。 特に臨床試験や臨床研究では、全体の例数nを指定して疾患の発症例数や死亡例数を観測するのが普通です。 そのためこのような場合は個々の症例について疾患発症の有無や生死を観測し、カウントデータではなく出現率または死亡率のデータとして扱い、ロジスティック回帰分析や生存時間解析を適用する方が理にかなっています。 で詳しく説明しますが、ポアソン回帰分析は発生件数を指数関数で近似して分析します。 そのため疾患の発症率や死亡率のデータにポアソン回帰分析を適用すると発症率や死亡率が高い時は指数関数と実際のデータとのズレが大きくなり、 発症率や死亡率が100%を超えてしまうという非合理な結果になってしまうのです。 2 ポアソン回帰モデル 交通事故の発生件数と同様に、医療機関で発生する医療事故の発生件数も近似的にポアソン分析します。 例えば、ある地方で1ヶ月間に医療機関から報告された医療事故の発生件数と、それに関連した情報が表15. 1のようになったとします。 このデータにポアソン回帰分析を適用してみましょう。 表15. 1 医療事故の発生件数 医療機関ID 発生件数 診療科 0:内科系 1:外科系 処方薬剤数 診療科職員数 1 1 0 1 21 2 1 0 1 30 3 1 0 1 37 4 1 0 2 46 5 1 1 1 24 6 1 1 1 56 7 1 1 1 58 8 1 1 2 24 9 1 1 2 38 10 1 1 2 58 11 1 1 3 26 12 1 1 3 41 13 2 0 1 23 14 2 0 1 43 15 2 0 1 47 16 2 0 2 35 17 2 0 2 41 18 2 0 2 45 19 2 0 2 53 20 2 0 3 40 21 2 1 1 22 22 2 1 1 39 23 2 1 1 52 24 2 1 2 23 25 2 1 2 28 26 2 1 2 32 27 2 1 2 43 28 2 1 3 24 29 2 1 3 27 30 2 1 3 42 31 3 0 1 20 32 3 0 1 44 33 3 0 2 35 34 3 0 2 37 35 3 0 3 41 36 3 0 3 55 37 3 0 3 51 38 3 0 3 36 39 3 1 1 34 40 3 1 2 42 41 3 1 2 51 42 3 1 3 21 43 3 1 3 35 44 3 1 3 36.

次の