ざっくばらんメモ_7：kaggle、ベンフォードの法則、他者の学習規則の学習

kaggle zillow challenge

前回出したresnetの結果をアンサンブル予測のなかに組み込んで予測を行ってみる．

ー結果，0.0657365で改善ならず．

　resnetはアンサンブルしない方が良い事になってしまった．

　もう少しresnetの学習を続けてみて，再トライする．結果0.0657484でほぼ変わらず

Let’s See Your Digits: Anomalous-State Detection using Benford’s Law, kdd2017

ベンフォードの法則は自然に生てくる数字の発生頻度がある決まった法則に従う事を示す理論である。

本論では、その事実を最近のWebサービスであるWikipediaやTwitter、GitHubなどに対して成り立つ事をまず示す。

そしてこの事を利用して、ベンフォードの法則から外れた事象を異常として検知するシステムを提案している。

ベンフォードの法則自体は昔からある法則で、これから外れた事象を異常として検知する考え方も昔から存在したが、それをWebサービス（ビックデータ？）へ適用可能な形に構築し、かつそれがしっかりと働く事を示したという点で新規性があるのかもしれない。

Learning to Model Other Minds

マルチエージェントシステム的な設定を考えた時に，他者の存在を考慮に入れて学習を行うようにする手法はすでに提案されてきているが，本論では特に，他者もまた学習している事までを考慮に入れて，効率よく自分の目的を最大限達成しつつ他者との協調を行えるようにしている．

この事が重要な理由は，この設定は最近注目されている分野である Multi agent reinforcement learning, hierarchical reinforcement learning (learning to learnも含まれる？), adversarial net等，複数ある目的関数を同時に最適化するタスク全てに適用可能だからである．

ここで提案されているエージェントは他者がどのようなpolicyを持ちパラメータ更新を行うかをモデル化し，他者のpolicy及びlearning stepへどのように影響を及ぼしていけば，最終的に自己のrewardを最大化できるかを考慮に入れる事が可能になる．

これにより，従来の他者を考慮に入れない同時最適化では到達出来ないナッシュ均衡を実現していく事が可能になる．