novelty日記

データサイエンスやプログラムなど

異常検知のアンサンブル

異常検知、特に教師なし設定における異常検知問題において、アンサンブル手法というものはあまりない。 この論文曰く、教師なしの場合、各検知手法の精度評価や各手法毎の多様性についての評価が難しい事が大きな原因らしい。

しかし興味深かったのが、この論文では、大量のラベルなしデータに対し教師なし異常検知モデルを複数学習させて、その出力をデータの特徴量に加えた少量のラベルありデータを用いた教師あり異常検知モデルを学習すると性能が良いとの事であった。

どちらかというとkaggleとかで良くやられているstackingだがblendingだかと似ている。