novelty日記

データサイエンスやプログラムなど

意味のある外れ値を見つける

Conditional Anomaly Detectionという論文を読んだ。

異常が検出された時にそれが意味のないものである事は多い。

そのためある異常検知がそうした意味のない異常ばかり検出してしまう場合、使い物にならない。

本論では事前知識に頼る事になるが、それを利用して「意味のある」異常のみを効率よく抽出する手法について説明している。

従来の異常検知は異常を一様分布として考えた時の、正常分布に対する判別問題のように扱う。

しかしそれでは限界があるという事で、最近は様々な論文にて異常の分布構造に対しても足を踏み入れる方法を模索している印象がある。