novelty日記

データサイエンスやプログラムなど

ざっくばらんメモ_10:kaggle, 創造性について

kaggle zillow

code

zillowは今週末で提出期限.

Kernelに公開されている手法で二種類のxgboostとlightgbmを組み合わせる事 で好成績を叩き出している手法が存在しているので, これらを取り入れる事にする.

kernelで公開されている手法とパラメータをそのまま使ってみる。

結果0.0655292 -> 0.0649626で結構改善.

しかしkernelで公開されている手法より性能は低いままであった.

結局は,学習そのものよりも前処理やアンサンブルなどに問題があると思われる.

他の公開手法を見てみても普通にxgboostやlightgbm等を使っているだけで 0.064台を達成出来ているので,もう少し前処理やモデルの組み合わせ方の部分に気を配るべきであった.

またモデルの学習などにおいて,適切のハイパーパラメータが選ばられているとは言えず, 次以後は簡単で良いのでちゃんとパラメータ選択を行う事にする.

kaggle Porto Seguro

新たなkaggle challengeとしてPorto Seguro’s Safe Driver Prediction Challengeへ取り込む事とする.

今回は保険会社からのお題で,ドライバが次年に保険適用申請するか どうかを予測するというもの.

問題自体はシンプルだが,今回扱うデータは2値出力のラベルがかなり偏っている のどそれを念頭に入れる必要がある.

こうしたimbalanceデータに対しては例えばwieghted lossの適用や, Subsampling+boosting,exemplar learning的の手法などがある.

消費と創造の関係

何かを消費するたびに何かを知る事が出来る.

その知る事に付随した驚きや感動を覚える事で,それをまた期待 しさらなる消費によって,さらに知ろうとする.

しかし消費を続ける内に新たに知る事の絶対量は減っていき, 最終的に物足りなさを感じるようになる.

あるいは今まで知った事に基いて,これから知りたい事に対する興味の 方向性が決まってくると,消費される物がその方向性に対して 正確に最適化されていない事に気づき,ストレスを感じるようになる.

こうした状態に至ると初めて消費から創造へのシフトが起きる.

この時,創造の動機は自己の内へ向いている.

自分が本当に知りたい(消費したい)事は何かを探求し,それを創造する 過程で知る(消費する)事を達成する.

ここで創造されたものは,自己の興味に最適化しており,創造されたもの(消費されるもの) と自己の興味が接近し,理想的には一体化する.

これはまさに自己表現の形であると考えられる.

ただ上記した創造の動機は自己の内だけでなく外にも向いている場合が多く, その場合,社会的な承認欲求(あるいは自己超越?)などと組み合わさっている と思われる.