この記事は何?
機械学習の前処理として特徴量のスケーリングを行うことがありますが,スケーリング手法の1つとしてz-score変換があります.
z-scoreは平均が0,標準偏差が1となるようにスケーリングを行います,z-scoreを10倍して50を加えるとお馴染みの偏差値になります.
特徴量との相関係数をとします.このとき,をz-score化したとの相関係数を考えます.
直感的にはとは等しくなるんじゃないかなと思いますが,本当に等しくなるのか確かめてみたときのメモです
証明
結論から先に言うと,とは等しくなります.
z-score変換は,平均を引いて標準偏差で割って求めるため,線形変換です.
そこで,とし,となることを示します.
というわけで,となることが示されました.
これで安心して相関係数を計算できますヽ(^o^)丿
追記(2016/11/20)
上式では,の正負によってはになることがありますね…
z-scoreではは正なので(標準偏差は正)問題は無いのですががが