この記事は何?
機械学習の前処理として特徴量のスケーリングを行うことがありますが,スケーリング手法の1つとしてz-score変換があります.
z-scoreは平均が0,標準偏差が1となるようにスケーリングを行います,z-scoreを10倍して50を加えるとお馴染みの偏差値になります.
特徴量と
の相関係数を
とします.このとき,
をz-score化した
と
の相関係数
を考えます.
直感的にはと
は等しくなるんじゃないかなと思いますが,本当に等しくなるのか確かめてみたときのメモです
証明
結論から先に言うと,と
は等しくなります.
z-score変換は,平均を引いて標準偏差で割って求めるため,線形変換です.
そこで,とし,
となることを示します.
というわけで,となることが示されました.
これで安心して相関係数を計算できますヽ(^o^)丿
追記(2016/11/20)
上式では,の正負によっては
になることがありますね…
z-scoreではは正なので(標準偏差は正)問題は無いのですががが