Closed2022/07/02にクローズ4住宅価格予測の問題を解くKaggleyuki2021/03/31これを見ながら分析の手順を覚えていく。 https://www.kaggle.com/walzer55/house-prices yuki2021/03/31「外れ値の除去」の節で、いきなり「宅地面積の割に住宅価格が異常に安い」データを弾いているけど、この組み合わせをそもそも見つけるのが難しそうw 常識的にはこの2つは相関があるはずというのはなんとなくわかるけど、パッと発見するのは難しそう。分析対象のドメイン知識がいりそう。 yuki2021/03/31Probability Plot データセットが指定した分布に従っているかどうかを視覚的に表現したもの。 https://www.itl.nist.gov/div898/handbook/eda/section3/probplot.htm yuki2021/03/31今回使用している例だと、右側が大幅に高くなっている。正規表現として扱いたいので、データを log transformation する。 返信を追加このスクラップは2022/07/02にクローズされました
yuki2021/03/31「外れ値の除去」の節で、いきなり「宅地面積の割に住宅価格が異常に安い」データを弾いているけど、この組み合わせをそもそも見つけるのが難しそうw 常識的にはこの2つは相関があるはずというのはなんとなくわかるけど、パッと発見するのは難しそう。分析対象のドメイン知識がいりそう。
yuki2021/03/31Probability Plot データセットが指定した分布に従っているかどうかを視覚的に表現したもの。 https://www.itl.nist.gov/div898/handbook/eda/section3/probplot.htm yuki2021/03/31今回使用している例だと、右側が大幅に高くなっている。正規表現として扱いたいので、データを log transformation する。 返信を追加