School/데이터사이언스개론

Scatter Plot

응엉잉 2022. 4. 14. 22:46

Scatter Plot

두 변수의 상관관계 또는 연관성을 보여줌

 

code ex)

 # 데이터: 1,599 samples from Wine Quality Dataset (winequality-red.csv)
● Code Snippet:
sns.scatterplot(data=df_red, x="fixed acidity", y="density")
sns.regplot(data=df_red, x="fixed acidity", y="density")

Q : 변수간 상관관계, (비)선형관계, y의 변동이 x에 종속적인지, 이상치가 존재하는지

 

산점도의 여러 패턴

 

* 이분산성 문제의 처리

노이즈가 많은 데이터에 대한 가중치를 낮게 처리하거나

등분산성을 갖도록 y변수 변환

 

** 이분산성을 무시할 경우

이분산성을 무시하고 비가중 회귀분석을 하더라도 불편추정치를 얻을 수 있지만, 적절한 가중치를 사용한 경우보다는 정확성이 떨어짐

 

 

 

 

'School > 데이터사이언스개론' 카테고리의 다른 글

Bihistogram  (0) 2022.04.16
Box Plot  (0) 2022.04.16
Histogram  (0) 2022.04.14
Run Sequence Plot / Lag Plot  (0) 2022.04.14
Probability Plot / Normal Probability Plot  (0) 2022.04.14