School/데이터사이언스개론
Scatter Plot
응엉잉
2022. 4. 14. 22:46
Scatter Plot
두 변수의 상관관계 또는 연관성을 보여줌
code ex)
# 데이터: 1,599 samples from Wine Quality Dataset (winequality-red.csv)
● Code Snippet:
sns.scatterplot(data=df_red, x="fixed acidity", y="density")
sns.regplot(data=df_red, x="fixed acidity", y="density")
Q : 변수간 상관관계, (비)선형관계, y의 변동이 x에 종속적인지, 이상치가 존재하는지
산점도의 여러 패턴
* 이분산성 문제의 처리
노이즈가 많은 데이터에 대한 가중치를 낮게 처리하거나
등분산성을 갖도록 y변수 변환
** 이분산성을 무시할 경우
이분산성을 무시하고 비가중 회귀분석을 하더라도 불편추정치를 얻을 수 있지만, 적절한 가중치를 사용한 경우보다는 정확성이 떨어짐