Scatter Plot
두 변수의 상관관계 또는 연관성을 보여줌
code ex)
# 데이터: 1,599 samples from Wine Quality Dataset (winequality-red.csv)
● Code Snippet:
sns.scatterplot(data=df_red, x="fixed acidity", y="density")
sns.regplot(data=df_red, x="fixed acidity", y="density")
Q : 변수간 상관관계, (비)선형관계, y의 변동이 x에 종속적인지, 이상치가 존재하는지
산점도의 여러 패턴
* 이분산성 문제의 처리
노이즈가 많은 데이터에 대한 가중치를 낮게 처리하거나
등분산성을 갖도록 y변수 변환
** 이분산성을 무시할 경우
이분산성을 무시하고 비가중 회귀분석을 하더라도 불편추정치를 얻을 수 있지만, 적절한 가중치를 사용한 경우보다는 정확성이 떨어짐
'School > 데이터사이언스개론' 카테고리의 다른 글
Bihistogram (0) | 2022.04.16 |
---|---|
Box Plot (0) | 2022.04.16 |
Histogram (0) | 2022.04.14 |
Run Sequence Plot / Lag Plot (0) | 2022.04.14 |
Probability Plot / Normal Probability Plot (0) | 2022.04.14 |