오늘은 다음과 같은 산포로를 만드는 방법을 배워봅시다.

데이터

data.frame d에 길이 n과 두개의 상관된 변수 a와 b를 시뮬레이션합니다.

기본 산포도

ggplot2를 사용하면 기본 산점도 (theme_minimal 포함)은 다음을 통해 생성됩니다.

모양과 크기

포인트의 모양과 크기를 조정하는 데는 아래와 같이 여러 가지 방법이 있습니다.

색상

여기서는 그들 사이의 상관 관계를 시각화하는 방식으로 포인트를 색칠하고자합니다. 한 가지 옵션은 변수 중 하나를 사용하여 색상을 지정하는 것입니다. 예를 들어, 변수 a의 색을 입혀보면 아래와 같습니다.

이 플롯에서 미묘하지만 문제는 포인트가 왼쪽에서 오른쪽으로 갈수록 색상이 변하는 것입니다. 대신 색상을 상관 관계의 특성을 나타내는 방향으로 변경해야합니다.이 경우 대각선으로 나타납니다. 이렇게하기 위해 우리는 첫 번째 주성분에 의해 포인트들을 색칠 할 수 있습니다. 변수 pc로 데이터 프레임에 추가하고 다음과 같이 색상을 지정하십시오.

이제 색상을 추가 할 수 있습니다. scale_color_gradient 함수와 16 진수 코드를 사용하여 구현합니다.

투명도

이제 알파값으로 투명도를 모든 점들에 대해 동일하게 조정할 수 있습니다.

그럭저럭 괜찮은것 같습니다. 하지만, 점이 많은 경우 수치를 조정하여 좀더 명확히 보일게 할 수 있습니다.

보시다시피 또 다른 큰 덤불이 보입니다. 알파를 0.05 이하로 낮추면 어떨까요?

이 프롯에서 혼자있는 극단적인 점을보기가 어렵다는 것을 제외하면 더 좋습니다. 이를 해결하기 위해 알파를 역점 밀도에 매핑합니다. 즉, 많은 포인트가있는 곳이면 알파를 줄입니다! 이 트릭은 다음과 같이 추가 할 수있는 이변 량 밀도를 사용하는 것입니다.

이제 1/밀도에 매핑된 알파로 플롯을꾸며보겠습니다.

먼 지점이 너무 활발하다는 것을 알 수 있습니다. 우리의 최종 수정점은 scale_alpha를 사용하여 알파 범위를 조정하는
것입니다. 기본적으로이 범위는 0에서 1까지이며 가장 먼 지점의 알파가 1에 가까워집니다. 더 나은 것으로 제한 해 봅시다

훨씬 더 나은것 같습니다. 더 이상의ㅣ 부드러운 패치 또는 잃어버린 포인트는 없습니다.

전체 코드

다음은 새로운 데이터와 색상을 사용한 젠체 코드입니다.

(Visited 17 times, 1 visits today)