xray: The R Package to Have X Ray Vision on your Datasets

이 패키지를 사용하면 데이터 집합의 변수를 분석하고 데이터의 모양을 평가할 수 있습니다. 이것이 모델링을위한 데이터를 가지고있을 때 이것을 첫 번째 단계로 생각하십시오.이 패키지를 사용하여 모든 변수를 분석하고 변형 할 가치가있는 이상한 점이 있는지 확인하거나 변수를 모두 피할 수 있습니다.

설치 방법

사용법

이상 탐지

xray::anomalies 는 NAs, Zeroes, Infinite 등의 모든 예외 열을 분석하고 이러한 예외가있는 행의 80 % 이상이있는 변수를 감지하면 경고합니다. 또한 모든 행의 값이 같을 때 경고 메시지를 표시합니다.

예제:

확률분포

xray::distributions는 변수의 분포를 분석하려고하므로 각 변수가 통계적으로 어떻게 구성되어 있는지 이해할 수 있습니다. 또한 숫자 변수의 백분위 수 테이블을 결과로 반환하여 데이터의 모양을 알려줍니다.

시간축에 따른 확률분포

xray::timebased는 또한 확률분포를 조사하지만 시간 경과에 따른 변경 사항을 보여주기 때문에 시간이 지남에 따라 확률분포에 변경 사항이있는 경우 (예 : 변수가 중지되거나 수집되기 시작한 경우) 쉽게 시각화 할 수 있습니다.

 

#> [1] “7 charts have been generated.”

소스: xray: The R Package to Have X Ray Vision on your Datasets

About The Author

THE-R

한국HP 엔터프라이즈 컨설팅 PM 경력 현 (주)아이리치그린 대표이사 현 데이터진흥원 빅데이터 기획 멘토

error: Content is protected !!