최근 KDnuggets 에서는 데이터 과학을 위한 분석 프로그밍 언어(Python, Scala)별 최고의 라이브러리를 선정하여 발표 하였습니다. 특히, R은 모두 다른 데이터 과학 과제 및 프로젝트에 인기가 있으나 그만큼 지지자와 반대자도 많은게 사실 입니다. 이 기사에는 데이터 경험자에 따라 데이터 과학자와 엔지니어를 위해 가장 유용한 R 라이브러리가 무엇인지 알려 줍니다.

R은 데이터 과학 분야에서 널리 알려지고 많이 사용되는 도구입니다. 주로 통계 계산을 위해 설계된 프로그래밍 언어 및 소프트웨어 환경 이므로, 인터페이스와 구조가 과학적 작업에 매우 적합합니다. 또한 R은 다양한 문제를 해결하기 위해 수많은 패키지를 계산하는 가장 발전된 라이브러리 시스템 중 하나 입니다.

많은 범용 패키지가 있지만 이 기사에는 데이터 조작, 시각화, 경쟁력 있는 연구 및 기계 학습을 위한 충분한 기능을 제공하는 제품에 중점을 두고 있습니다. 라이브러리의 주요 기능과 GitHub 활동을 다루는 데이터 과학을 위한 Top 20 R 패키지의 인포그래픽은 아래와 같습니다.

Infographic

물론이 라이브러리 목록은 완벽하지는 않지만 여기서는 가장 일반적이며 시간이 오래 걸린 도구를 수집했습니다.

이 라이브러리 목록을 제공한 ActiveWizards는, 독점적으로 데이터 프로젝트 (빅데이터, 데이터 과학, 기계 학습, 데이터 시각화)에 중점을 둔 데이터 과학자 및 엔지니어 팀입니다. 핵심 전문 분야는 데이터 과학 (연구, 기계 학습 알고리즘, 시각화 및 엔지니어링), 데이터 시각화 (d3.js, Tableau 및 기타), 빅데이터 엔지니어링 (Hadoop, Spark, Kafka, Cassandra, HBase, MongoDB 및 기타) 데이터 집약적 인 웹 애플리케이션 개발 (RESTful API, Flask, Django, Meteor)을 하고 있습니다.

 

출처: Top 20 R Libraries for Data Science in 2018