R은 잠시도 정체되어 있지 않고 끊임없이 진화하고 있습니다. 초판 발간 후 6년 동안 많은 변화가 있었는데, 특히 패키지 tidyverse의 출현은 매우 주목할 사항입니다. 그것은 R의 모습이 tidyverse 이전과 이후로 완전히 구분된다고 할 수 있기 때문입니다. 데이터 다루기와 그래프 성능이 비교할 수 없을 만큼 향상되었고, 복잡한 분석 과정이 단순화되어 매우 효율적인 분석이 가능해졌습니다. 이러한 발전을 통해 R은 이제 data science를 위한 최적의 프로그램으로 자리매김했다고 할 수 있습니다.
이 책은 초판의 구성을 가능한 유지하되 tidyverse에 속한 패키지들을 주로 사용하는 방향으로 내용을 대폭 개정했습니다. 1부 는 R을 처음 접하는 초보자뿐만 아니라 이미 R을 사용하고 있는 중급 사용자들에게도 실질적인 도움이 될 수 있도록 구성되어 있습니다. 데이터 다루기는 패키지 dplyr을 사용함으로써 효과적이며 간편한 방법을 소개하고 있고, 데이터 시각화는 ggplot2를 사용함으로써 그래프 작성의 새로운 세계를 보여주고 있습니다. 또한 패키지 purrr에 의한 프로그래밍 기법은 함수형 프로그래밍의 묘미를 느낄 수 있습니다. 그 외에도 분석에 큰 도움이 될 수 있는 새로운 내용을 많이 담고 있습니다.
2부 은 자료 탐색과 통계적 추론 등이 R에서 어떻게 구현되는지를 심도 있게 다루고 있습니다. 따라서 통계학 개론 수준에서 다뤄지는 기본 개념에 대한 이해는 필수적입니다. 또한 실제 자료분석 과정에서 가장 빈번하게 사용되는 회귀분석을 R에서 어떻게 실시하는지도 다루고 있습니다.
좋은 책을 위해 최선을 다했지만 부족한 부분이 있을 수 있습니다. 이에 대한 독자분들의 많은 조언과 충고를 기대합니다. 출간 후에라도 수정사항이 있을 경우에는 자유아카데미 홈페이지(http://www.freeaca.com) 자료실에 제공할 예정이니 참조하시길 바랍니다.