실험데이터 설계부터 수집, 분석까지 체계적 수행을 제시하는 안내서!
‘실험설계’는 연구자가 연구목표를 달성하기 위하여 설정하는 체계적 방법론으로 과학적 연구의 기본이며 연구의 질을 결정하는 중요한 요소이다. ‘무작위 배치(random assignment)와 실험조작(experimental manipulation)이 포함된 실험(RCT, randomized control trial)’을 기반으로 하는 ‘실험설계기법’은 가장 타당한 인과추론 방법이며, ‘실험데이터’는 독립표본 티테스트(independent sample t-test)와 분산분석(ANOVA)과 같이 기초적 데이터 분석기법을 소개하는 입문과목에서 매우 빈번하게 활용된다.
그러나 이러한 중요성에도 불구하고 전반적인 실험설계 과정을 소개하거나 실험데이터를 구체적으로 어떻게 분석해야 하는지 소개하는 서적들은 별로 없다. 입문서 성격을 지니는 R 관련 도서는 분산분석과 사후 다중비교(posthoc multiple comparison)를 소개하는 수준에 머무는 경우가 많고, 실험설계와 실험데이터 분석을 전문적으로 다루는 몇몇 도서는 과도하게 전문적이어서 연구자들의 실제적 연구에 도움이 되지 못하는 경우가 많다.
이 책은 실험설계를 토대로 수집된 실험데이터를 R을 이용하여 어떻게 분석할 수 있는지 소개하였다. 행동주의 사회과학이나 공중보건 및 의학 분야 연구자들이 흔히 설계하게 되는 완전요인설계(full factorial design) 상황에서 구체적으로 실험표본을 얼마나 수집해야 하는지(sample size determination), 그리고 수집된 실험데이터를 어떻게 분석해야 하는지 상세히 서술하였다. 아울러 실험연구에서 종종 등장하는 추가 분석기법들로 단순효과 분석(simple effect analysis), 계획비교(planned contrast), 사후 다중비교(posthoc multiple comparison)를 포괄적이고 체계적으로 서술하였다.
실험은 인과율이 확보된 처치효과를 추정할 수 있는, 알려진 모든 연구방법 중 가장 좋은 방법이다. 본서를 통해 연구자들이 효율적이고 효과적으로 실험데이터를 분석하는 방법을 습득하고, 자신의 활동분과에서 신뢰할 수 있는 연구결과를 이끌어내기를 바란다. 실험설계를 올바르게 진행하고 실험표본규모를 적정하게 추정하며, 처치효과를 다각도로 효과적으로 추정할 수 있기를 기대한다!
주요 내용
이 책은 총 3부 11개 장으로 구성되어 있다.
∙ 1부 1장에서는 인과추론 관점에서 실험설계의 장점을 소개하고, 실험데이터 분석을 위한 기초 개념어들을 설명하였다. 2장에서는 실험설계 및 실험데이터 분석의 진행과정 전반을 설명하고, 3장에서는 표본크기 추정과 실험데이터 분석을 위한 R 패키지들을 소개하였다.
∙ 2부(4-9장)에서는 활용도가 높은 실험설계 상황별로 표본크기 추정방법을 구체적으로 설명하고 예시하였다. 4장에서는 단일요인설계 상황에서의 표본크기 추정방법을 소개한 후, 실험데이터를 대상으로 주효과를 추정하고 해당 주효과를 대상으로 적용 가능한 단순효과 분석, 계획비교, 사후 다중비교를 소개하였다.
5장에서는 2요인설계 상황에서의 표본크기 추정방법을 소개한 후, 실험데이터를 대상으로 주효과와 상호작용효과를 추정하고 통계적으로 유의미한 상호작용효과가나타났을 때 적용할 수 있는 단순효과 분석(단순주효과 분석과 단순기울기 분석), 계획비교, 사후 다중비교를 소개하였다.
6장에서는 3요인설계 상황에서의 표본크기 추정방법을 소개하고, 실험데이터를대상으로 주효과와 2원상호작용효과 및 3원상호작용효과를 추정한 후 통계적으로 유의미한 3원상호작용효과가 나타났을 때 적용할 수 있는 단순효과 분석(단순주효과 분석과 단순2원상호작용 분석), 계획비교, 사후 다중비교에 대해 설명하였다.
7장에서는 개체내 요인이 포함된 반복측정설계 상황에서의 표본크기 추정방법을 소개하고, 실험데이터 분석방법과 추가 분석방법(단순효과 분석, 계획비교, 사후 다중비교 등)을 설명하였다.
8장에서는 블록설계와 배속설계 개념을 설명한 후, 각 상황별 표본크기 추정방법과 실험데이터 분석방법 및 추가 분석방법을 예시하였다.
9장에서는 실험설계과정에서 연구자가 살펴보고자 하는 종속변수(이항 범주형 변수, 순위 범주형 변수, 무순위 범주형 변수 등)에 대해 정규분포를 가정할 수 없는 경우, 실험데이터를 어떻게 분석할 수 있는지 설명하였다. 앞서 정규분포를 가정할 수 있는 종속변수를 대상으로 한 실험데이터 분석을 다룬 4-8장에서는 전통적인 분산분석이나 혼합모형을 사용해야 하지만, 정규분포를 가정할 수 없는 종속변수의 경우에는 일반화선형모형(GLM, generalized linear model)이나 일반화선형혼합모형(GLMM, generalized linear mixed model)을 활용해야 한다. 따라서 9장에서는 일반화선형모형이나 일반화선형혼합모형을 활용한 분석이 통상적인 분산분석 결과와 어떤 점이 다르고 어떤 점이 유사한지, 그리고 정규분포를 가정하기 어려운 종속변수가 포함된 실험데이터를 대상으로 효과패턴을 시각화하거나 추가 분석을 수행할 때 주의할 점은 무엇인지 구체적인 예시와 함께 쉽게 서술하였다.
∙ 3부 10장에서는 실험설계와 실험데이터 분석과 관련하여 본서에서 다루지 않은 부분들을 짧게 소개하고 심화학습을 원하는 독자들을 위한 참고문헌을 제시하였다. 끝으로 11장에서는 실험데이터 분석과정에서 유의할 요점들은 무엇인지 정리하였다.