장바구니 담기 close

장바구니에 상품을 담았습니다.

R을 이용한 공공데이터 분석

R을 이용한 공공데이터 분석

  • 오대영
  • |
  • 한나래아카데미
  • |
  • 2021-03-01 출간
  • |
  • 384페이지
  • |
  • 182 X 257 mm
  • |
  • ISBN 9788955662481
판매가

28,000원

즉시할인가

27,720

배송비

2,500원

(제주/도서산간 배송 추가비용:3,000원)

수량
+ -
총주문금액
27,720

※ 스프링제본 상품은 반품/교환/환불이 불가능하므로 신중하게 선택하여 주시기 바랍니다.

출판사서평




이 책은 특징을 꼽아보면 다음과 같다.

* 첫째, 공공데이터 분석에 전문화하고, 사례를 풍부하게 제시하였다.
정부와 공공기관들이 무료로 공개하고 있는 공공데이터는 정보의 보고이다. 공공부문의 수많은 데이터를 공개해 민간부문이 이를 분석에 활용함으로써 다양한 부가가치를 창출할 수 있다. 우리나라는 2013년 〈공공데이터 제공 및 이용활성화에 관한 법〉을 제정하고 적극적으로 데이터 공개 정책을 시행하고 있다. 2013년에 구축된 공공데이터포털 및 정부와 공공기관들의 홈페이지에서는 국민과 기업이 원하는 공공데이터를 쉽게 이용할 수 있도록 제공하고 있다. 따라서 국민들은 누구나 무료로 공공데이터를 다운받아 분석ㆍ가공해서 보고서 작성, 정책 개발, 경영전략 수립, 앱 개발 등 다양한 용도로 활용할 수 있다.
데이터를 활용해서 뉴스나 스토리를 만드는 공공데이터 분석 역량은 여러 분야에서 매우 중요한 힘으로 작용할 수 있다. 특히 언론 및 사회 분석과 관련된 분야에서 널리 이용될 수 있다. 오늘날 탐사보도를 비롯한 언론 뉴스에서 데이터 분석은 매우 중요한 취재 방법이 되었고, 데이터 저널리즘의 중요성은 점점 커지고 있다. 대학에서 데이터 저널리즘 학습이 한층 중요해지고 있는 것도 이 때문이다. 이러한 취지에서 이 책은 누구라도 공공데이터 분석 역량을 갖추고 현업에서 활용할 수 있도록 공공데이터 분석 분야에 전문화하고, 실제 공공데이터 분석 사례를 많이 수록하였다.

* 둘째, 통계 분석과 그래프 그리기 방법을 충실하게 기술하였다.
통계를 이해하고, 통계적 분석을 할 수 있어야 차이가 없는데도 있다고 하는 것과 같은 중대한 잘못을 범하지 않고 유의미한 데이터 분석 결과를 도출해낼 수 있다. 이러한 생각에서 이 책에서는 데이터 분석의 기본 바탕이 되는 통계 분석 방법을 독자들에게 쉽고 명확히 전달하고자 힘썼다. 아울러 대표적인 시각화 자료인 그래프 이용 방법을 충실히 기술하여 독자들이 데이터 분석의 핵심 내용을 효과적으로 전달할 수 있도록 안내하였다.

* 셋째, 데이터 분석 초보자들도 쉽게 따라할 수 있도록 서술하였다.
이 책의 저자는 통계, 데이터 분석과는 거리가 있는 저널리즘 분야에서 오랫동안 일과 연구를 해왔다. 그러다가 빅데이터 분석의 가치에 눈뜨면서 많은 시행착오를 거치며 R 프로그램을 익히고, 데이터 분석을 저널리즘 분야에 적용하는 연구를 시작하게 되었다. 컴퓨터 언어를 접해본 적 없는 비전공자로서 새로운 언어와 코딩 문법의 세계를 이해하는 것이 결코 쉽지 않다는 점을 누구보다도 잘 알기에, 저자는 본문의 내용을 독자들이 최대한 쉽게 이해할 수 있도록 담고자 노력하였다. 실제 사례와 연습문제를 풍부히 넣은 것도 이러한 이유에서다.

이제 데이터 분석은 분야를 막론하고 대부분의 학문분과와 산업분야에서 과학적 의사결정을 지원하고, 변화를 모색하며, 의미 있는 가치를 창출해내는 데 꼭 필요한 과정이 되었다. 이 책을 읽는 다양한 분야의 독자들이 직접 분석을 실행하고 반복적으로 행하는 실제적 학습을 통해 데이터 분석의 가치를 경험하고 자신의 연구 분야로 확장해나갈 수 있기를 기대한다!


목차


1장 공공데이터 분석의 의미
1. 데이터의 힘
2. 데이터의 의미
3. 공공데이터 개방
4. 공공데이터 분석의 기초

2장 R과 RStudio 설치하기
1. R 설치하기
2. RStudio 설치
3. RStudio 인터페이스
4. 파일 저장하기
5. 환경설정 31

3장 데이터 구조
1. 용어의 이해
2. 데이터 구조
연습문제

4장 데이터 불러오고 저장하기
1. 내장 데이터 활용
2. 워킹 디렉터리 지정하기
3. 외부 데이터 불러오기
4. 데이터프레임을 csv 파일로 저장하기

5장 데이터 연산과 기본 함수
1. 데이터 연산
2. 데이터 구조를 알아보는 함수
3. 기본 통계 함수
4. 빈도분석
연습문제

6장 데이터 가공
1. 데이터 전처리
2. 변수이름 바꾸기: rename( )
3. 빈도분석: count( ) 1
4. 데이터세트에서 일부 열을 추출하기: select( )
연습문제 6-1
5. 데이터세트에서 행 추출하기: slice( ), filter( )
연습문제 6-2
연습문제 6-3
6. 파생변수 만들기: mutate( )
7. 집단별 통계량 구하기: group_by(), summarise(), n()
연습문제 6-4
8. 연속 데이터로 범주변수 만들기: mutate( ) + ifelse( )
연습문제 6-5
9. 데이터 정렬하기: arrange( )
연습문제 6-6
10. 데이터 결합하기
11. 알아두면 유용한 함수
연습문제 6-7
연습문제 6-8

7장 결측치, 이상치 처리
1. 결측치
2. 이상치
연습문제

8장 통계 분석
1. 분석 방법
2. 통계 검정
3. 통계 분석 사례
연습문제

9장 그래프 그리기
1. 기본 지식
2. R 제공 그래프 함수: plot( ), barplot( ), hist( ), boxplot( )
3. ggplot 그래프
4. ggplot( ) 함수를 정교하게 그리기

10장 공공데이터 사례 분석
10-1: 서울 미세먼지 분석
1. 분석 개요
2. 분석 데이터
3. 엑셀 파일에서 데이터 구조 보기
4. 데이터 전처리
5. 데이터 분석
연습문제 10-1

10-2: 수도권 지하철 승하차 인원 분석
1. 분석 개요
2. 분석 데이터
3. 엑셀 파일에서 데이터 구조 보기
4. 데이터 전처리
5. 데이터 분석
연습문제 10-2

10-3: 한국인의 정신건강 분석
1. 분석 개요
2. 분석 데이터
3. 데이터 전처리
4. 데이터 분석
연습문제 10-3

10-4: 서울의 음식점 창업 현황 분석
1. 분석 개요
2. 분석 데이터
3. 엑셀 파일에서 데이터 구조 보기
4. 데이터 전처리
5. 데이터 분석
연습문제 10-4

10-5: 한국인의 임금 실태 분석
1. 분석 개요
2. 분석 데이터
3. R로 불러와서 분석 객체 만들기
4. 데이터 전처리
5. 분석하기
연습문제 10-5

교환 및 환불안내

도서교환 및 환불
  • ㆍ배송기간은 평일 기준 1~3일 정도 소요됩니다.(스프링 분철은 1일 정도 시간이 더 소요됩니다.)
  • ㆍ상품불량 및 오배송등의 이유로 반품하실 경우, 반품배송비는 무료입니다.
  • ㆍ고객님의 변심에 의한 반품,환불,교환시 택배비는 본인 부담입니다.
  • ㆍ상담원과의 상담없이 교환 및 반품으로 반송된 물품은 책임지지 않습니다.
  • ㆍ이미 발송된 상품의 취소 및 반품, 교환요청시 배송비가 발생할 수 있습니다.
  • ㆍ반품신청시 반송된 상품의 수령후 환불처리됩니다.(카드사 사정에 따라 카드취소는 시일이 3~5일이 소요될 수 있습니다.)
  • ㆍ주문하신 상품의 반품,교환은 상품수령일로 부터 7일이내에 신청하실 수 있습니다.
  • ㆍ상품이 훼손된 경우 반품 및 교환,환불이 불가능합니다.
  • ㆍ반품/교환시 고객님 귀책사유로 인해 수거가 지연될 경우에는 반품이 제한될 수 있습니다.
  • ㆍ스프링제본 상품은 교환 및 환불이 불가능 합니다.
  • ㆍ군부대(사서함) 및 해외배송은 불가능합니다.
  • ㆍ오후 3시 이후 상담원과 통화되지 않은 취소건에 대해서는 고객 반품비용이 발생할 수 있습니다.
반품안내
  • 마이페이지 > 나의상담 > 1 : 1 문의하기 게시판 또는 고객센터 1800-7327
교환/반품주소
  • 경기도 파주시 문발로 211 1층 / (주)북채널 / 전화 : 1800-7327
  • 택배안내 : CJ대한통운(1588-1255)
  • 고객님 변심으로 인한 교환 또는 반품시 왕복 배송비 5,000원을 부담하셔야 하며, 제품 불량 또는 오 배송시에는 전액을 당사에서부담 합니다.