데이터 과학은 코드에서 이뤄진다
협업이 필요한 대규모 프로젝트에서는 데이터 과학자에게도 유지보수성이 높은 코드를 작성하는 것이 요구된다. 그럼에도 데이터 과학자는 교육 과정에서 소프트웨어 엔지니어링 역량을 높일 기회가 많지 않고, 현업에서 배우고 싶더라도 마땅한 방법을 찾기 어려운 실정이다.
이 책은 소프트웨어 엔지니어링의 모범 사례를 데이터 과학에 적용하는 방법을 다룬다. 성능, 객체지향, 테스트, 오류 처리, 린팅, 문서화, 버전 관리, 패키징, API, 배포 등 일반적인 소프트웨어 엔지니어링 기술을 파이썬 예제를 통해 설명한다. 데이터 과학자에게 친숙한 예제를 통해 더 나은 파이썬 코드를 작성하는 방법을 배울 수 있고, 이는 개발자와의 협업 및 프로덕션 환경에서 작업하는 데에 큰 무기가 된다.
통계나 머신러닝 기법에 정통한 데이터 과학자조차 소프트웨어 엔지니어링에 대한 이해가 부족해 한계에 부딪히곤 한다. 대규모 프로젝트를 성공으로 싶다면, 이 책이 거대한 간극을 메워주는 미싱 링크 역할을 해줄 것이다.
대상 독자
● 코딩 스킬을 향상하고자 하는 데이터 과학 유관 분야 종사자
● 데이터 과학 학위를 막 마쳤거나 독학으로 배운 주니어 데이터 과학자
● 수학/과학 등 다른 분야에서 데이터 과학으로 전환 중인 분야 입문자
● 개발자와의 협업이나 교류가 잦은 관련 업무 종사자
주요 내용
● 효율적이고 강력한 파이썬 코드 작성하기
● 데이터 구조와 객체지향 프로그래밍 이해하기
● 테스트, 오류 처리, 로깅 모범 사례
● 안전한 코드 작성하기
● 데이터 과학 코드를 더 큰 코드베이스와 통합하기
● 코드를 명확하고 능숙하게 문서화하기
● 코드 패키징 및 공유하기
● API 작성 방법 배우기
● 소프트웨어 엔지니어와 효과적으로 협업하기
● 데이터 과학 프로젝트를 프로덕션 단계로 전환하기