컨텐츠상세보기

캐글 가이드 - 전 세계 데이터 과학자와 소통하고, 경쟁하고, 성장하기 (커버이미지)
알라딘
캐글 가이드 - 전 세계 데이터 과학자와 소통하고, 경쟁하고, 성장하기
  • 평점평점점평가없음
  • 저자사카모토 도시유키 (지은이), 박광수 (옮긴이) 
  • 출판사동양북스(동양문고) 
  • 출판일2020-07-06 
보유 1, 대출 0, 예약 0, 누적대출 0, 누적예약 0

책소개

전 세계 데이터 과학자와 경쟁하면서 실력을 키우는 플랫폼 캐글!
캐글에서 활동하고 싶은 데이터 과학자를 위한 ‘얇지만 내공 있는 책’

캐글은 전 세계 데이터 과학자가 모여 자신의 실력을 겨루고 상금과 명성을 얻는 경진 대회 플랫폼으로 알려져 있습니다. 그런데 캐글은 단순히 경진 대회만 열리는 공간이 아닙니다. 데이터 과학을 공부하는 공간, 다양한 기술과 지식을 공유하는 공간, 회사에 필요한 인재를 찾는 공간 등 경진 대회 이외에도 유용한 서비스가 많습니다. 캐글을 데이터 과학자의 ‘포털 사이트’라고 소개하는 사람이 있는 이유이기도 합니다.

이 책은 캐글을 처음 접하는 사람이 캐글에서 무엇을 해야 하는지를 압축해서 알려주는 가이드입니다. 경진 대회에 참가하는 요령과 주요 사례 소개는 기본이고, 자칫 놓치기 쉬운 유용한 캐글 서비스를 알려줍니다. 또한 여러 데이터 과학자와 소통하는 방법과 캐글 고수가 되는 노하우도 소개합니다. 이 책을 읽은 후에는 캐글이라는 플랫폼에서 효율적으로 활동하는 방법을 자연스럽게 익힐 것입니다.

경진 대회 플랫폼으로 유명한 캐글의 여러 가지 활용 방법을 경험하자!
머신러닝, 딥러닝, 데이터 과학의 기초를 어느 정도 익혔다고 생각해보죠. 그럼 실전 혹은 실전에 가까운 사례를 경험하면서 자신의 실력을 향상시킬 기회가 필요합니다. 그러려면 내가 해결해야 할 문제도 있어야 하고, 여러 가지 데이터 세트를 확보해야 하며, 최신 기술도 찾아봐야 하고, 멘토도 있어야 합니다. 상황에 따라서는 GPU를 탑재한 성능 좋은 하드웨어도 필요합니다.

실제로 이 책과 함께 편집자가 경험한 캐글은 방금 소개한 요소가 한꺼번에 모여 있는 공간이었습니다. 그래서 많은 데이터 과학자가 앞으로 주목해야 할 것으로 생각합니다. 기존 개발자들에게 스택 오버플로가 있었다면 데이터 과학자에게는 앞으로 캐글이 그 역할을 하지 않을까 조심스레 예측합니다.

이 책은 데이터 과학자가 캐글이라는 플랫폼을 잘 이해하도록 소개하는 가이드라고 말하고 싶습니다. 솔직히 말하면 데이터 과학과 관련한 기초 지식을 알려준다거나, 경진 대회에 상위 입상하는 비법을 알려주지는 않습니다. 하지만 데이터 과학자가 효율적으로 캐글을 활용할 수 있는 여러 가지를 알려준다는 장점이 있습니다. 만약 데이터 과학은 어느 정도 공부했지만 캐글을 어떻게 접근하고 참여할지를 잘 몰랐다면 이 책과 함께 캐글을 시작하기 바랍니다.

이 책에서 배우는 내용
● 캐글 컨트리뷰터되기(캐글 튜토리얼 완료하기)
● 캐글의 주요 서비스인 경진 대회, 데이터 세트, 노트북, 토론 경험하고 이해하기
● 캐글이라는 플랫폼을 활용해 데이터 과학과 관련된 지식 얻기
● 경진 대회의 성격과 진행 흐름 이해하기
● 내 머신러닝 개발 환경으로 캐글을 활용하는 노트북이나 API 활용 방법 살펴보기

저자소개

IT 스타트업에서 모바일 앱을 개발했으며 현재는 이에라에 시큐리티에서 에지 인공지능을 개발 중입니다. IT 개발자는 장소와 상관없이 자유롭게 일하면서 무에서 가치가 있는 결과물을 만드는 사람이라는 신념이 있습니다. 이 신념 아래 새로운 사회와 시대에 도움이 되는 프로그램을 만들려고 늘 고민하는 삶을 사는 중입니다.

목차

1장 캐글 소개



01 캐글이란 무엇인가

캐글이란

캐글링하기



02 캐글 활용 사례

데이터 분석 인프라로 활용하기

회사 연수에 활용하기

캐글러에게 질문하기



03 다양한 경진 대회

학습용 경진 대회

정기 경진 대회

특수한 데이터를 다루는 경진 대회

특수한 규칙을 따르는 경진 대회





2장 캐글 시작하기



04 캐글 첫걸음

캐글 계정 만들기

캐글의 교육 과정 경험하기



05 캐글 컨트리뷰터 되기

캐글의 사용자 프로필 페이지

캐글러 등급

컨트리뷰터

캐글러의 교류

경진 대회 참가하기

컨트리뷰터가 되었는지 확인하기





3장 노트북 자유자재로 다루기



06 노트북

SaaS 기반 머신러닝 개발 환경



07 노트북 사용하기

스크립트 타입으로 사용하기

노트북 타입으로 사용하기



08 노트북 능숙하게 다루기

노트북 설정하기

데이터 세트 사용하기

외부 코드 사용하기





4장 캐글의 경진 대회



09 경진 대회와 노트북

경진 대회에서 노트북의 역할

경진 대회의 진행 흐름에 따른 노트북 분류



10 다양한 경진 대회

다양한 경진 대회 소개

공개 노트북 중심으로 경진 대회 살펴보기

실제 경진 대회의 진행 흐름

경진 대회 노트북의 발전 흐름



11 경진 대회의 세부 사항

경진 대회의 세부 사항이 중요한 이유

경진 대회의 별도 규칙

경진 대회 종료 후





5장 캐글 마스터 지향하기



12 경진 대회 규칙 이해하기

경진 대회 규칙 확인하기

노트북 전용 경진 대회

노트북 전용 경진 대회 사례

노트북 전용 경진 대회의 특별 규칙



13 데이터를 더 잘 이해하기

데이터를 잘 이해해야 하는 이유

Santander Value Prediction Challenge 사례 살펴보기



14 최신 기술 살펴보기

종료한 경진 대회에서 기술 흐름 살펴보기

머신러닝 모델의 튜닝 방법 살펴보기



15 캐글 제대로 활용하기

공개 데이터 세트 활용하기

데이터 세트에서 사용하는 파일 알아보기

캐글 API

캐글 API로 머신러닝 실행하기



부록 캐글에서 자주 사용하는 머신러닝 라이브러리와 프레임워크



16 LightGBM 사용하기

LightGBM

LightGBM 예제 코드

LightGBM 파라미터



17 fast.ai 사용하기

fast.ai

fast.ai를 사용한 이미지 인식 예제 코드

예제 코드 살펴보기

torchVision 사용하기

모델을 테스트하고 경진 대회에 제출할 결과 저장하기

한줄 서평