마스터링 아피치 스파크(Mastering Apache Spark)
저자: 마이크 프램톤
역자: 정기훈
구분: 번역서
발행일: 2016년 06월 08일
정가: 22,000원
페이지: 356 페이지
ISBN: 978-89-5674-695-1
출판사: 정보문화사
판형:
난이도:

아파치 스파크를 이용하여

빅데이터 처리 등 고급 스킬 습득을 위한 좋은 지침서!



이 책에서는 스파크의 각각의 모듈에 관해 기술하고 이것들이 어떻게 실제로 사용되는지를 설명할 것이다. 또한, 스파크의 기능이 H2O 같은 추가 라이브러리를 통해 어떻게 확장될 수 있는지도 보여줄 것이다. 그리고 아파치 스파크의 그래픽 프로세싱 모듈이 어떻게 아우렐리우스의 타이탄 그래프 데이터베이스와 함께 사용되는지도 보여줄 것이다. 이를 통해 스파크 GraphX와 타이탄을 그룹핑 함으로써 그래프 기반의 프로세스와 스토리지로 엮이는 것을 확인할 수 있을 것이다.


출판사 서평

아파치 스파크는 클러스터 기반의 인메모리 병렬 처리 시스템으로, 그래프 처리, 머신 러닝, 스트림 처리, SQL 등 폭넓은 기능을 제공한다.

이 책은 스파크의 기능을 어떻게 확장시키는지를 설명하여 스파크에 대한 지식을 한 단계 더 높이는 것을 목표로 하고 있다. 또한, 스파크 생태계를 훑어보는 것부터 시작한다. 그리고 MLlib을 사용하여 완전히 동작하는 신경망을 만들어 손글씨를 판별하도록 할 것이고, 최적의 성능을 올리는 병렬 처리가 가능하도록 스트림 처리를 다루는 방법에 대해 설명할 것이다. 그런 다음 머신 러닝을 위한 H2O, 그래프 기반의 스토리지를 위한 타이탄, 클라우드 기반의 스파크를 위한 데이터브릭스 등을 어떻게 활용하는지를 설명한다. 아울러, CentOS 리눅스 및 데이터브릭스 클라우드 환경에서 아파치 스파크 모듈 프로세싱을 위해 스칼라로 작성한 예제 코드도 제공한다.

이 책에서 다루는 내용:
  • 프로세싱과 스토리지를 위한 확장 툴
  • MLlib을 사용하여 클러스터링과 분류기법 구현
  • Flume과 HDFS를 통한 스파크 스트림 프로세싱 이해
  • 스파크 SQL을 통한 스키마 생성 및 데이터 입력
  • 스파크 GraphX를 사용한 스파크 기반의 그래프 프로세싱
  • 스파크와 H2O, 딥 러닝 결합 및 이에 따른 장점
  • 아파치 스파크의 대표적 그래프 스토리지 - 타이탄, HBase, 카산드라 비교
  • 아파치 스파크를 클라우드 상에서 구현하기 위해 사용되는 데이터브릭스와 AWS


  • 지은이 | 마이크 프램톤
    IT 분야에 몸담고 있으며, IT 블로그 및 집필 활동을 통해 새로운 기술이나 빅데이터에 대한 통찰력을 보여주고 있다. 마이크는 1990년부터 IT 분야에서 일하며 테스트, 개발, 지원, 집필 등 폭 넓은 경험을 쌓았을 뿐만 아니라 에너지, 금융, 통신, 보험 등과 같은 비 IT 분야에서의 근무 경험도 가지고 있다. 마이크는 빅데이터, 인공지능, IT 분야에 대한 새로운 아이디어와 기술을 접하는 것을 좋아한다.


    옮긴이 | 정기훈
    현재 KT에서 유무선네트워크 기획·홍보 등의 업무를 하고 있으며 IT와 관련된 다양한 분야에 관심을 갖고 있다. 옮긴 책으로는 ‘Cocos2D 게임 프로그래밍’, ‘Learning Mac/iOS 개발자를 위한 오브젝티브-C 2.0’, ‘Learning iOS 게임 프로그래밍’ 등이 있으며, 저서로는 ‘원리로 이해하는 네트워크 입문’ 등이 있다.
    309 [보도자료] 인공지능 바이블 : 인공지능에 대한 모든 것 운영자 2022-07-04 5674-916.zip(9911KB)
    308 [보도자료] 가장 쉬운 인스타툰 만들기(프로크리에이트로 만들어 돈벌기) 운영자 2022-05-16 5674-918.zip(8036KB)
    307 [보도자료] 안녕하세요 포토샵&일러스트레이터 2022 운영자 2022-05-03 5674-917.zip(16MB)
    306 [보도자료] 한 권으로 끝내는 네이버쇼핑 스마트스토어 바이블 운영자 2022-01-27 5674-915.zip(8444KB)
    305 [보도자료] 개발자를 위한 스타트업 운영자 2021-12-08 5674-914.zip()
    304 [보도자료] 안녕하세요 포토샵 2021 운영자 2021-11-05 5674-913.zip(14MB)
    303 [보도자료] 스케치업 2021 feat Ruby : 건축/인테리어 실전 모델링의 기준 운영자 2021-09-01 5674-912.zip(17MB)
    302 [보도자료] 안녕하세요 라이트룸 클래식 2021 운영자 2021-09-01 5674-910.zip(12MB)
    301 [보도자료] 디지털 시대에 살아남는 IT 지식 운영자 2021-08-19 5674-911.zip(6312KB)
    300 [보도자료] 파이썬 딥러닝 텐서플로 운영자 2021-07-07 5674-909.zip(14MB)
    299 [보도자료] 파이썬 데이터 과학 통계 학습 운영자 2021-05-26 5674-907.zip(16MB)
    298 [보도자료] 회사 실무에 힘을 주는 스케치업 2021 & V-Ray(SketchUp Pro) 운영자 2021-05-03 5674-906.zip(10MB)
    297 [보도자료] IT 업계에서 살아남기 운영자 2021-04-13 5674-908.zip(8427KB)
    296 [보도자료] 뉴노멀 시대를 위한 비즈니스 생존 키워드 운영자 2021-03-12 5674-905.zip(7888KB)
    295 [보도자료] 회사 실무에 힘을 주는 프리미어 프로 운영자 2021-03-02 5674-904.zip(11MB)
    294 [보도자료] R 데이터 분석 머신러닝 운영자 2021-02-17 5674-903.zip(8235KB)
    293 [보도자료] 가장 쉬운 동영상 편집 운영자 2021-02-01 5674-902.zip(5945KB)
    292 [보도자료] 초보자를 위한 리액트 200제 운영자 2021-01-25 5674-901.zip(4508KB)
    291 [보도자료] 회사 실무에 힘을 주는 한글 2020 운영자 2020-12-14 5674-899.zip(8054KB)
    290 [보도자료] 파이썬 딥러닝 머신러닝 입문 운영자 2020-12-10 5674-900.zip(12MB)
    자료명 등록일 다운로드
    본문 소스 코드 2018-07-12 01000153.zip