ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Spark and Spark Streaming Unit Testing
    computer/빅데이터 2016. 8. 5. 11:50

    원문 해석 : http://mkuthan.github.io/blog/2015/03/01/spark-unit-testing/

    Spark and Spark Streaming Unit Testing


    당신이 분산시스템을 만들때, 그것을 테스트하기 쉽게 만드는 것은 중대한일이다. 당신의 IDE에서 완벽하게, 통제되는 환경에서 테스트를 실행해봐라. 복잡한 시스템의 긴 개발-테스트-개발 사이클은 당신의 생산성을 없앨 것이다. 아래글에서 당신은 spark 와 Spark Streaming applications에 대한 나의 테스트 전략을 볼 수 있다. 


    Unit or integration tests, that is the question

    우리의 가상 spark application은 apache kafka로부터 데이터를 받는다. RDDs와 DStreams를 이용하여 변환을 하고, 카산드라 나 elastic 검색 데이터베이스로 결과들을 넣는다. 생산 중에 spark application은 YARN 이나 Mesos 클러스트에 배포되어지고, 모든 것은 ZooKeeper에 붙여진다. the stream processing의 큰 그림은 아래에 그려져있다. 

    변경되는 많은 부분은 테스트와 설정이 쉽지 않다. 심지어 vargant, Docker와 Ansible 로 시행된 자동화 설정도 쉽지 않다.

    'computer > 빅데이터' 카테고리의 다른 글

    [spark] spark cluster  (0) 2016.04.29
    Apache Flume  (0) 2016.04.04
    [빅데이터] 왜 이슈가 되었나  (0) 2016.03.22
Designed by Tistory.