spark를 실행 하고 있으면 cleaned accumulator 숫자
INFO org.apache.spark.ContextCleaner - Cleaned accumulator 126
의 형태를 볼수 있다 무엇을 의미 하는 것 일까 ?
19:17:36.899 [Spark Context Cleaner] INFO org.apache.spark.ContextCleaner - Cleaned accumulator 126 19:17:36.899 [Spark Context Cleaner] INFO org.apache.spark.ContextCleaner - Cleaned accumulator 145 19:17:36.899 [Spark Context Cleaner] INFO org.apache.spark.ContextCleaner - Cleaned accumulator 152 19:17:36.899 [Spark Context Cleaner] INFO org.apache.spark.ContextCleaner - Cleaned accumulator 130 19:17:36.899 [Spark Context Cleaner] INFO org.apache.spark.ContextCleaner - Cleaned accumulator 144 19:17:36.899 [Spark Context Cleaner] INFO org.apache.spark.ContextCleaner - Cleaned accumulator 142
org.apache.spark.ContextCleaner 클래스 API 설명
RDD, 셔플 및 브로드캐스트 상태를 위한 비동기식 클리너
관련 object가 응용 프로그램 범위를 벗어날대, 처리 될 각 RDD, shuffleDependency 및 관심이 있는 브로드 캐스트에 대한 약한 참조는 유지됩니다.실제로 처리는 별도의 데몬 스레드에서 수행됨.
https://spark.apache.org/docs/1.2.0/api/java/org/apache/spark/ContextCleaner.html
stackoverflow 답변 중
ContextCleaner는 드라이버에서 실행 된다. SparkContext가 시작될때 작성되고 즉시 시작된다. RDD, 셔플 및 브로드캐스트 상태, accumulate를 정리하는 컨텍스트 클리너 스레드(keepCleaning 메소드 사용). context-cleaner-periodic-gc는 JVM 가비지 콜렉터를 요청함.
'BackEnd > Spark' 카테고리의 다른 글
SparkSQL Casting 타입 변환, 오류 검출 (0) | 2020.03.11 |
---|---|
Spark SQL API (0) | 2020.03.09 |
SparkUI 에러 InjectionManagerFactory not found (0) | 2020.03.06 |
[Spark] RDD Persistence 와 Caching (0) | 2020.03.05 |
스파크 SQL 사용하여 파일로 보내기 (0) | 2020.03.02 |