Greenplum

Greenplum - Backup and Recovery

n.han 2019. 12. 13. 12:13

- Backup and Recovery

MPP 특성에 맞게, Backup도 Master들과 Segment들 각각 해주어야 한다. GP V5 이상부터는 gpbackup과 gprestore를 권장한다. gpbackup을 하게 되면 Master에 있는 각 데이터 Segment들의 catalog 정보를 backup하고, 이후 Segment들의 데이터가 backup된다. Master는 $MASTER_DATA_DIRECTORY/db_dumps/YYYYMMDD/ 폴더에, Segment는 /data#/primary/gpseg##/db_dumps/YYYYMMDD/ 폴더에 backup 파일들이 생기게 된다. gpdbrestore후에 통계정보를 업데이트하기 위해 Analyze를 실행하는 것을 권장한다.
PostgreSQL에서도 제공하는 pg_dump와 같은 backup 명령어가 있다. 다만 Master로 Segment의 데이터들이 모아져서 backup 되기 때문에 비효율적이다.

TODO

  1. 쿼리 실행 되는 이력 테이블化: $MASTER_DATA_DIRECTORY\pg_log 폴더 안에 실행된 쿼리 목록을 포함한 로그들이 쌓인다. 이 파일을 파싱해서 테이블화할 수 있다. 아래와 같이 grep을 pipe로 연결하여 로그 파일을 파싱할 수 있다.
    grep 쿼리실행계정 로그파일 | grep 'statement'
  2. 주기적인 Bakcup
  3. Resource Group
  4. gpfdist
  5. catalog 테이블 daily vacuum analyze (vacuum full은 exclusive lock을 걸기 때문에 절대 X)

'Greenplum' 카테고리의 다른 글

Greenplum - Data manipulations  (0) 2019.12.13
Greenplum - Loading Data  (0) 2019.12.13
Greenplum - DDL  (0) 2019.12.13
Greenplum - Fundamental Concepts  (1) 2019.12.10