Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Vue.js
- JavaScript
- spring boot
- 모의SW역량테스트
- 코테
- hash table
- SWEA
- aws
- BFS
- Data Structure
- 알고리듬
- Algorithm
- Priority Queue
- gpdb
- SQL
- GitHub
- 코딩테스트
- DFS
- boj
- CSV
- programmers
- 구현
- Back tracking
- Bruth Force
- Python
- Linked list
- 시뮬레이션
- django
- 알고리즘
- Trie
Archives
- Today
- Total
hotamul의 개발 이야기
[GPDB] Exteranl Table/COPY error 확인 방법 본문
아래와 같은 External Table을 define 하거나 COPY
operation을 실행할 때 발생한 에러를 확인하려면 gp_read_error_log
함수를 이용해 table 형태로 에러가 발생한 각각의 row에 대해 확인할 수 있어요. (Viewing Bad Rows in the Error Log)
-- create external table example
CREATE EXTERNAL TABLE ext_expenses ( name text,
date date, amount float4, category text, desc1 text )
LOCATION ('gpfdist://etlhost-1:8081/*',
'gpfdist://etlhost-2:8082/*')
FORMAT 'TEXT' (DELIMITER '|')
LOG ERRORS SEGMENT REJECT LIMIT 10
ROWS;
SEGMENT REJECT LIMIT 10
은 전체 에러가 10개가 아닌 모든 greenplum segment instance가 10개 이상의 에러가 발생하면 실행하면 reject 된다는 의미에요. gpfdist
는 greenplum의 병렬 ETL utility에요. gpfdist
를 이용하면 greenplum의 아키텍처적인 장점을 이용해서 대용량 데이터 ETL을 빠르게 처리할 수 있어요👍!
-- use build-in sql function to read the error log data
SELECT gp_read_error_log('ext_expenses')
-- copy example
COPY country FROM '/data/gpdb/country_data'
WITH DELIMITER '|' LOG ERRORS
SEGMENT REJECT LIMIT 10 ROWS;
-- use build-in sql function to read the error log data
SELECT gp_read_error_log('country')
해당 에러를 삭제하려면 gp_truncate_error_log
를 사용하면 되요!
-- use build-in sql function to delete the error log data
SELECT gp_truncate_error_log('ext_expenses');
SELECT gp_truncate_error_log('country');
아래와 같이 실패한 항목들의 rawdata
도 확인해서 따로 파일로 저장해둘 수 있어요!
COPY (SELECT rawdata FROM gp_read_error_log('ext_expenses'))
TO '/home/gpadmin/data/f_otp_load.bad' ;
'Dev. > Greenplum DB' 카테고리의 다른 글
[GPDB] 마지막 Vacuum, analyze 작업 시간 확인 (0) | 2022.12.16 |
---|---|
[GPDB] Query Profiling (Visualization) (0) | 2022.12.16 |
[GPDB] delete 할 때 deleted rows 데이터 확인하기 (0) | 2022.12.15 |
[GPDB] check distributed key about all tables (0) | 2022.12.14 |
[GPDB] Greenplum Command Center 실행 (1) | 2022.12.14 |
Comments