Netbackup status 0 : 성공
Netbackup status 1 : 부분성공
>>vault 돌릴때 duplication 작업이 1번으로 실패하면 vault가 306번 코드로 실패합니다. failed.list에서 실패한 이미지 찾아서 재수행 해줘야합니다.(백업서버 넷백업디렉터리/vault/sessions/vault명/sid**/logs 밑에 생성되는 파일)
=====================보통 여기까지 합격선 ==========================
일단 백업이 실패하면 재수행을 해보는게 좋음 . 그 당시에 네트웍 연결상태나, 백업 리소스 부족으로 인한 실패가 났을 경우가 있기 때문임. 정말로 문제가 있어서 아무리 재수행을 해도 안된다면 원인을 파악해서 해결해야함.
Netbackup status 6 : " the backup failed to back up the requested files"
– policy의 backup selection이 정확한지 확인이 필요합니다. 해당 file이 없는 경우 발생합니다.
>> 아닌것같음 이 경우 71번으로 떨어짐...;;
– DB agent의 경우 script 위치, 이름, 실행권한 등을 확인해야 합니다.
출처 : blog.boxcorea.com/wp/archives/230
넷백업 장애코드 스크랩
Status 6 – 원인 : The backup failed to back up the requested files – policy의 backup selection이 정확한지 확인이 필요합니다. 해당 file이 없는 경우 발생합니다. – DB agent의 경우 script 위치, 이름, 실행권한 등을
blog.boxcorea.com
그런데 넷백업 공식으로 올라와 있는 설명으로는, 클라이언트와 서버간 네트워크 소켓상태에 따른 오류라고 한다.
Status code 6 can be caused by socket failed errors during client to server and server to client communications. The server could not complete the connection to the client.
<넷백업 공홈 발췌>
저같은 경우, 재수행해서 성공시켰는데 , 해결방안을 아는분은 댓글로 알려주세요.
>> status 6 코드로는 일단 DB RMAN 백업 받을 때에만 발생했음.
RMAN 백업이 수행될 때 백업 리소스가 부족하지 않은지 점검해보는게 제일 현명한 조치, 메모리 부족이나 disk io 부하가 있을 때, 해당 에러코드를 발생시키고 실패하는 케이스 확인.(이런 케이스로 실패한 경우 백업 재수행시 정상수행됨)
비슷한 경우가 status12,13,14,42,174 등등... 에러 코드는 다양하지만 백업 실패 근본적인 원인이 리소스 부족일 수 있다는 것을 염두해주자.
Netbackup status 12
Snapshots are not getting cleaned up properly when a Flashbackup job fails. This will cause the snapcache to fill up and future Flashbackup jobs to fail with a Status 12 (file open failed). If a Flashbackup was successful, the snapshot is cleaned up normally.
플래시 백업 작업이 실패하면 스냅샷이 제대로 정리되지 않습니다. 이로 인해 스냅캐시가 가득 차고 이후 Flash백업 작업이 상태 12(파일 열기 실패)로 실패합니다. 플래시 백업이 성공하면 스냅샷이 정상적으로 정리됩니다.
>> 점검사항 : ps -ef | grep bpbkar >> 이거 수행시 실행중인 프로세스 있는지 확인
>> 점검사항 : cd /usr/openv/netbackup/bin/driver 후 ./snaplist 수행시 출력값 확인
위 두 점검사항 수행후 출력되는 값이 있으면 스냅샷이 제대로 정리되지 않아 스냅캐시가 가득 차있는 상태일 수 있으므로 bpclntcmd -clear_host_cache 명령어 수행(해당 클라이언트에서 수행중인 백업이 없을때!!)
Netbackup status 71
받을 데이터가 해당 경로에 없는 경우 발생한다. backup selection을 잘못 잡아줬거나, 특정날짜에 생기는 디렉터리를 미리 만들어 놓았는데 해당일에 생기지 않았을 때 생기는 에러이다. 만약 data stream을 사용해서 백업을 받는데, 특정 backup selection에서만 이 에러가 발생하면 해당 디렉터리가 생성되어 있는지 확인!! 전체 정책이 실패한게 아니라 하나의 stream만 실패한 경우는 해당건만 재수행 해줘도 된다.
Netbackup status 84~86
백업 미디어 관련에러코드입니다. PTL인 경우 문제가 생긴 미디어를 교체해준다거나 미디어 클리닝을 해주거나....하면 되지만... VTL인 경우가 진짜 노답입니다. 저희 사이트의 경우는 이 에러가 뜨면 VTL에서 write fail log만 뜨고 정확한 오류로그가 안남아서 원인을 못찾았었는데 실패 원인은 백업의 부하와 관련이 있습니다. 대량의 full백업을 집중된 시간에 받을때, 미디어 정보를 제대로 가져오지 못하고 media wirte error(84) / media read error(85) 번이 뜨면서 백업이 실패합니다. 특히 86번에러 media position error는 발생하면 해당 미디어를 frozen 시키는데.... 이거 괜히 그냥 unfreeze 하지 말고, 미디어가 백업 이미지가 남아있는 상태라면 suspend 걸어놓고 exfire 될때까지 기다려 주는게 좋습니다. 어짜피 풀어봐짜 또 86번에러 나오면서 freeze 시키기 때문.(suspend 상태에서도 복구는 가능함. exfire되면 자동으로 scratch(여유미디어pool)로 할당됨)
VTL에서 해당 에러 발생시 백업 정책을 분산시켜보는걸 권장드립니다!
참고용으로 다른 게시글에서 작성한 글도 올립니다
============================================================================
- 84 : media write error. 백업 쓰기 도중 I/O에러가 발생하여 실패한 경우 발생합니다. 미디어가 정상인지 확인 합니다. 시스템 로그를 살펴보아 드라이브가 정상인지 확인합니다. 적절한 시기에 클리닝을 하지 않은 경우 자주 발생하므로 주기적으로 클리닝을 시행합니다. /var, /tmp, NBU디렉토리가 full인지 확인하세요.
- 85 : media read error. 백업 읽기 도중 I/O에러가 발생하여 실패한 경우 발생합니다. 미디어가 정상인지 확인 합니다. 시스템 로그를 살펴보아 드라이브가 정상인지 확인합니다. 적절한 시기에 클리닝을 하지 않은 경우 자주 발생하므로 주기적으로 클리닝을 시행합니다.
- 86 : media position error. 백업 positioning 도중 I/O에러가 발생하여 실패한 경우 발생합니다. 미디어가 정상인지 확인 합니다. 시스템 로그를 살펴보아 드라이브가 정상인지 확인합니다. 이전 백업이 정상적으로 종료된 미디어인 지 확인합니다. 아닐경우 bpexpdate로 미디어를 clear시켜 줍니다. 백업 이미지가 있다면 bpmedia로 FROZEN 시킵니다.
출처 : https://m.cafe.daum.net/ciscokids/bfj/5?svc=cafeapi
============================================================================
Netbackup status 96
미디어를 할당해줄 수 없어서 발생하는 에러.
VTL미디어나 PTL미디어가 부족해서 발생하는 에러이다. 보통 미디어들은 백업 retention level에 따라 보관기간이 정해지고, 보관기간이 지나면(expired) clear되고 해당 드라이브는 scratch pool로 이동하여 새로 미디어를 할당해줘야 할때 가져가서쓰는데, 이 scratch pool에 여유 드라이브가 없어서 발생하는 것이다. 제일 좋은 해결방법은 VTL이든 PTL이든 미디어를 추가할당해줘서 개수를 늘리는 것이다.
(+)미디어가 충분할것 같은데 갑자기 이 에러가 난 경우가 있었는데, 백업에 문제가 생기면서 미디어들을 frozen상태로 만들어버려서 쓸수있는 미디어가 없어서 난 경우도 있었다. 이경우에는 frozen시키는 원인을 해결해주고 unfrezee해주면 된다.
Netbackup status 150
님이 백업 중지시켜서 난 에러코드....! 이걸 모르진 않겠지?? 님이 아니면 다른 운영자가 끊은거니까 확인해볼것!
Netbackup status 174
좀 답이없는 에러였다.... VM백업 받는 쪽에서 해당 에러가 계속 발생해서 한동안 재수행을 반복적으로 수행했다... 이상한건 특정 서버에서만 실패하는게 아니라 실패하는 서버가 매일 바뀌었고, 재수행을 해보면 성공할 때도 있고 실패할 때도 있었다..... 이 오류는 시간이 지나면서 그냥 해결되었는데 어떻게 해결해야 하는지는 잘 모르겠다....
Netbackup status 196
백업 대기시간 초과 에러이다. 백업 정책을 설정할때, 스케줄에서 백업 윈도우를 설정하는데, 이 시간은 백업이 시작을 대기하는 기간을 설정하는 것이다. 예를들어, start windows에서 full 백업을 토요일 12시~14시까지 할당해줬다면 해당 정책은 백업이 바로 할당되면 12시에 시작되고, 14시까지 대기했다가 그래도 할당받지 못하면 196번 에러를 발생시키며 백업이 실패한다.
이렇게 얘기하면 간단하게 백업 윈도우를 많이주면 이 에러가 안나겠네?라고 생각할수도 있는데 궁극적인 해결방법은 아니다...;;(주말동안에 full백업을 다 받아야 한다던지, 특정 시간동안 incre백업을 다 받아야 한다는 상황이면 대기시간만 늘린다고 해결불가)
보통 백업이 대기가 걸리는 것은 백업 드라이브 개수가 모자라서 기다렸다가 이전 작업이 끝나면 받기 때문인데, 그래서 가장 좋은 방법은 백업 드라이브를 추가해줘서 대기시간없이 바로바로 받을 수 있는 환경을 만들어주는 것이다. 하지만, 이것이 어려운 상황이면 백업 정책에서 data stream 개수를 줄여서 한 정책당 잡아먹는 드라이브 수를 줄이고, 스케줄을 분산시켜서 최대한 드라이브를 활용할 수 있도록 하는것이 좋다.
특정 미디어서버에서만 이 에러가 발생한다면 storage units에서 max current drivers 값을 늘려서 해결할 수도 있다.(이 경우는 드라이브는 많은데, 해당 서버에서 동시에 사용할 수 있는 드라이브 개수에 제한이 있는경우임.)
Netbackup status 306
vault백업 정책에서 발생하는 에러이며, 부분적으로 백업이 실패했을때 발생한다.
실패난 애들은 failed.list였나?? 백업서버 넷백업디렉터리/vault/sessions/vault명/sid**/logs 밑에 생성되는 파일로 확인할 수 있다.
실패 건수가 몇건 안될때는 넷백업 admin console(GUI)에서 >catalog에서 직접 찾아서 duplicate 작업을 걸어줘도 되지만 실패 건수가 많으면 dpduplicate 명령어를 써서 파일명을 failed.list 파일로 지정해서 한번에 작업을 걸어야한다.
Netbackup status 2505
백업 리소스 부족 문제로 실패한 경우인데, 저같은 경우 평일 incre 백업시에는 잘 돌다가 주말에 full 백업시에 간헐적으로 해당에러로 실패했습니다. 해당 문제는 미디어/마스터 서버에서 Semaphore 값을 설정해줘야 해결할 수 있습니다.(설정하고 넷백업 프로세스 재기동필요)
OS별 넷백업 Semaphore값 설정법은 아래 링크를 참고하세요(저도 이거보고 조치함)
https://www.veritas.com/support/en_US/article.100023842
'IT 관련자료 > 백업' 카테고리의 다른 글
chat gpt가 제시하는 넷백업 문제 해결법 (0) | 2023.03.22 |
---|