You are currently viewing 충돌한 볼륨의 디스크를 모두 교체하기

충돌한 볼륨의 디스크를 모두 교체하기

나스의 폴더가 늦게 열립니다.

DS918+ 나스가 매우 느립니다. 파일을 열거나 저장할 때 오래 걸리고 나스의 전원이 켜지는데도 5분 이상 걸립니다. 저장소 관리자에는 ‘스토리지 풀이 저하되었다’, ‘볼륨이 충돌한다’는 내용이 보입니다.

이런 증상이 발생하는 이유는 하드 디스크에 불량 섹터가 발생했기 때문입니다. 하드 디스크 4개를 SHR(RAID 5)로 사용하고 있는데요. 디스크 2개에서 불량 섹터가 발생했습니다. 드라이브 1은 1년 전부터 지금까지 계속해서 발생 해 왔고, 드라이브 4는 이틀 전부터 갑자기 발생하기 시작했습니다. 드라이브 4는 불량 섹터 증가 속도가 매우 빠르게 진행되더니 결국에는 볼륨 충돌이 발생했습니다.

볼륨이 충돌한 이후에도 다행히 공유 폴더의 파일을 읽을 수는 있습니다. 하지만 볼륨이 읽기전용으로 변경되어 쓰기(파일 생성, 수정, 삭제)는 불가능합니다. 즉시 나스의 데이터를 백업하고 디스크를 교체해야 합니다.

드라이브의 상태 정보
  1. 드라이브 1은 불량 섹터와 관련된 항목 세 가지 ‘드라이브 다시 연결 수’, ‘불량 섹터 수’, ‘드라이브 재식별 수’가 모두 정상 수치가 아닙니다.
  2. 드라이브 1의 월별 불량 섹터 발생 기록을 보면, 1년 전부터 불량 섹터가 발생했음을 알 수 있습니다. 
  3. 드라이브 4는 불량 섹터 수가 1200개가 넘습니다.
  4. 드라이브 4에서 불량 섹터가 감지된 시간을 저장소 관리자의 로그에서 확인 할 수 있습니다. 불량 섹터를 감지할 때 사용자는 나스의 응답이 느려지는 증상을 경험하게 됩니다.
수준		시간			이벤트
Error		2022/09/15 19:37:24 ①Storage Pool [1] was degrade [3/4], please repair it.
Error		2022/09/15 19:36:39 ③The RAID of Storage Pool 1 has been reassembled.
Information	2022/09/15 19:35:52 System started to boot up.
Error		2022/09/15 10:36:01 ②Storage Pool [1] was crashed.
Information	2022/09/15 10:22:00 System started to boot up.
Information	2022/09/15 10:15:04 Server started counting down to shutdown.
Information	2022/09/14 15:39:07 System successfully checked consistency of System Volume [Root].
Error		2022/09/14 15:30:43 ②Storage Pool [1] was crashed.
Warning		2022/09/14 15:03:43 System booted up from an improper shutdown.
Error		2022/09/14 14:51:51 ①Storage Pool [1] was degrade [3/4], please repair it.
Error		2022/09/14 14:38:38 ③The RAID of Storage Pool 1 has been reassembled.
Information	2022/09/14 14:31:59 System started to boot up.
Error		2022/09/14 11:09:49 ②Storage Pool [1] was crashed.
Information	2022/09/14 10:38:19 System started to boot up.
Information	2022/09/14 10:18:31 Server started counting down to shutdown.
Information	2022/09/13 21:28:19 Bad sector at md0 disk [4] sector 16864 has been corrected.
Error		2022/09/13 19:35:23 ②Storage Pool [1] was crashed.
Error		2022/09/13 19:26:16 ①Storage Pool [1] was degrade [3/4], please repair it.
Error		2022/09/13 19:18:54 Read error at internal disk [4] sector 2062304.
Information	2022/09/13 18:21:52 Bad sector at md2 disk [4] sector 10118768 has been corrected.
Information	2022/09/13 18:21:52 Bad sector at md2 disk [4] sector 10118776 has been corrected.
Information	2022/09/13 18:21:52 Bad sector at md2 disk [4] sector 10118784 has been corrected.
Information	2022/09/13 18:21:50 Bad sector at md2 disk [4] sector 10118760 has been corrected.
Error		2022/09/13 18:21:35 Read error at internal disk [4] sector 1990528.
Information	2022/09/13 18:21:08 Bad sector at md2 disk [4] sector 10110608 has been corrected.
Information	2022/09/13 18:21:08 Bad sector at md2 disk [4] sector 10110616 has been corrected.
Information	2022/09/13 18:21:08 Bad sector at md2 disk [4] sector 10110624 has been corrected.
Information	2022/09/13 18:21:05 Bad sector at md2 disk [4] sector 10110600 has been corrected.
Error		2022/09/13 18:20:57 Read error at internal disk [4] sector 1965984.
Information	2022/09/13 18:02:55 Bad sector at md2 disk [4] sector 10119216 has been corrected.
Information	2022/09/13 18:02:55 Bad sector at md2 disk [4] sector 10119224 has been corrected.
Information	2022/09/13 18:02:55 Bad sector at md2 disk [4] sector 10119232 has been corrected.
Information	2022/09/13 18:02:54 Bad sector at md2 disk [4] sector 10119208 has been corrected.
Error		2022/09/13 18:02:52 Read error at internal disk [4] sector 1991616.
Error		2022/09/13 17:57:32 Read error at internal disk [4] sector 1994720.
Error		2022/09/13 17:56:24 Read error at internal disk [4] sector 1991136.
Error		2022/09/13 17:56:19 Read error at internal disk [4] sector 1992672.
Error		2022/09/13 17:53:34 Read error at internal disk [4] sector 1992640.
Error		2022/09/13 17:50:24 Read error at internal disk [4] sector 1991136.
Error		2022/09/13 17:50:21 Read error at internal disk [4] sector 1991072.
Information	2022/09/13 17:45:55 Bad sector at md2 disk [4] sector 10110544 has been corrected.
Information	2022/09/13 17:45:55 Bad sector at md2 disk [4] sector 10110552 has been corrected.
Information	2022/09/13 17:45:55 Bad sector at md2 disk [4] sector 10110560 has been corrected.
Information	2022/09/13 17:45:51 Bad sector at md2 disk [4] sector 10110536 has been corrected.
Error		2022/09/13 17:45:45 Read error at internal disk [4] sector 1965536.
Error		2022/09/13 17:36:08 Read error at internal disk [4] sector 1994656.
Error		2022/09/13 17:36:08 Read error at internal disk [4] sector 1994720.
Error		2022/09/13 17:36:06 Read error at internal disk [4] sector 1994624.
Error		2022/09/13 17:35:35 Read error at internal disk [4] sector 1988480.
Error		2022/09/13 17:35:35 Read error at internal disk [4] sector 1964416.
Error		2022/09/13 17:35:28 Read error at internal disk [4] sector 1983456.
Error		2022/09/13 17:34:43 Read error at internal disk [4] sector 1731456.
  1. Storage Pool [1] was degrade [3/4], please repair it.
    스토리지 풀 저하를 감지한 기록입니다.

  2. Storage Pool [1] was crashed.
    볼륨 충돌을 감지한 기록입니다.

  3. The RAID of Storage Pool 1 has been reassembled.
    스토리지 풀을 복구(?)한 기록입니다. 나스를 재부팅하면 스토리지 풀이 자동으로 복구되서 볼륨이 읽기/쓰기로 정상적으로 작동하지만 이는 잠시뿐입니다.

소요시간 : 2일    어려움 : ★★★★

디스크를 교체하고 스토리지 풀과 볼륨을 새로 만듭니다.

RAID 5는 디스크 1개에 고장이 생긴 경우에는 나스를 계속 사용하면서 고장난 디스크를 교체할 수 있습니다. 하지만 지금처럼 2개 이상 고장이 생긴 경우에는 나스를 사용하면서 디스크를 교체할 수 없습니다. 업무에 불편이 생기더라도 나스 사용을 중단하고 디스크 교체작업을 진행해야 합니다. 데이터 백업 > 디스크 교체 및 볼륨 생성 > 데이터 복원의 순서로 진행하는데요. 데이터 백업 및 복원이 작업시간 대부분을 차지합니다. 데이터의 용량이 1.2TB 정도인데요. 디스크 교체작업을 완료하는데 이틀이 걸렸습니다.

지금은 3TB 디스크 4개로 RAID 5를 사용하고 있는데요. 앞으로는 4TB 디스크 3개로 RAID 1을 사용합니다. 4년 6개월 동안 생성된 데이터가 1.2TB 밖에 되지 않으므로 큰 용량의 볼륨이 필요하지 않습니다. 4TB 디스크면 1.2TB 데이터를 넣어도 이론적으로 9년 동안 사용할 수 있는 용량입니다. 디스크 고장으로 인해서 나스 사용이 중단되는 사태를 줄이기 위해서 2개가 아닌 3개의 디스크를 RAID 1으로 사용합니다.

남는 베이 1개는 현재 사용중인 3TB 디스크를 장착해서 하이퍼백업 대상(백업본이 저장되는 곳)으로 사용합니다.

디스크 교체작업 완료 후 모습

4TB 디스크 3개로 볼륨 1을 만들고 기존 데이터를 다시 복원했습니다. 3TB 디스크로 볼륨 2를 만들고 하이퍼 백업으로 백업을 완료했습니다.

  1. 데이터를 백업합니다.
  2. 디스크를 교체하고 DSM을 설치합니다.
  3. 스토리지 풀과 볼륨을 생성합니다.
  4. 백업한 데이터를 다시 복원합니다.
  5. 나스의 설정을 복원합니다.
A/B/C/cad_1.dwg
       32768   2%   62.38kB/s    0:00:23 (total: 99%)
     1502830 100%    2.67MB/s    0:00:00 (total: 99%) (xfer#323331, to-check=1/365089)
A/B/C/cad_2.dwg
       32768   0%   59.37kB/s    0:00:56 (total: 99%)
     3379040 100%    5.79MB/s    0:00:00 (total: 99%) (xfer#323332, to-check=0/365089)

Number of files: 365089
Number of files transferred: 323332
Total file size: 1234636544338 bytes
Total transferred file size: 1234636544338 bytes
Literal data: 1234636544338 bytes
Matched data: 0 bytes
File list size: 12959147
File list generation time: 0.001 seconds
File list transfer time: 0.000 seconds
Total bytes sent: 1234814022050
Total bytes received: 6675434

sent 1234814022050 bytes  received 6675434 bytes  88066233.82 bytes/sec
total size is 1234636544338  speedup is 1.00
rsync error: some files/attrs were not transferred (see previous errors) (code 23) at main.c(1355) [sender=3.0.9]

공유 폴더 동기화는 볼륨이 읽기전용 상태일 때는 사용할 수 없습니다. rsync 명령어를 직접 실행해서 다른 나스로 데이터를 백업합니다. 1.1TB 용량의 32만개 파일을 백업하는데 4시간 정도 소요되었습니다.

새로 만든 스토리지 풀

지금 사용중인 3TB 디스크 1개와 새로운 4TB 디스크 3개를 장착하고 나스의 전원을 켭니다. 4TB 디스크 3개를 사용해서 스토리지 풀을 생성하면 3TB 디스크에 설치되어 있는 DSM이 4TB 디스크에 그대로 복제됩니다.

이후에  백업한 데이터 복원, DSM 7로 업그레이드, 그 외 나스 설정을 마치면 디스크 교체하는 작업이 완료됩니다.

궁금하면 ↓↓↓↓

볼륨이 충돌하기 전과 후의 저장소 관리자의 모습입니다.

HDD/SSD 화면

드라이브 4의 불량 섹터를 감지하기 전에는 할당 상태가 “정상“으로 나옵니다. 디스크 3개(드라이브 2, 드라이브 3, 드라이브 4)로 RAID 5가 유지되고 있는 상태입니다. 이때는 볼륨이 읽기/쓰기로 정상적으로 작동합니다.

드라이브 4의  불량 섹터를 감지하게 되면 할당 상태가 “충돌함“으로 변경됩니다. 이때도 디스크 3개(드라이브 2, 드라이브 3, 드라이브 4)로 RAID 5가 유지되지만 볼륨이 읽기전용으로 변경됩니다.

개요 화면

드라이브 4의 불량 섹터를 감지하기 전에는 “주의” 문구와 스토리지 풀의 성능이 “저하” 되었다고 나옵니다.

드라이브 4의 불량 섹터를 감지하게 되면 “위험” 문구와 스토리지 풀이 “손상” 되었다고 나옵니다.

볼륨 화면

드라이브 4의 불량 섹터를 감지하기 전에는 “문제 발생” 문구와 “연결된 스토리지 풀이 저하되었습니다.“라고 나옵니다.

드라이브 4의 불량 섹터를 감지하게 되면 “충돌함” 문구와 “이 볼륨을 사용할 수 없습니다.‘라고 나옵니다.

스토리지 풀 화면

드라이브 4의 불량 섹터를 감지하기 전에는 “문제  발생” 문구와 “스토리지 풀이 저하되었습니다.‘라고 나옵니다.

드라이브 4의 불량 섹터를 감지하게 되면 “충돌함” 문구와 “스토리지 풀을 사용할 수 없습니다.‘라고 나옵니다.

답글 남기기