You are currently viewing 레이드 1 디스크 교체하기

레이드 1 디스크 교체하기

4TB에서 8TB로 교체하고 싶어요.

스토리지 풀을 두 개 사용하고 있습니다. 4TB 하드디스크를 세 개 장착해서 두 개는 스토리지 풀 1에 사용하고, 나머지 하나는 스토리지 풀 2에 사용하고 있습니다. RAID 유형은 스토리지 풀 1은 RAID 1, 스토리지 풀 2는 기본입니다.

스토리지 풀 1은 디스크 중 하나가 고장나서 스토리지 풀 저하가 발생했습니다. 고장난 디스크를 동일한 용량인 4TB 디스크로 교체하려고 합니다.

스토리지 풀 2는 4TB 디스크를 8TB 디스크 두개로 교체해서 용량을 확장하고 또한 레이드 1으로 변경할 계획입니다.

저장소 관리자 개요
개요 화면에서 빨간색이 보이면 뭔가 잘못되었음을 의미합니다. 원인을 찾고 해결하려면 제일 먼저 볼륨 - 스토리지 풀 - 디스크의 상관관계를 파악해야 합니다. 볼륨, 스토리지 풀, HDD/SSD 화면에서 제공하는 정보를 바탕으로 셋의 상관관계를 알 수 있습니다.
볼륨

‘볼륨’ 화면에서는 볼륨을 어느 스토리지 풀에 만들었는지 확인합니다. 볼륨 1은 스토리지 풀 1에, 볼륨 2는 스토리지 풀 2에 만든 것을 알 수 있습니다.

스토리지 풀 1

‘스토리지 풀’ 화면에서는 스토리지 풀의 RAID 유형과 스토리지 풀을 만드는데 사용한 디스크를 확인합니다.

스토리지 풀 1은 RAID 1을 사용하고 있습니다. RAID 1은 최소한 두 개의 디스크가 필요한데요. 스토리지 풀 1에 속해 있는 디스크가 한 개(드라이브 2) 밖에 보이지 않습니다. 이 때문에 ‘스토리지 풀이 저하되었습니다.‘ 메시지가 나오는 것입니다. 누락된 디스크(4TB) 이상의 용량을 갖는 디스크를 추가하는 조치가 필요합니다.

스토리지 풀 2

스토리지 풀 2는 RAID 유형이 기본입니다. 스토리지 풀 2는 디스크 한 개(드라이브 3)만 사용해서 만들었습니다. 이 디스크의 할당 상태가 ‘시스템 파티션 실패 함‘입니다. 이는 이 디스크에 설치한 DSM을 사용하지 못한다는 의미입니다. 디스크에 DSM을 다시 설치하는 조치가 필요합니다.

HDD/SSD

‘HDD/SSD’ 화면에서는 스토리지 풀, 할당 상태, 상태를 확인해야 합니다. 각 항목의 의미는 시놀로지 도움말에 설명되어 있습니다.

스토리지 풀은 ‘이 디스크가 어느 스토리지 풀에 사용되었는가’를 의미합니다. 할당 상태는 ‘이 디스크가 제 역할을 잘 수행하고 있는가’를 의미합니다. 상태는 ‘이 디스크가 고장나지 않고 잘 작동하고 있는가’를 의미합니다.

디스크 1은 스토리지 풀에 사용되지 않고, DSM도 설치하지 않았습니다. 디스크는 고장나지 않았습니다.

디스크 2는 스토리지 풀 1에 사용됐고, 스토리지 풀의 역할과 DSM 운영하는 역할을 모두 잘 수행하고 있습니다. 디스크는 고장나지 않았습니다.

디스크 3은 스토리지 풀 2에 사용됐고, 스토리지 풀의 역할은 잘 수행하고 있지만 DSM 운영하는 역할은 수행하지 않고 있습니다. 디스크는 고장나지 않았습니다.

디스크 4는 스토리지 풀에 사용되지 않고, DSM 운영하는 역할도 수행하지 않고 있습니다. 디스크에 고장이 생겼습니다. 고장 정도는 ‘경고’ 단계입니다. 불량 섹터 수가 28,312개 발견되었습니다.

디스크 상태 정보

디스크 고장 여부는 디스크 상태 정보에서 더욱 자세히 확인 할 수 있습니다.

이런 정보를 종합하면 볼륨 – 스토리지 풀 – 디스크의 관계를 다음과 같이 유추할 수 있습니다.

디스크 1은 전원 켜기 시간(Power On Hours, 사용 시간)이 320시간 밖에 되지 않습니다. 디스크 1의 할당 상태가 ‘초기화 되지 않음’인 것을 고려하면 이 디스크는 13일 전에 장착해 놓고 전혀 사용하지 않았다는 것을 알 수 있습니다. 사용자에게 물어보니 “나스에 발생한 문제를 스스로 해결해 보려고 새 하드디스크를 비어 있는 베이에 장착 했으나 그 후에는 어떻게 하는지 몰라서 그냥 놔두었다”라고 하였습니다.

디스크 3은 전원 켜기 시간이 5,400시간으로 디스크 2, 디스크 4보다 12,000시간 정도 적습니다. 디스크 3이 디스크 2, 디스크 4와 다른 스토리지 풀에 사용되는 것을 보면 이 나스는 처음에 디스크 두 개만 장착하고 스토리지 풀 1(볼륨 1)만 사용했습니다. 그러다가 시간이 지나서 디스크 한 개를 추가로 장착하고 스토리지 풀 2(볼륨 2)도 생성했을 것으로 추측이 됩니다.

디스크 4는 전원 켜기 시간이 17,500시간으로 디스크 2와 비슷합니다. 디스크 2가 스토리지 풀 1에 사용되었고 스토리지 풀 1이 RAID 1 방식이지만 누락된 디스크가 있다는 점은, 디스크 4가 스토리지 풀 1에서 떨어져 나왔음을 알려줍니다. 또한 불량 섹터 수가 28,300이나 되는 점은 지속적으로 발생하는 불량 섹터 때문에 디스크 4가 스토리지 풀 1에서 제거 되었을 거라고 추측하게 해 줍니다.

/proc/mdstat, mdadm, smartctl

지금까지 살펴본 내용(저장소 관리자에서 제공하는 정보)은 mdadm, smartctl, lvm, mount 명령어를 사용해서도 확인이 가능합니다.

소요시간 : 4일
어려움 :
3/5

4TB 디스크 한 개, 8TB 디스크 두 개를 준비합니다.

스토리지 풀 1은 ‘수리’를 하고, 스토리지 풀 2는 ‘RAID 유형 변경’과 ‘수리’를 합니다. 장착만 해 놓고 사용하지 않은 1번 디스크를 사용해서 스토리지 풀 1을 수리합니다. 4번 디스크를 8TB로 교체 후 ‘RAID 유형 변경’을 하고, 3번 디스크를 8TB로 교체 후 ‘수리’를 합니다. ‘빠른 복구’ 기능을 사용하기 위해서 우선 DSM을 7으로 업데이트 합니다.

  1. 스토리지 풀 1 / 수리 / 1번 디스크(4TB), 2번 디스크(4TB) 사용
  2. 스토리지 풀 2 / RAID 유형 변경 / 3번 디스크(4TB), 4번 디스크(8TB) 사용
  3. 스토리지 풀 2 / 수리 / 3번 디스크(8TB), 4번 디스크(8TB) 사용
DSM 7 업데이트 완료

DSM 7에는 ‘빠른 복구’ 기능이 생겼습니다. 빠른 복구를 사용하면 배드섹터도 인해서 복구 작업이 중단되는 일도 덜 발생할 것으로 생각됩니다.

스토리지 풀 1을 수리합니다.

스토리지 풀 1 … > 수리 > 드라이브 1 선택 > 다음 > 적용

Tue May 17 19:59:14 KST 2022
[>....................] recovery = 1.9% (76434816/3902196544) finish=443.6min speed=143732K/sec
Tue May 17 20:19:14 KST 2022
[=>...................] recovery = 6.9% (272659520/3902196544) finish=390.7min speed=154830K/sec
Tue May 17 20:39:14 KST 2022
[==>..................] recovery = 11.8% (461695104/3902196544) finish=360.9min speed=158864K/sec
Tue May 17 20:59:14 KST 2022
[====>................] recovery = 21.1% (824846016/3902196544) finish=348.6min speed=147094K/sec
Tue May 17 21:19:14 KST 2022
[======>..............] recovery = 31.8% (1243370816/3902196544) finish=290.3min speed=152596K/sec
Tue May 17 21:39:14 KST 2022
[=========>...........] recovery = 48.5% (1894989312/3902196544) finish=221.9min speed=150734K/sec
Tue May 17 21:59:14 KST 2022
[============>........] recovery = 64.6% (2521461824/3902196544) finish=161.6min speed=142356K/sec
Tue May 17 22:19:14 KST 2022
[==================>..] recovery = 91.2% (3562568704/3902196544) finish=52.2min speed=108345K/sec

스토리지 풀 1 복구에 소요된 시간은 2시간 30분 정도입니다. 이는 DSM 7부터 도입된 빠른 복구 기능 때문입니다. 복구 진행 정도를 20분 간격으로 확인해 봤는데요. 남은 시간이 줄어드는 정도가 20분이 아니라 10~70분인 것을 알 수 있습니다. 시간이 급격하게 줄어드는 이유는 사용하지 않은 디스크 영역은 복제하지 않기 때문입니다.

빠른 복구 기능을 사용하지 않을 때는 RAID 1 4TB 디스크를 수리하는데 최소한  7시간 10분이 소요됩니다. 복구에 소요된 시간 2시30분은 볼륨 사용량 33%와 비슷한 비율인거 같습니다.

스토리지 풀 2의 유형을 기본에서 RAID 1으로 변경합니다.

스토리지 풀 2 … > RAID 유형 변경 > RAID 1 선택 > 드라이브 4 선택 > 적용

 4TB 디스크와 8TB 디스크를 RAID 1으로 사용할 경우에는 실제로 사용 가능한 용량이 4TB 밖에 되지 않습니다. 3번 디스크도 8TB로 교체하면 그제야 볼륨의 용량이 8TB로 확장됩니다.

최종 모습

3번 디스크까지 8TB로 교체한 이후의 모습입니다.

수준로그시간사용자이벤트
Information시스템2022/05/20 01:52:56admin System successfully repaired [Storage Pool 2] with drive [Drive 3].
Information시스템2022/05/20 01:52:54SYSTEM System successfully optimized [Storage Pool 2].
Information시스템2022/05/19 13:37:13admin System started to repair [Storage Pool 2] with [Drive 3].
Error시스템2022/05/19 13:33:48SYSTEM Storage Pool [2] degraded [1/2 of drives remaining]. Please repair it.
Information시스템2022/05/19 13:33:44admin Drive (SN:Z*****YJ) has been deactivated.
Information시스템2022/05/18 19:49:58admin System successfully change [Storage Pool 2] device type to [RAID 1] with drive [Drive 4].
Information시스템2022/05/18 10:53:05admin System starts to change [Storage Pool 2] device type to [RAID 1] with drive [Drive 4].
Information시스템2022/05/17 22:23:18admin System successfully repaired [Storage Pool 1] with drive [Drive 1].
Information시스템2022/05/17 19:49:42admin System started to perform Fast Repair on [Storage Pool 1] with [Drive 1].
Information네트워크 백업2022/05/17 19:45:48SYSTEM Shared Folder Sync finished to sync task [Folder Sync 1] to [169.254.144.53].
Information네트워크 백업2022/05/17 19:45:35SYSTEM Shared Folder Sync started to sync task [Folder Sync 1] to [169.254.144.53].
Information시스템2022/05/17 19:33:30SYSTEM System started to boot up.
Information시스템2022/05/17 19:28:41admin System started counting down to reboot.
Information시스템2022/05/17 19:28:38admin Update was complete.
Information네트워크 백업2022/05/17 18:53:56SYSTEM Shared Folder Sync finished to sync task [Folder Sync 1] to [169.254.144.53].
Information네트워크 백업2022/05/17 18:44:04SYSTEM Shared Folder Sync started to sync task [Folder Sync 1] to [169.254.144.53].
Information네트워크 백업2022/05/17 02:10:59SYSTEM Shared Folder Sync finished to sync task [Folder Sync 1] to [169.254.144.53].
Information네트워크 백업2022/05/16 14:35:01SYSTEM Shared Folder Sync started to sync task [Folder Sync 1] to [169.254.144.53].

지금까지의 과정이 로그 센터에 기록되어 있습니다.

  1. 디스크 교체 작업 중 문제가 생길 경우를 대비하여 나스의 데이터를 다른 나스에 백업한 기록입니다.
  2. DSM 7을 설치한 기록입니다.
  3. 스토리지 풀 1을 수리한 기록입니다.
  4. 스토리지 풀 2의 레이드 유형을 변경한 기록입니다.
  5. 스토리지 풀 2를 수리한 기록입니다.
참고

답글 남기기