반응형

약 60시간을 비상 전원 설비로 견딘 이시카 데이터 센터의 기적


출처 : 유튜브


정전 중에 약 60시간 비상 전원 설비로 버틴 이시카 데이터 센터. 도대체 어떻게 대단한지? 제대로 설명해 보려한다.

  2018년 9월 6일에 홋카이도를 강타한 지진에 의해 정전 상태에 빠진 사쿠라 인터넷 이시카 데이터 센터에 9월 8일 드디어 전력 공급이 재개되었다. 예상을 초과한 약 60시간 비상 전원 설비로 극복하여 인프라 사업자로서의 긍지를 보였던 이시카 데이터 센터의 '기적'에 대해 다시 한번 제대로 설명해 보고 싶다.

탁월한 운영 능력으로 예상치 못한 사태를 가정내로

2011년 11월에 개설된 이시카 데이터 센터는 다수의 서버를 수용하는 사쿠라 인터넷의 핵심 데이터 센터이다. 개설 당시에는 소셜 게임의 보급으로 서버의 수요가 급격하게 상승했고, 환경을 배려한 친환경적인 데이터 센터가 요구되고 있었다. 이러한 요구에 대응하기 위해 이시카 데이터 센터는 한랭지의 장점을 살린 외기 냉각과 도쿄돔 1개분에 상당하는 광대한 부지를 이용한 확장성으로 큰 주목을 받았다. 필자도 개설시 및 증설시에 2회 정도 현지에 가봤던 적이 있으며, 현지 엔지니어와도 가끔 이야기도 한다. 동일한 데이터 센터에 2번 방문하는 경우는 거의 없기 때문에 개인적으로도 애착이 깊다.

 생각해보면, 왜 이시카이었을까? 아이러니하게도 그 큰 요인은 재해 위험이 낮은 것이었다. 회사의 이시카 데이터 센터의 소개에도 "이시카 지역은 향후 30년간 진도 6이상의 지진이 발생할 확률이 0.1 ~ 3 %로 낮다(이하 생략)"라고 명기되어 있으며, 사쿠라 인터넷에게도 이번 지진은 "예상치 못한" 상황이었을 것이다. 그러나 이번에 사쿠라는 약 3000랙 이상의 거대한 데이터 센터를 비상 전원 설비로 60시간 무중단 운영을 계속했다. 탁월한 운영 능력으로 전대 미문의 정전을 극복했고 "예상치 못한"을 "가정내로" 바꿔 버린 것이다.

 

출처 : 유튜브


■ 관련 기사

 동일본대지진의 경우 수도권의 데이터 센터가 정전의 영향을 별로 받지 않았기 때문에 여기까지의 장시간 비상 전원 설비의 운용은 아마 처음이다. 세계적으로 봐도 별로 전례 없는 일이다. 게다가 도중에 전력이 일부 부활하여 연료 조달에 목표가 있는 것도 있고, 비상 전원 설비 정지 직전 1주일 가까이 연속 가동까지 염두에 두고 있었다. 살얼음을 밟기는 커녕 마지막까지 여력이 남아 있었던 셈이다.

사쿠라에게 절대 떨어 뜨릴 수 없었던 이시카 데이터 센터

우선 이야기의 전제로 데이터 센터의 정전 대책에 대해 간략하게 설명하고자 한다. 사실 9월 6일에 홋카이도의 지진이 발생하고 이시카 데이터 센터에 관해서는 경위에서 복구까지 3개의 글을 올리고 있는데, 모두 간단한 속보 체재. 상세한 설명을 생략하고 있었기 때문에 쓰는 사람으로도 얼마나 독자에게 전해졌는지 솔직히 불안했다. 게다가 IT에 대한 지식의 부족으로 인해 쓸데없이 불안을 부추기는 보도도 많다. 이것을 읽어보면, 이번에 사쿠라가 얼마나 대단했는지 신뢰성이라는 데이터 센터로써의 역할을 제대로 완수했는지 조금은 이해할 수 있을 것이다.

 개인 · 기업 불문하고 수많은 서버가 모이는 데이터 센터는 정전시의 대책으로 비상 전원 설비가 준비되어 있다. 따라서 전력 회사로부터 전력 공급이 중단되면 백업용 UPS로부터 비상 전원 설비의 시작까지의 시간을 확보하여 가스나 중유 등의 연료를 사용하여 자가발전하게 되어있다. 발전시에 사용되는 연료가 많은 데이터 센터에서는 48시간 정도의 연료가 비축되어 있기 때문에 정전이 일어나도 대개 이틀 정도 운용은 멈추지 않는다. 하지만 일련의 설비는 모두 비싸서 일본에서도 자기 부담으로 제대로 운용 할 수 있는 사업자는 그리 많지 않다. 사쿠라 인터넷은 이러한 소수 사업자 중 하나다.

 이시카 데이터 센터에서 48시간 가동할 수 있는 분의 중유를 비축했다. 그러나 이번 대규모 정전으로 복구는 당초 "1주일"이라고 발표했으며, 실제로 동일본 대지진 때는 정전 해소가 약 80%에 이르기까지 3일간, 94%에 이르기까지 8일간 걸렸다. 따라서 전력 공급이 재개되지 않고 중유가 부족하면, 이시카 데이터 센터 자체의 가동을 중단해야만 했다.

 만약 이시카 데이터 센터가 문을 닫게 되면 그 영향은 헤아릴 수 없다. 40만 이상에 달하는 사쿠라의 렌탈 서버의 사용자와 메루카리와 머니 포워드 같은 Web 서비스 사업자, 정부 및 교육 기관 등의 서비스도 큰 영향을 받게 된다. 또한 이시카 데이터 센터 특유의 사정으로 사용자 자신이 운용하는 공동 서비스도 나름대로 있다. 사쿠라 인터넷에 있어서는 절대 떨어 뜨릴 수 없는 데이터 센터인 것이다.

 비상 운용을 지원한 엔지니어, 사쿠라 팀 능력에 박수를

시설이 정지된 경우의 영향이 크고, 게다가 전원이 언제 재개 될지 모르는 절체절명의 상태 였지만, 사쿠라 인터넷은 훌륭하게 이 난관을 극복했다.

 정전 당초는 UPS의 장애로 인해 일부 서버에 장애가 발생했지만, 이것은 약 4시간에 해소하고 무사히 비상 전원 설비의 운용으로 전환했다. 그 후, 이시카 시청, 경제산업성 등 관계 기관으로부터 연료를 조달하여 비상 전원 설비로 약 60시간 동안 가동시켰다. 정전에도 불구하고 3000랙을 가진 거대한 데이터 센터를 2일 반 무중단 운영을 계속 한 것이다.

 또한 칭찬해야 하는 사람들도 있는데 바로 이시카 데이터 센터의 현장 엔지니어이다. 재해 대책 및 BCP라는 것은 어디 까지나 '계획'에 불과하며 실전 때 잘 작동하지 않았다는 예가 쏟아져 나오고 있다. 그런 점에서 사쿠라의 경우 평소의 훈련 및 유지 보수를 제대로 실시하여 관계 기관과 긴밀히 연계해 왔기 때문에 "홋카이도 전역에서 정전"이라는 미증유의 사태에도 대응할 수 있었던 셈이다. 압도적인 어둠에 가라 앉아 가족과 집이 걱정되는 불안감 속에서 "잘 노력했다"라고 현지 엔지니어에게 말을 걸어주고 싶다.

 그리고 그런 현지의 엔지니어들을 사쿠라 팀이 지원했다. 외부와 연계하여 연료를 조달하고, 고객과 파트너의 수많은 문의를 사사하고, 정확한 정보를 외부에 실시간으로 전송하는 등의 활동을 타임 라인에서 보면서 "절대로 데이터 센터를 포기하지 않을 것"이라고 생각했다. 물리적 인프라에서부터 클라우드 서비스까지 단숨에 통하는 본관으로부터 제공하는 사쿠라 인터넷의 강점이다. 이번 건은 풍부한 자금과 규모를 가진 메가 클라우드와는 다른 가치관을 제공하는 사쿠라 인터넷의 존재를 세상에 알리게 되어 사용자로부터 압도적인 신뢰를 받을 것이다.

반응형