본문 바로가기
소식/해외

WhatsApp에서 Greggs까지 - 기술이 더 많이 저하되는 이유는 무엇입니까?

by Healing JoAn 2024. 4. 21.

영국에서 가장 인기 있는 소시지 롤 제조업체인 Greggs와 기술 거물인 Apple 및 Meta는 어떻게 연결됩니까?

2024년 3월과 4월에는 모든 고객이 IT 중단으로 인해 베이킹 부터 빅맥, WhatsApp 메시지까지 일부 서비스에 액세스하는 데 어려움을 겪었습니다 .

우연의 일치? 이러한 중단이 실제로 더 자주 발생하고 있다고 전문가들은 말합니다.

이러한 최근의 세간의 이목을 끄는 사례로 인해 한 특정 웹사이트가 주목을 받았습니다.

DownDetector는 웹 중단을 모니터링하는 플랫폼입니다. 해당 데이터는 기업이 최근 직면하고 있는 문제의 정도에 대한 아이디어를 제공합니다.

사이트에 따르면 4월 3일 전세계적으로 175만 개 이상의 사용자 보고 문제가 WhatsApp에 표시되었습니다.

App Store와 Apple TV에서도 수만 건이 보고되었다고 합니다.

그러나 DownDetector의 모회사인 Ookla의 기술 부사장인 Brennen Smith는 이러한 사례가 그들이 보고 있는 것을 반영한다고 말합니다. 즉, 더 많은 정전이 발생하고 발생 시 사용자로부터 더 많은 보고가 발생한다는 것입니다.

그는  "인터넷이 점점 더 안정되고 있는 것은 아니다"라고 말했다.

그 이유를 이해하려면 인터넷 자체에 대해 조금 더 이해해야 합니다.

소프트웨어와 마찬가지로 여러 계층으로 구성됩니다. 규제 기관이 플랫폼 변경을 요구할 때마다 소비자는 데이터에 대한 원활한 액세스를 원하고 투자자는 AI 챗봇과 같은 새로운 기능을 요구할 때마다 새로운 계층이 추가됩니다.

더 많은 레이어와 복잡성을 도입하면 문제가 발생할 위험이 더 커집니다.

Smith 씨는 "지금 이 거대 기업들은 획기적인 신기술을 제품과 서비스에 통합하려는 노력을 기울이고 있습니다."라고 말했습니다.

"지금 혁신을 추진하면서 기술 기업이 더 빠르게 움직이는 것을 보게 될 것입니다. 그러나 이는 잠재적으로 문제를 일으킬 위험이 있습니다."

게티 이미지

움직이는 부품과 우레 같은 무리

인터넷과 관련하여 염두에 두어야 할 또 다른 사항은 인터넷을 넘어지게 만드는 다양한 요인이 있다는 것입니다. 코드 오타, 하드웨어 결함, 정전 및 사이버 공격은 서비스가 중단될 수 있는 이유를 보여주는 몇 가지 예일 뿐입니다.

폭염 , 폭풍, 자연 재해 와 같은 악천후도 데이터 센터, 즉 온라인 서비스의 기반이 되는 서버라고 알려진 강력한 컴퓨터를 수용하는 거대한 홀에 영향을 미칠 수 있습니다.

사이버 보안 회사 NetSPI의 Sam Kirkman은 "움직이는 부분이 많이 있는데 그 중 하나만이라도 잘못되면 문제가 발생할 수 있습니다"라고 말합니다.

또 다른 문제는 많은 기업이 지난 10년 동안 서버와 인프라를 사내에서 관리하는 것에서 클라우드로 전환했다는 것입니다.

Kirkman 씨는  이러한 기업이 "이전보다 더 빠르게" 더 많은 작업을 수행할 수 있게 되었다고 BBC에 말했습니다. 그러나 이는 클라우드 서비스 제공업체의 한 곳에서 단 한 번의 중단이 발생하더라도 "많은 플랫폼, 기술 및 오늘날 우리가 사용하는 회사"입니다.

Amazon Web Services(AWS), Microsoft Azure, Google Cloud 등 업계에서 가장 큰 기업 중 일부의 결함으로 인해 이전에는 수천 명의 고객이 다운타임을 겪었습니다.

Fastly 및 Cloudflare와 같이 규모는 작지만 의존도가 높은 제공업체에도 영향을 미치는 서비스에도 연쇄 효과가 있었습니다.

영국 정부의 포털 gov.uk는 2021년 6월 Fastly에 문제가 발생했을 때 오프라인이 중단된 주요 플랫폼 중 하나였습니다 .

서비스에 대한 수요가 갑자기 급증하면 특히 블랙 프라이데이와 같이 트래픽이 많은 이벤트나 공휴일이나 주말과 같이 직원이 적은 기간에 장기간 또는 복잡한 중단이 발생할 수 있습니다.

금요일이 다른 요일보다 정전이 더 많다는 이론은 단지 추측에 불과할 수도 있다고 Smith씨는 말합니다.

그러나 그는 많은 기업이 업데이트나 변경 사항을 제공하지 않는 정책을 갖고 있다고 지적합니다.

"키보드를 다루는 사람이 적고, 모니터링 시스템에 눈을 두는 사람이 적습니다. 지금은 변경 사항을 적용하고 싶지 않은 시기입니다."라고 그는 말합니다.

Nationwide, McDonald's  Sainsbury's 에 영향을 미치는 IT 결함은 모두 3월 금요일에 발생했거나 시작되었지만 원인은 서로 다릅니다.

더 광범위하게는, 문제를 패치하고 정전 중에 서비스를 다시 온라인으로 전환하려는 엔지니어도 이를 확보하려는 수많은 사용자와 씨름하게 될 수도 있습니다.

Cloudflare는 2023년 11월 데이터 센터 정전으로 인한 가동 중단 중에 수많은 요청이 처음에 복구 사이트를 압도했을 때 이른바 '천둥 떼' 중 하나를 만났다고 말했습니다 .

'기술적 부채'

이 모든 것을 뒷받침하는 것은 온라인 세계의 또 다른 근본적인 진실입니다. 제공되는 서비스와 제품은 점점 더 정교해지고 있지만 기본 아키텍처는 종종 상당히 구식입니다.

즉, 현대 인터넷은 "아주 오래된 기술의 구조"에 의존하고 있다고 Kirkman은 말합니다.

그는 트래픽이 어디로 가는지 결정하는 데 인터넷에서 가장 중요한 것 중 하나인 BGP(Border Gateway Protocol)를 2021년 10월 Meta의 6시간 중단 사례 에서 보여주는 좋은 예로 강조합니다 .

Facebook의 잘못 구성된 BGP 업데이트는 본질적으로 나머지 인터넷과의 통신을 중단했음을 의미합니다.

또한 해당 플랫폼 사용자는 가족과 소통하거나 비즈니스를 관리할 수 없게 되었습니다 .

AFP/게티 이미지

Kirkman은 BGP가 유지 관리되어야 하지만 쉽게 업데이트될 수 없고 사소한 구성이 전체 플랫폼을 중단시킬 수 있기 때문에 지속적인 과제를 나타낸다고 말했습니다.

이는 일부 사람들이 "기술적 부채"를 인터넷 전체에 잠재적으로 영향을 미칠 수 있는 문제로 간주할 수 있다는 점을 강조합니다.

이러한 문제는 새로운 것이 아닙니다. 그러나 온라인 서비스에 대한 의존도가 높아짐에 따라 온라인 서비스를 방지하려는 기업에게는 점점 더 큰 과제가 되고 있습니다.

"우리가 실제로 보고 있는 것은 사람들이 점점 더 관심을 갖고 있다는 것입니다."라고 Smith 씨는 말합니다.

"지금은 그 어느 때보다 서비스가 온라인 상태를 유지하면서 새로운 혁신과 기능을 시장에 선보일 수 있도록 탄력성을 유지하는 것이 정말 중요하다고 말하고 싶습니다."라고 그는 덧붙입니다.

댓글