전국 표본 조사: 인도가 데이터 수집 기술을 세계에 가르친 방법
인도 데이터는 코로나19 사망자에서 일자리에 이르기까지 다양한 주제에 대한 공식 수치가 독립적인 전문가에 의해 의문을 제기하면서 신뢰성 위기를 바라보고 있습니다. 그러나 얼마 전까지만 해도 이 나라는 데이터 수집 분야에서 세계 선두주자로 여겨졌다고 저자이자 역사가인 Nikhil Menon은 말합니다.
인도가 영국의 지배에서 독립한 직후, 인도는 중앙 집중식 5개년 계획을 통해 경제를 조직하기 위해 소련의 영감을 받았습니다. 이로 인해 정책 입안자들은 인도 경제에 대한 정확하고 세부적인 정보에 접근할 수 있어야 했습니다.
여기에서 인도는 문제에 직면했습니다. 첫 번째 수상인 Jawaharlal Nehru가 말했듯이 "우리는 데이터가 없습니다." 그 때문에 "우리는 대부분 어둠 속에서 활동합니다." 방대한 데이터 인프라를 구축하는 것은 불을 켜기 위한 것이었습니다.
도입된 변경 사항 중 가장 변혁적인 것은 1950년에 설립된 전국 표본 조사(National Sample Survey)일 것입니다. 이 조사는 시민의 경제 생활의 모든 측면에 대한 정보를 수집하는 일련의 대규모 전국 조사로 의도되었습니다.
그 이면의 아이디어는 전국의 모든 가구에서 통계를 수집하는 것이 불가능하거나 엄청나게 비쌀 것이기 때문에, 전체를 작은 부분에서 계산할 수 있도록 강력하고 대표적인 표본을 개발하는 것이 더 낫다는 것이었습니다.
1953년 힌두스탄 타임즈(Hindustan Times) 신문이 발표한 평가에 따르면, "세계 어느 나라에서든 가장 크고 가장 포괄적인 표본 조사"였습니다.
Nehru는 현재 인도 통계의 아버지라고 불리는 과학자 PC Mahalanobis와 그가 설립한 조직인 인도 통계 연구소(Indian Statistical Institute)에 설문 조사를 진행하는 책임을 넘겼습니다. 그들은 엄청난 도전에 직면했습니다. 전체 560,000개 중 1,833개 샘플 마을을 제대로 조사하기 위해 인원이 부족한 연구소에는 15개 언어와 140개 현지 측정 시스템을 함께 협상할 수 있는 조사관이 필요했습니다.
그의 일기에서 Mahalanobis는 모험가의 흥분과 함께 이 매우 복잡한 작업에 대해 썼습니다. Orissa에는 조사관이 무장 경비원과 함께 숲을 통과해야 하는 "야생 지역"이 있었습니다. 때때로 그들은 눈 덮인 높은 히말라야 고개를 건너야 했습니다.
그의 언어는 시대의 태도를 반영했습니다. 아삼에서 측량사는 "가장 문명화된 사람들"과 알려진 언어를 구사하지 못하는 "미개한 벌거벗은 부족들"을 만났습니다. 부족들은 "돈이 무엇을 의미하는지 알지 못한다"며 "경제 발전이라는 단어를 비웃는다"고 썼다. 다른 곳에서는 범죄자들이 전국 표본 조사 직원을 괴롭혔습니다. 지속적인 문제는 정글이었습니다. "야생 동물과 유행하는 열대성 질병이 있는 빽빽하고 난공불락의 숲". 일부 지역에서는 위험이 훨씬 더 심각했습니다. 조사관들은 "야수와 식인종이 들끓는" 숲을 통해 싸워야 한다고 불평했습니다.
그러나 설문 조사 결과는 인도인의 일상 생활에 대한 매우 세부적인 정보를 제공하여 특별했습니다. 예를 들어, 두 번째 설문조사는 정책입안자들에게 남쪽 Tamil Nadu 주의 외딴 마을에 살고 있는 Chidambaram Mudaly와 그의 아내, 세 딸, 시어머니가 버터 기름, 쌀, 밀에 지출한 금액을 정확히 말했습니다. , 소금, 차, 고추 및 기타 필수품. 이 가족의 재정 지출은 그 자체로는 중요하지 않았지만 수만 개의 다른 데이터 요소와 합산하면 경제 계획가와 정책 입안자가 경제를 근본적으로 다른 방식으로 이해할 수 있게 되었습니다.
그 이후로 전국 표본 조사(National Sample Survey)는 몇 가지 지표만 언급하면 빈곤, 고용, 소비 및 지출을 평가하는 데 도움이 되는 인도의 경제 생활에 대한 세부적인 세부 사항을 일관되게 산출했습니다.
또한, 글로벌 수준의 정책 결정에 기여했습니다. 그것이 개척한 방법은 현재 세계 은행과 유엔에서 사용하고 있습니다. 노벨상을 수상한 경제학자 앵거스 디튼(Angus Deaton)과 공저자인 발레리 코젤(Valerie Kozel)은 2005년에 "마할라노비스(Mahalanobis)와 인도가 주도한 곳을 나머지 세계가 따랐기 때문에 오늘날 대부분의 국가에서 최근 가계 소득 또는 지출 조사를 실시하고 있습니다."라고 썼습니다. "대부분의 국가는 통계적 능력에서 인도를 부러워할 수 밖에 없다"고 그들은 계속했습니다.
경제학자 TN Srinivasan, Rohini Somanathan, Pranab Bardhan 및 또 다른 노벨상 수상자 Abhijit Banerjee는 그 이후로 "개발도상국에서 완전히 자체 개발한 기관이 일반적인 관심 분야에서 세계적인 리더가 된 다른 사례는 없다"고 주장했습니다.
현대 인도의 데이터 용량의 증가는 수수께끼의 마할라노비스("교수"로 알려짐)의 이야기와 떼려야 뗄 수 없는 관계입니다. 마할라노비스가 1차 세계 대전 중 케임브리지에서 캘커타로 돌아올 때 배에서 우연히 통계 저널을 접하면서 시작된 일은 인도 독립 이후 10년 동안 인도의 데이터 인프라를 변화시키는 결과를 가져왔습니다.
인도 통계 연구소(Indian Statistical Institute)의 울창한 캘커타(Calcutta)(현재 콜카타(Kolkata)로 알려짐) 캠퍼스에 세계 최고의 통계학자와 경제학자들을 끌어들인 Mahalanobis는 이곳을 국제적 우수 기관으로 끌어올리는 데 일조했습니다. 그들은 함께 인도의 GDP 계산을 도왔고, 중앙 통계 기구(Central Statistical Organization)의 직원이 되었으며, 국가 표본 조사(National Sample Survey)를 설계했으며, 인도 최초의 디지털 컴퓨터를 도입했습니다. 그들이 구축한 제도적 건축물의 대부분은 오늘날에도 유지되며 인도는 Mahalanobis의 생일인 6월 29일을 "통계의 날"로 지정합니다.

그러나 오늘날 인도 데이터는 위기에 빠진 것 같습니다. 세계가 "빅 데이터"의 시대로 들어서면서 인도는 뒤처질 위험이 있습니다. 이코노미스트는 최근 국가의 "통계 기반 시설이 무너지고 있다"고 경고하면서 경보를 울렸다. 코로나19 사망률에서 교육, 빈곤에 이르는 문제에 대한 공식 수치는 모두 독립적인 관찰자와 전문가에 의해 점점 더 불신하며, 이는 정책 결정과 정부 책임에 놀라운 영향을 미칩니다.
이것을 특히 불행하게 만드는 것은 인도가 한때 이 분야의 선구자였다는 것입니다. 나라가 그 유산을 자랑스럽게 여기고 잃어버린 광채를 되찾는 것이 좋을 것입니다.