Статья

Большие данные в госсекторе: опыт Пакистана

Цифровизация Big Data ИТ в госсекторе
мобильная версия

Создание в Пакистане одной из крупнейших в мире базы мульти-биометрических данных граждан NADRA стало одним из самых успешных в стране проектов, реализованных по модели государственно-частного партнерства. Сегодня с ее помощью в стране организована работа служб социальной поддержки, борьбы с терроризмом, налогового и пограничного контроля и других государственных ведомств.

О том, что технологии способны изменить мир, говорится и пишется уже давно. И речь идет не только о кажущихся пока фантастичными проектах, которым посвящены многочисленные голливудские блокбастеры. Влияние технологий на нашу жизнь сегодня может ощутить каждый. Водители становятся значительно дисциплинированнее на дороге, если знают, что на ней установлены системы видеофиксации нарушений, грабители обходят стороной места, оснащенные современными охранными системами, коммунальщики лучше убирают дворы, в которых имеются видеокамеры.

Масштабные решения государственного уровня позволяют идентифицировать гражданина и получить о нем самую подробную информацию: платит ли он налоги, нарушает ли законы, состоит ли в браке, владеет ли имуществом и др. А набирающие сегодня все большую популярность технологии больших данных открывают и вовсе бескрайние возможности – теперь можно не только собирать, но и анализировать огромные объемы разнородной информации.

Пытаясь отыскать примеры использования государством больших данных, мы чаще всего обращаемся к опыту так называемых «развитых стран», предполагая, что только им сегодня доступны подобные дорогостоящие решения. Однако, волею судеб в числе лидеров в этой области оказался Пакистан – государство, занимающее 44 место в мире по объему ВВП.

Опыт Пакистана

Создание одной из крупнейших в мире базы мульти-биометрических данных граждан NADRA (National Database & Registration Authority) началось в Пакистане по инициативе Беназир Бхутто (Benazir Bhutto). Именно она была заинтересована в том, чтобы в стране появились технологии, способствующие укреплению демократии, помогающие бороться с коррупцией, терроризмом и стихийными бедствиями, эффективно проводить реформы.

Уже после трагической гибели Беназир Бхутто проживавший тогда в США Тарик Малик, занимающий сегодня должность старшего консультанта по государственному сектору корпорации Teradata, приехал в Пакистан для того, чтобы претворить в жизнь намеченное. Через некоторое время он возглавил Национальное агентство по управлению базами данных и регистрациями граждан Пакистана (National Database & Registration Authority (NADRA). На тот момент в стране уже существовала национальная система учета удостоверений личности, однако данные в нее заносились на основании бумажных анкет. «В 1971 г. после разделения Бангладеш в Пакистан приехало много бенгальцев, в 1979 г. – афганских беженцев. В стране всегда проживало значительное число граждан Ирана, – вспоминает Тарик Малик. – Многие из них смогли получить национальные удостоверения личности, предоставив поддельные документы, в то время как граждане страны их не имели».

Для того, чтобы навести порядок в имеющейся системе учета, было решено создать базу биометрических данных, включающую в себя отпечатки 10 пальцев и цифровую фотографию. Работа началась в 2008 г. Чтобы стимулировать граждан пройти регистрацию, было выпущено распоряжение правительства, запрещающее открывать счета в банке без предъявления ID. Электронное удостоверение личности необходимо было также при любом взаимодействии с государством – регистрации брака, рождения и смерти, оформлении пособий, подключении электро- или газоснабжения, оплате коммунальных услуг.

Кроме того, создателям системы приходилось уговаривать мужчин разрешить сдавать биометрические данные их женам, инициировать в правительстве законопроект, позволяющий получать ID детям, рожденным вне брака. Для того, чтобы добраться до жителей отдаленных горных деревень, приходилось использовать вертолеты и даже приглашать альпинистов.

Усилия не пропали даром. Сегодня в NADRA хранится 121 млн фотографий и 503 млн отпечатков пальцев граждан Пакистана, а также демографическая информация – семейное положение, образование, сведения об инвалидности (если таковые имеются), постоянный адрес и др.

ИТ-инфраструктура NADRA

Для хранения и обработки содержащихся в NADRA данных используется 2 дата-центра, около 1000 серверов, оборудовано 8000 рабочих мест. В Пакистане создано 526 стационарных и 236 мобильных регистрационных центра, отвечающих за сбор биометрической информации и выдачу национальных ID и имеющих выход в интернет.

В NADRA интегрированы ресурсы государственных ведомств Пакистана – это сведения об автомобилях и удостоверениях их владельцев, акты гражданского состояния, данные службы социальной защиты, пограничной и налоговой службы, систем видеонаблюдения и множество других. Ежедневно около 35 тыс. жителей страны пользуются своими ID, и каждый раз их данные соотносятся с имеющимися в системе записями для проверки подлинности документа, удостоверяющего личность.

Референсная архитектура Teradata

Источник: Презентация Тарика Малика, 2015

Хотя мульти-биометрический поиск для идентификации по отпечаткам пальцев и фотографии обеспечивается средствами третьих сторон (Automated Fingerprint Identification System (AFIS) и Facial Recognition System (FRS), они интегрированы и оптимизированы для работы в экосистеме Teradata. Java-архитектура обеспечивает ввод и вывод данных в формате XML и работает в среде Windows и Linux.

Возможности системы

Уже на первом этапе создания NADRA благодаря анализу собранных данных и их сопоставлению со сведениями, содержащимися в других государственных информационных системах, были выявлены люди, которые получали по 2 и даже 3 пенсии, граждане, которые за небольшую плату отбывали наказание за настоящих преступников. При выверке списков избирателей выяснилось, что 45% или 37 млн записей в них дублируются – некоторые граждане зарегистрированы более 20 раз, а некоторые уже давно умерли.

Дальше – больше. По имеющимся на тот момент данным, из более чем 120 млн граждан Пакистана платили налоги только около 800 тыс. Сопоставив данные о имеющейся у граждан собственности – дорогих автомобилях, домах и многочисленных банковских счетах – со списками налогоплательщиков, создатели NADRA выяснили, что 2,4 млн из них вообще не имеет ИНН, а 1,2 млн – имеет, но не платит налогов.

Система также использовалась при выплате пособий 2,5 млн семей, пострадавших от наводнения, и 500 тыс. вынужденных переселенцев.

Сегодня к NADRA подключены все банки страны, которые используют ее для проверки данных своих клиентов. В ходе реализации программы социальной поддержки населения благодаря возможностям NADRA было выдано около 6 млн дебетовых банковских карт и 338 тыс. ID с банковским приложением, что позволило вовлечь в безналичный оборот около 108,4 млрд пакистанских рупий.

Все телеком-компании Пакистана выпускают новые SIM-карты после верификации данных заявителя в NADRA – этот процесс занимает 7 сек.

Проверка автомобиля возле здания посольства

Источник: Презентация Тарика Малика, 2015

На базе NADRA создана национальная система по борьбе с терроризмом и чрезвычайными ситуациями. Например, если в поле зрения видеокамеры попадает подозрительный автомобиль, его параметры и сведения о его владельце, содержащиеся в базе данных, сравниваются с тем, что зафиксировала камера. В случае несовпадения, система немедленно информирует об этом специальные службы. При этом система способна обрабатывать информацию о движущихся объектах, взвешивая риски в режиме реального времени.

Сколько стоят большие данные

Интересно, что создание такой системы обошлось государству совсем недорого – оно выделило на ее реализацию небольшой кредит лишь на первом этапе, который потом был успешно возвращен. Система развивалась самостоятельно за счет предоставления платных сервисов заинтересованным коммерческим структурам. Например, банкам, которые платят за возможность верификации личности 35 рупий ($0.35).

Кроме того, была создана компания NADRA Technology Limited (NTL), которая реализовала подобные проекты в других странах, таких как Кения, Шри Ланка, Нигерия, Бангладеш, Судан и др. При поддержке NADRA также была создана биометрическая база данных беженцев для ООН. Сегодня NADRA – полностью самостоятельная организация, за последние 5 лет ее доходы увеличились на 300%, а зарплаты сотрудников – на 121%.

Наталья Рудычева/CNews Analytics


Крупнейшие поставщики BI-решений в России 2017

№ 2016 Название организации Выручка по направлению BI с НДС в 2016 г., ₽тыс. Рост 2016/2015
1 Softline 1 661 471 14,2%
2 GlowByte Consulting 1 450 000 27,1%
3 AT Consulting 1 408 954 4,3%
4 Крок 1 308 708 22,9%
5 Сапран * 590 000 29,9%

смотреть полный рейтиг