빅데이터로 맞춤형 행정
2012년 11월 17일 새벽 5시 30분, 미국 뉴욕의 한 음식거리 뒷골목. 해산물 레스토랑의 보조 주방원인 파블로 로드리게스(26·가명)가 큰 들통을 끌고 나왔다. 불안한 눈동자로 좌우를 살핀다. 아무도 없다. “하긴 토요일 새벽에 누가 있겠어.” 혼잣말을 내뱉고는 들통의 노란 액체를 하수구로 흘렸다. 폐식용유였다. 식용유 무단 방류는 불법이다. 그때 누군가 로드리게스의 뒷덜미를 잡아챈다. “당신이 버릴 줄 알았어.” 뉴욕시청 환경보호국 소속 단속반원 잭 포드(46·가명)였다.그는 어떻게 로드리게스의 행동을 예측했을까. 답은 뉴욕시의 빅데이터 행정 시스템에 있다. 2012년 뉴욕시 데이터분석국장으로 영입된 마이클 플라워스는 뉴욕 배수관 막힘 원인의 50% 이상인 폐식용유 무단 방류 해법을 찾기 위해 레스토랑 소득세 기록과 폐식용유 처리 기록을 비교했다. 매출보다 폐식용유 합법적 처리량이 현격히 적은 업체 주변에 단속반원을 잠복시켰고 적중률은 95%에 달했다. 미 언론 뉴욕타임스는 이를 두고 ‘디지털 셜록 홈스’라며 칭찬했다. 빅데이터 행정은 남의 나라 얘기가 아니다. 중앙정부는 물론 서울과 경기 등 자치단체도 쌓아 놨던 데이터를 활용하기 시작했다. 범죄, 화재 등 위기 발생 가능성을 예측하거나 데이터 행간을 읽어 숨은 부조리를 찾는다. 정부와 지자체의 빅데이터 행정 사례를 살펴봤다.
크고 작은 위기 가능성을 데이터로 미리 읽고 대응하려는 노력이 눈에 띈다. 경찰의 범죄예측시스템 ‘지오프로스’가 대표적이다. 할리우드 영화 ‘마이너리티 리포트’(2002)처럼 ‘예정된 범인’을 특정할 순 없지만 한 지역의 범죄 발생 가능성을 예측할 순 있다. 지오프로스는 죄종별 범죄 발생 위치와 시간, 특정지역의 유동인구와 가구소득, 폐쇄회로(CC)TV 수, 유흥업소 현황, 당일 기상정보 등의 데이터와 전국을 37만여개 블록으로 나눈 지도를 연동시켜 범죄 가능성을 1부터 100 사이 숫자로 표현한다. 예컨대 가구 소득이 높거나 유흥업소가 많으면 범죄 가능성이 높다고 해석한다. 경찰 관계자는 “지구대원들이 마을 곳곳을 무작정 순찰하는 대신 범죄 가능성이 큰 곳 위주로 영리하게 돌아볼 수 있게 됐다”고 말했다.
봄·가을철 공포의 대상인 산불도 산림청의 ‘산불 위험지수’를 참고해 미리 막을 수 있다. 산불위험지수는 1991년 이후 발생한 산불 1만여건의 정보를 분석해 만들었다. 산불 발화·확산에 영향을 미치는 기온과 습도, 풍속 등 기상요소와 특정 산의 고도, 경사면의 방향, 나무 종류 등 지역요소 등 10가지 인자 데이터가 알고리즘(컴퓨터로 답을 얻기 위해 만든 연산 공식)을 만드는 데 이용됐다. 이 공식으로 48시간 내 3490여개 읍·면·동에서 산불이 날 가능성을 예보한다.
예를 들어 일조량이 많아 건조해지기 쉬운 산의 남쪽 사면이 북쪽 사면보다 산불 가능성이 높고, 송진 탓에 불이 잘 붙는 소나무 등 침엽수가 많으면 자연발화 가능성을 높게 본다. 산림청은 관심(50 미만), 주의(51~65), 경계(66~85), 심각(86 이상) 단계로 구분해 산불 예보를 하고 심각 단계이면 감시인원을 늘린다. 산림청 관계자는 “올해 2~5월 산불 중 87%가 경계 또는 심각 단계일 때 발생했다”며 높은 적중률을 자랑했다.
●부조리 감시
감춰진 비리를 찾아낸다. ‘난방비 열사’로 주목받은 배우 김부선씨는 비리를 찾겠다며 관리소 측과 몸싸움까지 벌였지만 빅데이터 분석만으로도 공동주택 관리비의 부조리 정황을 찾을 수 있다. 행정자치부와 경기도는 안양시 160개 공동주택 단지를 대상으로 관리비가 적정한지 따졌다. 한국전력 등으로부터 전기료와 난방비, 수도료 등 47개 항목 데이터를 받은 뒤 아파트 단지들이 입주자에게 부과한 관리비와 비교했다. 차이가 현격한 아파트 단지 위주로 실사했더니 관리비 부정 사례가 많았다. 박연병 행자부 공공정보정책과장은 “빅데이터를 토대로 비위 행위를 감시하면 무작위 현장 실사를 다닐 때보다 인력과 시간 투입이 주는 등 효율성이 있다”고 말했다. 고용노동부도 고용·산재 다발 사업장 정보와 건강보험체납 내역, 장애인 지원 현황 등 빅데이터를 토대로 부당근로사업장을 찾아낸다.
●교통·상가 등 시민 편의 분석
빅데이터로 시민들의 생각을 읽어 편의를 끌어올린 행정 사례도 많다. 서울시 공공 심야버스인 ‘올빼미 버스’가 대표적이다. 시는 2013년 이 노선을 2개에서 8개로 늘릴 때 노선 선정을 위해 빅데이터를 활용했다. 시 통계데이터 전문가들은 우선 법인·개인택시에 설치된 디지털통합운행데이터(DTG) 기록을 통해 자정부터 오전 5시까지 수요가 많은 목적지와 행선지를 파악했다. 통신사 KT에서 심야 통화기록 30억여건을 얻어 고객이 전화를 건 위치와 주소지를 비교해 귀갓길을 파악했다.
자영업자를 위해 골목상권을 분석한 ‘우리마을가게 상권분석서비스’도 있다. 중국집, 편의점 등 43개 생활밀착업종의 카드매출, 임대시세 등 빅데이터 2000억개를 분석해 어떤 지역에 특정 업종을 신규 창업하면 성공 확률이 얼마나 되는지 등을 보여준다. 서울시는 빅데이터와 사물인터넷(IoT) 등 정보화사업에 올해 모두 2178억원을 투자하는 등 행정 인프라 구축에 공을 들인다.
유대근 기자 dynamic@seoul.co.kr
2016-08-13 3면
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지