티스토리 뷰

information

범죄수사 제2의 지문, 목소리

biumgonggan 2021. 10. 2. 12:38

사람이라면 누구에게나 있는 지문은, 개개인을 구별할 수 있는 표식입니다. 그리고 범죄 수사에서 범인을 구별할 때, 제2의 지문이라 일컬어지는 것이 있습니다. 바로 목소리인데요. 개인의 고유한 목소리를 분석할 수도 있고요. 또 목소리를 무늬로 시각화할 수도 있는데요. 오늘은 음성 분석 기술에 대해 포스팅해 보겠습니다.

 

2012년, 18세의 한 소년이 사기죄로 붙잡혔습니다. 포털 사이트의 채팅 프로그램에서 만난 남성들을 여자 목소리로 현혹시키면서 여러 차례에 걸쳐 돈을 뜯어낸 건데요. 피해 남성만 무려 22명이었습니다. 피해자들은 전부, ‘정말 여자인 줄 알았다’고 말하며 상대가 남성이라는 사실을 꿈에도 몰랐다고 진술했습니다. 또한 같은 해, 한 무속인이 34억 원에 달하는 생명보험에 가입하고 노숙자를 유인해 수면제를 먹인 뒤 살인을 하는데요. 노숙인이 죽자 무속인의 누나는 동생이 죽었다고 신고를 하였습니다. 그리고 사망한 노숙인을 바로 화장하였죠. 보험금 지급을 위해 상황을 살피던 보험회사에서는 동생이 사망한 직후 바로 화장을 했다는 점에 의구심을 품고 경찰에 수사를 의뢰하는데요. 경찰은 수사 개시 3개월 만에 지방에서 숨어 지내던 무속인을 체포합니다. 무속인은 이미 사망신고가 된 상태로 신원 확인이 쉽지 않았는데요. 경찰은 무속인이 숨어 지내던 집에 가스를 설치하기 위해서 무속인이 도시가스 회사에 전화한 목소리가 녹음된 파일을 찾아냅니다. 그리고 보험사에 남아있던 목소리 파일과 비교해 성문이 동일하다는 것을 확인합니다. 성문은 개인 식별에 사용되는 목소리를 일컫는데요. 때문에 지문은 Finger Print라고 불리고요, 성문은 Voice Print라고 불립니다.

 

이처럼 사람의 목소리는 개인을 특정할 수 있다는 점에서 범죄 수사 분야에서 매우 중요하게 사용되고 있는데요. 1962년 FBI가 벨 연구소에 화자 식별에 관한 연구를 의뢰하면서 성문에 대한 연구가 시작되었습니다. 목소리는 주파수 분석 장치에 의해 복잡한 스펙트로그램으로 나타날 수 있는데요. 즉, 목소리의 시각화가 가능하다는 얘기죠. 그리고 이것은 말하는 사람마다 다른 형상으로 나타나기 때문에 목소리로 사람을 구분하는 것이 가능합니다. 이는 사람마다 얼굴 모양이 다른 것처럼, 인두, 식도, 목젖, 입술이나 혀와 같은 조음기관과 인두, 구강, 비강과 같은 공명기관 역시 개개인이 모두 다르기 때문입니다. 뿐만 아니라, 개인마다 언어를 배우는 환경이 다양하기 때문에 언어적 습관에 따라 억양이나 성조 등이 다 다를 수밖에 없습니다. 예를 들어 TV 프로그램에서 연예인들이 일명 개인기로 정치인이나 동료 연예인의 목소리를 똑같이 따라 하는 것을 종종 볼 수 있는데요. 이런 경우 역시 성문을 분석하면 각각 다른 사람의 목소리라는 것을 쉽게 판단할 수 있다는 겁니다. 벨 연구소의 Kersta는 이러한 연구를 통해 목소리가 사람의 지문처럼 누구나 독특한 특징을 가지고 있으며 이를 통해 화자를 식별하는 경우 99% 이상의 정확도를 나타낸다는 연구결과를 Nature지에 발표하는데요. 이후 성문에 의한 ‘화자 식별’은 형사사법 분야에서 활발하게 사용되고 있습니다.

 

목소리 분석은 심리상태를 파악하는 자료로도 사용되는데요. 목소리는 상황에 따라서 음성의 고조, 속도, 떨림 정도 등이 다르게 나타납니다. 말을 할 때의 감정상태 역시 미세한 주파수의 변화로 확인할 수 있는데요. 이러한 사실을 바탕으로 거짓말 탐지나 용의자 심문 시 참고할 수 있는 음성분석 프로그램도 개발되었죠. 그런가 하면 과거 음성분석의 가장 큰 장애물이었던 ‘소음’ 문제도 음향과 관련된 과학기술과 분석 프로그램의 개발로 해결이 가능해졌는데요. 디지털 파일로 변환하여 복잡하게 혼합된 주파수를 대역별로 분리, 특정 대역을 증폭시킴으로써 음원을 분리하고 소음의 간섭을 줄일 수 있습니다 예를 들어, 시끄러운 나이트클럽 등에서 범죄가 발생했을 시, 현장에서 녹음된 파일을 직접 들으면 어떠한 소리도 감별할 수 없지만, 불필요한 소음의 주파수를 필터링하면 어떤 상황에서도 음성 분석이 가능합니다. 뿐만 아니라, 최근에는 AI를 활용한 성문분석도 활발하게 이루어지고 있는데요. 스마트폰이나, 전화기 등의 스피커를 통해 음성이 입력되면 인공지능 심층 신경망을 기반으로 데이터베이스에서 성문을 인식하고, 화자를 분류합니다. 그리고 다시 소음 등을 삭제, 화자를 분류할 수 있는 것이죠. 우리나라 검찰은 2017년, 한국인 1000명의 음성을 토대로 ‘한국인 표본 음성 데이터베이스(DB)’를 구축했는데요. 국과수는 이를 활용해 보이스피싱 사기 범죄단을 검거하는데 집중하고 있습니다.

 

또한 1991년 발생한 미제사건인, 이형호 군 유괴사건 당시 범인의 목소리도 디지털로 변환해 성문 분석을 의뢰해 놓은 상태이죠. 전문가들에 따르면 성문 분석이 틀릴 확률은 10만 분의 1에 불과합니다. 성문 분석만으로도 용의자의 출신 지역, 연령, 학업 등을 다양한 요소로 추정할 수 있다는 게 수사당국의 설명인데요. 현재는 목소리의 주인이 가지고 있는 지병까지 추정할 수 있는 기술을 개발 중입니다. 머지않아 목소리 뒤에 숨은 ‘얼굴 없는 범인’을 밝히고, 미제사건을 해결하는 데 기여할 수 있기를 바라봅니다. 읽어주셔서 감사합니다.