소셜 빅데이터를 활용한 사회위험 요인 예측
- 쇼셜이노베이션융합전공
- 조회수416
- 2021-03-04
소셜 빅데이터를 활용한 사회위험 요인 예측
본 연구는 소셜 빅데이터를 통해 SNS 상의 청소년 자살 원인을 살펴보고 데이터마이닝 분석을 통해 한국의 청소년 자살 위험 예측모형을 제시하고자 했다. 자살은 초기 사회학의 기틀을 닦은 대표적인 학자인 에밀 뒤르켐(Emile Durkheim)부터 시작해서 사회학의 대표적인 연구 분야 중 하나이다. 이는 자살 자체는 개인적인 선택의 결과이지만, 그것을 야기하는 다양한 원인을 사회에서 찾을 수 있기 때문이다. 미시적으로는 가족관계와 같은 사회적 관계에서, 거시적으로는 사회경제적 요인에 이르기까지 개인을 자살에 이르게 하는 다양한 원인이 존재할 수 있다. 특히 최근에는 단순히 자살 예방을 넘어서 머신러닝을 활용한 자살 예측 모형(suicide prediction model)에 대한 연구가 활발하게 진행되고 있는 만큼, 여기서는 한국보건사회연구원에서 시도한 “소셜 빅데이터를 활용한 사회위험 요인 예측: 청소년 자살과 사이버따돌림을 중심으로”를 소개하고자 한다.
성인에 비해 사회적 외부 요인에 민감할 수 밖에 없는 청소년들에게 있어 SNS는 온라인에서 개인을 제한적, 선택적으로 드러낼 수 있다는 특징 때문에 우울한 감정이나 스트레스, 고민을 들을 수 있고 행태를 이해할 수 있는 장소로 인식되며 이러한 행태를 패턴화할 수 있다면 자살을 예방하는데 긍정적 효과가 발휘될 수 있다는 연구가 나온 바 있다. 한국 사회는 OECD에서 자살률이 최고로 높은 나라 중 하나이며 이는 각 연련층에 보편적으로 나타나고 있다는 점에서 앞서 언급한 SNS와 청소년 간의 관계는 청소년들과 관련된 사회심리적 문제를 해결할 수 있는 가능성을 제시해주고 있다.
유명인의 자살 관련 소식은 청소년들에게 중요한 이슈 중 하나이다
본 연구에서는 먼저 SNS에서 개인들을 통해 전파되는 버즈(buzz: 입소문)가 어떠한 추세로 나타나는지를 확인했다. 청소년들은 자살 관련 사회적 이슈가 나타날 때 자살 관련 커뮤니케이션이 증가했으며 그 중에서도 연예인들의 자살 사건에 더욱 민감하게 반응했다. 청소년들이 자살 버즈는 주로 학업, 성적, 진학 관련 문제들이 차지하고 있었으며 이는 통계청 주관의 2012년 ‘사회조사’에서도 ‘학교성적·진학문제’가 39.2%로 가장 높게 나타나 동일한 경향을 보여주고 있다. 연구진은 사회조사의 데이터를 바탕으로 청소년 자살 위험 예측과 관련하여 의사결정나무(decision tree) 기법을 활용하여 어떠한 결과가 나타났는지를 살펴보았다. 가장 영향력이 높은 요소는 ‘외모’ 특성으로, 외모 요인의 위험이 높을 경우 청소년 자살 위험은 27.9%에서 36.9%로 약 7% 가량 증가하고, 동시에 ‘충격’ 요인까지 높으면 자살위험이 40.7%까지 증가하는 것으로 나타났다. 반면, ‘외모’ 요인에 민감하지 않더라도 ‘열등감’ 요인의 위험이 높아지면 자살위험이 25.9%에서 33.8%로 증가하였으며, ‘열등감’과 ‘충격’ 요인의 위험이 높은 청소년의 경우 자살위험이 33.8%에서 37.8%로 증가하는 것으로 나타났다.
청소년기의 어떤 특성이 자살 위험과 민감하게 반응하는지를 분류하는 것이 가능하다
연구진들은 동일한 기법으로 사이버 따돌림이나 왕따 현상과 관련된 버즈에 대해서도 분석했으며 자살 관련 이슈와 마찬가지로 연예인들 사이의 왕따 사건에 민감하게 반응했다. 따돌림 문제는 행위자의 특성에 따라 피해자, 가해자, 방관자로 크게 구분할 수 있는데, ‘지배욕’이 높은 경우 피해자가 될 위험이 증가하는 반면, ‘스트레스’ 요인이 높을 경우에는 가해자나 방관자가 될 위험이 높아지는 것으로 나타났다. 연구진들은 마지막으로 위의 연구에 필요한 자료처리 과정을 정리하면서 아래와 같은 과정을 통해 기존 조사/통계자료와 소셜 데이터 등 기존에는 하나의 분석에 활용할 수 없었던 자료들을 어떠한 식으로 연결할 수 있는지를 제시해준다.
자료의 성격이 전혀 다른 데이터들을 처리하냐에 따라 함께 분석할 수 있는 가능성을 제공한다
< 연구 함의 >
본 연구는 1) 3년이라는 소셜 빅데이터에 대한 자료확보를 통해 미시적으로는 일일별 단위까지 데이터를 분석하여 그 경향성을 확인하였고 2) 기존에 존재하는 통계자료에 빅데이터 분석기법을 활용하여 기존 자료에 대한 새로운 연구·분석 가능성을 제공하였으며 3) 온라인·오프라인 데이터를 결합하여 제3의 새로운 연구 방향을 초기적으로 제공해주었다는 점에서 기존의 자료를 바라보는 새로운 시각을 제공한다.
원문: 첨부자료 참조