데이터 분석의 목적은 주로 하나이다. 사람들이 어떻게 생각하는 지에 대해 수치로 표현할 수 있을 것. 바로 사람들의 보이지 않는 생각을 수치화하는 작업이다. 한국의 중앙은행인 한국은행 또한 이러한 데이터 분석에 힘을 쏟고 있다. 원래 한은이야 워낙 많은 경제지표를 분석하고 또 생산해내는 주체이지만, 최근 '뉴스심리지수'라는 특별한 지표를 만들어 내겠다고 발표했다. 물론 아직 연구와 시험 운영 단계이고, 국가 공식 통계로 인정받기 위해선 통계청의 승인이 떨어져야 하지만, 경제, AI 활용, 뉴스가 섞여 있는 지수이다 보니 마케터로써 눈길이 가는 것은 어쩔 수 없다.
뉴스심리지수란?
한은이 최근 국가 통계에 넣을 예정이라고 발표한 뉴스심리지수는 정책, 금융, 산업, 부동산, 증시 등 경제 분야 기사를 토대로 만들어진다. 한은 경제통계국의 빅데이터 통계연구반이 경제에 관련된 기사들을 텍스트 마이닝 기사로 분석하여 개발하고 있다. 방식은 다음과 같다.
1. 사람들이 먼저 기사의 본문 내용을 문장 단위로 쪼갠다.
2. 각각의 문장을 긍정과 부정 두가지로 나눈다.
3. 이를 데이터화하여 충분히 머신러닝이 진행된다.
4. 그 후 다른 경제 기사들은 이에 따라 자동으로 분류된다.
5. 이를 100을 기준으로 점수를 매긴다. (100을 넘으면 경제 주체들이 경제를 긍정적으로, 못 넘으면 부정적으로 보고 있다고 생각하면 된다.)
뉴스 센티멘탈 인덱스(News Sentiment Index) by 샌프란시스코 연방준비 은행
사실 한은은 따라쟁이다. 그 대상은 경제와 AI 선진국인 미국. 한은이 이번에 도입하고자 하는 뉴스심리지수는 샌프란시스코 연방준비 은행의 뉴스 센티멘탈 인덱스를 그대로 따라한 것이다. (심지어 이름도 번역해서 그대로 쓴다.) 해당 은행의 설명에 따르면, 이는 데이터 분석 관련 학자들의 연구에서 영감을 받아 만들어낸 것이다. 이 뉴스 센티멘탈 인덱스는 전국 유명 일간지와 지역 유명 일간지로 이루어진 총 16개의 신문사들의 기사를 바탕으로 만들어지고 있다.
생각보다 정확하다
주식에 관심이 있는 사람은 한눈에 알아볼 수도 있을 지 모른다. 이 지수 생각보다 정확하다.
이는 이를 한은이 도입하고자 하는 이유이기도 하다. 좀 더 모델을 정교화한다면, 충분히 정책 입안자들이 참고자료로 사용할 수 있을 것이라고 판단한 것이다. 이를 미리 도입한 샌프란시스코 준비은행 역시 그 조사 과정이 번거로운 소비자 심리 지수를 이러한 뉴스 센티멘탈 인덱스가 어느 정도 대체할 수 있을 것이라고 설명하고 있다.
마케팅에서의 활용 사례
위에서 언급한 네이버의 태그 구름 뿐 아니라 이러한 텍스트 마이닝은 이미 마케팅에서 활발히 사용되고 있다. 미국의 경우, 전문화된 텍스트 마이닝 마케팅 업체들도 존재한다. 주로 특정 플랫폼 내에서 이뤄지는 자사 브랜드에 대한 언급을 모아 분석하고 이를 통해 소비자 인사이트를 얻는 방식이다. 그리고 글쓴이는 이미 텍스트 마이닝을 활용한 마케팅 지표를 소개한 적이 있다. 바로 '네이버 별점 서비스 폐지: 자영업자와 소비자'라는 글에서 네이버가 별점 서비스 대신 도입할 것이라고 소개한 '태그 구름'이 바로 그 것이다.
심지어 소비자 개인에 대해서도 자세히 파악할 수 있다.
이러한 텍스트 마이닝 기법은 음성인식 기술과 결합하여 소비자 개인의 성향을 파악하는 것에 사용될 수도 있다. 기업들이 요즘 눈에 불을 켜고 활용하고 있는 AI면접이 그 대표적인 예이다. AI 면접에서 면접자가 발언한 내용들은 텍스트화되고 이를 AI가 분석하여 면접자의 성향과 태도를 분석한다. 너가 뭔데!!!! 너가 나를 그렇게 잘 알아? 면접의 예시를 들었지만, 이는 당사자의 동의만 있다면, 소비자 개인의 취향, 가치관들을 AI가 면밀히 분석하여 소비자에 대한 개인화 마케팅을 진행하는데 충분히 활용될 수 있다.
글쓴이: 이재원
poom1008@naver.com
'Tech' 카테고리의 다른 글
에이셉 라키(Asap Rocky)가 310억 달러 핀테크 기업의 투자자가 되어 돌아왔다 (0) | 2021.06.04 |
---|---|
무신사 x 현대카드 / 현대카드의 PLCC 집중포화 (0) | 2021.04.17 |
개발자들의 집단 지성: Kaggle과 Stackoverflow (0) | 2021.03.23 |
구글 모빌리티 데이터: 코로나에 무감각해진 사람들 (0) | 2021.03.15 |
NFT라는 이 시대의 새로운 도장 (1) | 2021.03.08 |