분당아재의 솔직한 블로그

날씨와 트윗량의 관계 분석

IT산책


몇몇 기사를 보면 미국은 구글의 검색량을 통해서 감기가 어떻게 퍼지고 있는지를 측정할 수 있다고 합니다. 

감기증상이 나타나면 아무래도 검색을 통해 의약품 정보나 행동요령을 검색하기 때문에 

관련 검색 트래픽이 증가할 것이고 그것을 분석하면 감기가 유행인지 아닌지를 알 수 있는 원리겠죠.


재미있을 것 같아서 짧게 국내 사례를 분석해 보았습니다. 

최근 2개월에 대한 기온 변화와 "감기"가 포함된 트윗량의 변화를 살펴보면 어떤 상관관계가 나올까요?



아래 그림은 2013년 2월1일부터 4월10일까지 "감기"가 포함된 국내 트윗량의 변화 추세입니다.

이를 보면 2월 7일과 8일 그리고 4월 2일에 트윗량이 급격히 증가한 것을 볼 수 있습니다. 



그럼 2월 7일과 8일의 기온은 어떠했을까요?

기상청(www.kma.go.kr)에서 과거 관측자료를 통해 2월초의 기온 데이터를 살펴보았습니다. 


[2013년 2월 초의 기온 변화]


2월 7일과 8일의 평균기온이 이전 날짜에 비해 급격히 낮아진 것을 알 수 있습니다.

또한, 같은 방법으로 4월 2일의 평균기온을 살펴보아도 해당일에 기온이 현격히 낮았습니다.


짧게 살펴보았습니다만,

날씨와 트윗량은 어느정도 상관관계가 있다고 판단할 수 있겠습니다.


이런 내용들을 지속적으로 발전시키면 여러가지 예측 모델이나 현상분석을 하지 않을까 싶습니다.