Dynamic Topic Model

태그
작성일자
1 more property
Jan 23, 2018 statistics, probabilistic-graphical-modeling

WHY?

LDA를 통하여 토픽 모델링을 할 때 시간적으로 토픽과 그에 대한 단어 분포가 변화하는 정보를 반영하지 못한다.

WHAT?

기존의 LDA의 모델에서 파라미터(토픽과 토픽의 비율 -
α
,
β
)를 평균으로 정규분포를 통하여 표본 추출했다고 가정함으로서 시계열적인 latent variable을 가지고 있다고 가정하고 근사 추정을 한다.

So

LDA보다 시계열적인 정보를 잘 반영한다.