Skip to content

Latest commit

 

History

History
27 lines (17 loc) · 785 Bytes

README.md

File metadata and controls

27 lines (17 loc) · 785 Bytes

pybtm

ツイートなど短文書に特化したトピックモデルの一種である Biterm topic model の実装です.
この実装では Stochastic Collapsed Variational Bayes Zero と呼ばれる推論アルゴリズムをミニバッチ学習に対応させており,従来の Gibbs sampling と比較して効率的にトピックを学習できます.

QuickStart

  • run pybtm
sh etc/run.sh

Requirement

  • numpy
  • scipy

Useful tool

  • pretweet.py
    • ツイートテキストに前処理を行うスクリプト

Reference