次回列分析においては、ARIMAやSARIMAのように、過去の観測値をもとにモデル化する手法がある一方で、状態空間モデルは、観測値以外の見えない状態量があると仮定し、その状態により観測値が生起されるとしてモデル化する手法 […]
時系列分析を実務で行う際に、ほとんどのパターンでは、多変量を対象とした時系列の解析をすることが多いと思います。 自分自身、多変量時系列の解析を行う場面が非常に多くあるため、多変量の時系列データセットから部分時系列を作成す […]
カテゴリ変数をOne-Hot-Encoding化することは、機械学習やデータサイエンスの実務をおこなっていると頻繁に操作することになると思います。 今回は、One-Hot-EncodingをPythonで実行する方法につ […]
機械学習モデルにデータを入力するとき、前処理としてデータを標準化(Standardization)や正規化(Normalization)をすることで、モデルの精度を向上させることができます。 また近年流行りの深層学習にお […]
埋め込みとは、自然言語処理(Natural Language Processing, NLP)の文脈では、自然言語などの文章や単語を、数値的に扱えるようにベクトル化することを示します。 Embedding(埋め込み)の目 […]
機械学習の分類モデルの評価する際には、評価指標として混同行列をはじめ、PrecisionやRecall、F1値など様々な概念が登場します。 機械学習や深層学習系の多くの論文や、データサイエンスの結果をまとめるのに、これら […]
VAE(Variational Auto Encoder, 変分オートエンコーダー)は、ニューラルネットワークと取り入れた、生成モデルのアルゴリズムです。 生成モデルと言っても、PCA(主成分分析)やSVD(特異値分解) […]
ベイズモデルにおいては、あるモデルを考えるときに、生成モデル(generative model)を考えます。生成モデルとは、データが生成する過程をモデル化することで、データの分布を表現する手法です。 生成モデルによる定式 […]
pymcはベイジアンモデリングをPythonで行うためのPPL(確率的プログラミング言語)のフレームワークです。 ベイジアンモデリングは近年機械学習の有力な手法として利用されていますが、解析的に解けるわずかな例を除いて解 […]
混合ガウスモデル(Gaussian Mixture Model, GMM)は、教師なしの分類アルゴリズムであり、クラスタリングの手法の1つです。他のクラスタリングのアルゴリズムとしてk-meansがありますが、k-mea […]