データセット の記事一覧

【機械学習】スパイラルデータセットを作成する

機械学習や深層学習の手法の検証に使える、渦巻き上のデータセットを作成してみます。 線形(直線)で分離できないデータ群をうまく分類する手法の検証用途に利用できます。 端的に上記のようなデータセットを利用することができます。 […]

【グラフデータ】TUDatasetとは?その由来や利用方法を紹介

グラフカーネルやグラフニューラルネットワーク(GNN)の論文を読んでいると、TUDatasetというワードが登場します。初めてこの言葉に遭遇した人は何のことやら、と思うかもしれませんが、TUDatasetはその名前にある […]

【グラフ構造】論文の引用データセットCoraを利用する

Coraデータセットは、論文の引用・被引用関係を集めたデータセットであり、機械学習や深層学習の論文で非常によく利用されています。 今回は、このCoraデータセットを準備し利用する方法について、簡潔でわかりやすくまとめてい […]

【Python】時系列分析で使えるデータセットまとめ(単変量・多変量)

時系列分析、やっていますでしょうか?時系列分析のテーマは幅広く、時系列予測や異常検知、因果推論など興味深いテーマが多数ありますよね。 今回は、時系列分析で利用できるデータセットを紹介します。特定のアルゴリズムを試すのに、 […]

【Python】カリフォルニアの住宅価格データセットを準備する

カリフォルニアの住宅価格のデータセットを準備します。 これらのデータは、線形回帰や重回帰分析のアルゴリズムのテストや実験に、非常に頻繁に用いられるデータセットです。今回は、Pythonで、カリフォルニアの住宅価格のデータ […]

【身長・体重】PythonでDavisデータセットを準備する

人間の身長・体重を集めたデータセットの中で最も有名なデータセットの1つにDavisというデータセットがあります。 しばしば機械学習や統計学の教科書、さらには論文などの多く登場するため、目にしたことがある人も多いのではない […]

【Python】scikit-learnでIrisデータセットを手軽に用意する

機械学習の勉強をしていると、まず最初に登場するのが、Irisデータセットではないでしょうか。 今回は、Irisデータセットを手軽に用意する方法についてまとめます。 Irisデータセットを用意する方法は多数ありますが、今回 […]

【手書き数字】MNISTデータセットの用意と使い方

MNISTは、機械学習やDeepLearningなどで最も利用されていると言えるデータセットの1つです。 主成分分析などの次元削減手法、k-meansやBMM(混合ベルヌーイモデル)、DeepLearningなどのクラス […]

人工衛星テレメトリのデータセットtelemanomを利用する

NASA JPLのHundman et al 氏が 2018年に発表した自身の論文 「Detecting Spacecraft Anomalies Using LSTMs and Nonparametric Dynami […]