前回は、scikit-learnを使って、k-meansの実験を行いました。k-meansは単純明快で計算量も比較的少ない便利なアルゴリズムです。簡単な例では良い結果を出していました。 しかし、k-meansにもいくつか難点があります。例えば、クラスタ数$${k}$$を指定する必要が ...
以下では、DBSCANの基本的な仕組みから主な特徴、ほかの代表的なクラスタリング手法との違い、そして実際にDBSCANが威力を発揮する代表的な用途例を2つ紹介します。 要点まとめ DBSCAN(Density-Based Spatial Clustering of Applications with Noise)は、1996年にMartin Esterら ...
scikit-learn is a Python module for machine learning built on top of SciPy and is distributed under the 3-Clause BSD license. The project was started in 2007 by David Cournapeau as a Google Summer of ...
What is this? A ready-to-run workflow for unsupervised clustering on GPU. It wraps RAPIDS cuML's clustering algorithms (KMeans, DBSCAN, HDBSCAN) into a clean pipeline that handles data loading, ...