Statistics > Machine Learning

arXiv:2212.12189 (stat) [提交于 2022年12月23日]

标题: 停止使用肘部法则进行 K-means 聚类:以及如何选择聚类数量

作者:Erich Schubert 查看由 Erich Schubert 撰写的题为 "停止使用肘部法则进行 K-means 聚类:以及如何选择聚类数量" 的论文 PDF 版本。 查看 PDF

摘要: 在使用 K-means 聚类时,一个主要的挑战是如何选择参数 k,即聚类的数量。在这封信中,我们想指出的是,从一个常见的启发式方法,即 “肘部法则” 中,很容易得出错误的结论。文献中早已存在更好的替代方案,我们希望引起人们对这些易于使用的选项的关注,这些选项通常表现更好。这封信呼吁完全停止使用肘部法则,因为它严重缺乏理论支持,我们希望鼓励教育工作者讨论该方法的问题——如果在课堂上介绍该方法的话——并教授替代方案,而研究人员和审稿人应该拒绝从肘部法则得出的结论。 Subjects: | Machine Learning (stat.ML); Machine Learning (cs.LG)
---|---
Cite as: | arXiv:2212.12189 [stat.ML]
(or arXiv:2212.12189v1 [stat.ML] for this version)
https://doi.org/10.48550/arXiv.2212.12189 Focus to learn more arXiv-issued DOI via DataCite
Related DOI: | https://doi.org/10.1145/3606274.3606278 Focus to learn more DOI(s) linking to related resources

提交历史

来自: Erich Schubert [查看邮件] [v1] 星期五, 23 Dec 2022 08:15:17 UTC (1,007 KB) 全文链接:

访问论文:

查看由 Erich Schubert 撰写的题为 "停止使用肘部法则进行 K-means 聚类:以及如何选择聚类数量" 的论文 PDF 版本。