看板 Statistics 關於我們 聯絡資訊
[軟體程式類別]: SPSS, Stata, Python_sklearn [程式問題]: SPSS k-means 與另外兩個不同 [軟體熟悉度]: 新手 [問題敘述]: 課程助教是用 SPSS 跑 k-means, 我是用 Stata 跟 sklearn 跑, Stata 跟 sklearn 的結果相同, SPSS 結果不同,想知道差異在哪, (是SPSS計算距離的方式不同??) 要如何讓三者結果相同。 [程式範例]: Colab: https://tinyurl.com/2drtnpux SPSS: QUICK CLUSTER x1 x2 /MISSING=LISTWISE /CRITERIA=CLUSTER(3) MXITER(50) CONVERGE(0) /METHOD=KMEANS(NOUPDATE) /SAVE CLUSTER /PRINT INITIAL. Stata: cluster kmeans X1 X2, k(3) measure(L2) name(Stata) start(krandom) iterate(50) Python: kmeans = KMeans(n_clusters=3, max_iter=50, random_state=0) kmeans.fit(df[['x1','x2']]) k_means = kmeans.predict(df[['x1','x2']]) df['sklearn'] = k_means # df['k_means'] -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.84.253.225 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1622551499.A.C67.html
andrew43: 先確定是不是隨機性造成。kmeans過程是有隨機性的。 06/02 00:04
JamesChen: 還有確定一下助教是不是錯的 06/02 09:17
folksuite: 感謝兩位回復~ 我再研究研究 06/02 20:58