Python KNN 学习曲线

时间:2019-06-06 21:10:31   收藏:0   阅读:120

学习曲线的目的是选择更好的模型参数。以最近邻算法为例,选取最近的多少个数据点,才能达到最优。可以控制训练集不动,调整最近的点的个数,绘制学习曲线。

import matplotlib.pyplot as plt

score = []
krange=range(1,21) # K值取值范围
for i in krange:
    clf=KNN(n_neighbors=i)
    clf=clf.fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
plt.plot(krange, score)

结果:

技术分享图片

可以找出最大值所在的索引,找出最佳的k值选择点:

bestindex=score.index(max(score))
print(bestindex+1)
print(score[bestindex])

输出:

8
0.935672514619883

原文:https://www.cnblogs.com/heenhui2016/p/10986869.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!