中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當前位置: 首頁 > news >正文

濟寧萬達網(wǎng)站建設微信廣告推廣如何收費

濟寧萬達網(wǎng)站建設,微信廣告推廣如何收費,正規(guī)的環(huán)保行業(yè)網(wǎng)站開發(fā),企業(yè)vi設計公司哪家好數(shù)據(jù)分析:基于K-近鄰(KNN)對Pima人糖尿病預測分析 作者:AOAIYI 作者簡介:Python領域新星作者、多項比賽獲獎者:AOAIYI首頁 😊😊😊如果覺得文章不錯或能幫助到你學習,可以點贊&#x…

數(shù)據(jù)分析:基于K-近鄰(KNN)對Pima人糖尿病預測分析

作者:AOAIYI

作者簡介:Python領域新星作者、多項比賽獲獎者:AOAIYI首頁

😊😊😊如果覺得文章不錯或能幫助到你學習,可以點贊👍收藏📁評論📒+關注哦!👍👍👍

📜📜📜如果有小伙伴需要數(shù)據(jù)集和學習交流,文章下方有交流學習區(qū)!一起學習進步!💪


專欄案例:數(shù)據(jù)分析
數(shù)據(jù)分析:某電商優(yōu)惠卷數(shù)據(jù)分析
數(shù)據(jù)分析:旅游景點銷售門票和消費情況分析
數(shù)據(jù)分析:消費者數(shù)據(jù)分析
數(shù)據(jù)分析:餐廳訂單數(shù)據(jù)分析
數(shù)據(jù)分析:基于隨機森林(RFC)對酒店預訂分析預測

文章目錄

  • 數(shù)據(jù)分析:基于K-近鄰(KNN)對Pima人糖尿病預測分析
  • 一、前言
  • 二、數(shù)據(jù)準備
  • 三、數(shù)據(jù)預處理
  • 四、建立模型
  • 五、模型驗證
  • 總結


一、前言

k-近鄰算法是分類數(shù)據(jù)最簡單最有效的算法,k-近鄰算法是基于實例的學習,使用算法時我們必須有接近實際數(shù)據(jù)的訓練樣本數(shù)據(jù)。k-近鄰算法必須保存全部數(shù)據(jù)集,如果訓練數(shù)據(jù)集的很大,必須使用大量的存儲空間。此外,由于必須對數(shù)據(jù)集中的每個數(shù)據(jù)計算距離值,實際使用時可能非常耗時。k-近鄰算法的另一個缺陷是它無法給出任何數(shù)據(jù)的基礎結構信息,因此我們也無法知曉平均實例樣本和典型實例樣本具有什么特征。

二、數(shù)據(jù)準備

1.數(shù)據(jù)準備
在這里插入圖片描述
2.導入數(shù)據(jù)

import pandas as pd
import warnings
warnings.filterwarnings("ignore")
data = pd.read_csv("../input/Diabetes/pima-indians-diabetes.csv")
data.head()

在這里插入圖片描述

data.shape

在這里插入圖片描述

三、數(shù)據(jù)預處理

1.將每一列的標簽重新命名

data.columns = ["Pregnancies","Glucose","BloodPressure","SkinThickness","Insulin","BMI","DiabetesPedigreeFunction","Age","Outcome"]
data.head()

在這里插入圖片描述
2.查看有沒有空值數(shù)據(jù)

data.isnull().any()

在這里插入圖片描述

3.觀察樣本中陽性和陰性的個數(shù)

data.groupby("Outcome").size()

在這里插入圖片描述

4.分離特征和標簽

X=data.iloc[:,0:8]
Y=data.iloc[:,8]
X=np.array(X)
Y=np.array(Y)
print("X:",X)
print('\n')
print("Y",Y)

在這里插入圖片描述
在這里插入圖片描述

5.劃分訓練集和測試集

from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier,RadiusNeighborsClassifier
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.2)

四、建立模型

models = []
models.append(("KNN",KNeighborsClassifier(n_neighbors=2)))
models.append(("KNN with weights",KNeighborsClassifier(n_neighbors=2,weights="distance")))
models.append(("Radius Neighbors",RadiusNeighborsClassifier(n_neighbors=2,radius=500.0)))
models

在這里插入圖片描述
分別訓練三個模型,計算平均評分

results = []
for name,model in models:model.fit(X_train,Y_train)results.append((name,model.score(X_test,Y_test)))

for i in range(len(results)):print("name:{},score:{}".format(results[i][0],results[i][1]))

在這里插入圖片描述

利用交叉驗證準確對比算法的精確性

from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
results = []
for name,model in models:Kfold = KFold(n_splits=10)cv_result = cross_val_score(model,X_train,Y_train,cv=Kfold)results.append((name,cv_result))for i in range(len(results)):print("name:{};cross_val_score:{}".format(results[i][0],results[i][1].mean()))

在這里插入圖片描述

通過以上結果顯示,普通KNN算法的性能更優(yōu)一些,接下來用普通KNN進行訓練

五、模型驗證

knn =KNeighborsClassifier(n_neighbors=2)
knn.fit(X_train,Y_train)

在這里插入圖片描述

train_score = knn.score(X_train,Y_train)
test_score = knn.score(X_test,Y_test)
print("train_score:{};test score:{}".format(train_score,test_score))

在這里插入圖片描述

以上結果顯示表明,訓練樣本的擬合情況不佳,模型的準確性欠佳
通過畫學習率曲線來觀察這一結論.


from sklearn.model_selection import ShuffleSplit
from sklearn.model_selection import learning_curveimport matplotlib.pyplot as plt
%matplotlib inline
knn = KNeighborsClassifier(n_neighbors=2)
cv= ShuffleSplit(n_splits=10,test_size=0.2,random_state=0)
plt.figure(figsize=(10,6),dpi=200)
plot_learning_curve(knn,"Learning Curve for KNN Diabetes",X,Y,ylim=(0.0,1.01),cv=cv)
plt.show()

在這里插入圖片描述

學習曲線分析
從圖中可以看出來,訓練樣本的評分較低,且測試樣本與訓練樣本距離較大,這是典型的欠擬合現(xiàn)象,KNN算法沒有更好的措施解決欠擬合的問題,可以嘗試用其他的分類器。

總結

k-近鄰算法是分類數(shù)據(jù)最簡單最有效的算法,k-近鄰算法是基于實例的學習,使用算法時我們必須有接近實際數(shù)據(jù)的訓練樣本數(shù)據(jù)。k-近鄰算法必須保存全部數(shù)據(jù)集,如果訓練數(shù)據(jù)集的很大,必須使用大量的存儲空間。此外,由于必須對數(shù)據(jù)集中的每個數(shù)據(jù)計算距離值,實際使用時可能非常耗時。k-近鄰算法的另一個缺陷是它無法給出任何數(shù)據(jù)的基礎結構信息,因此我們也無法知曉平均實例樣本和典型實例樣本具有什么特征。

http://m.risenshineclean.com/news/57960.html

相關文章:

  • 搜狗seo查詢seo頁面優(yōu)化公司
  • 駐馬店哪里做網(wǎng)站河南網(wǎng)站建設哪個公司做得好
  • 哪個網(wǎng)站做外貿(mào)的淘寶搜索關鍵詞排名查詢工具
  • 如何加強企業(yè)網(wǎng)站建設 論文企業(yè)網(wǎng)站注冊域名的步驟
  • 瀏覽器有哪幾種鄭州seo優(yōu)化顧問阿亮
  • 內(nèi)蒙古網(wǎng)站seo推廣服務公司
  • 做的好的c2c網(wǎng)站重慶高端seo
  • 網(wǎng)站開發(fā)產(chǎn)品經(jīng)理招聘雞西seo
  • wordpress整站生成html網(wǎng)頁
  • 買了域名之后怎么做網(wǎng)站網(wǎng)絡推廣公司企業(yè)
  • 網(wǎng)站開發(fā)中網(wǎng)頁上傳今天的新聞發(fā)布會
  • 免費代理做企業(yè)網(wǎng)站重慶疫情最新情況
  • 論壇網(wǎng)站搭建網(wǎng)絡熱詞2022
  • wordpress 好評插件優(yōu)化設計六年級下冊數(shù)學答案
  • 推廣網(wǎng)站源碼百度網(wǎng)站制作
  • 組織建設情況怎么寫哈爾濱seo優(yōu)化軟件
  • 網(wǎng)站建設保教長沙seo優(yōu)化哪家好
  • 網(wǎng)站怎樣制作seo網(wǎng)站優(yōu)化方案摘要
  • 制作網(wǎng)站首頁的步驟永久開源的免費建站系統(tǒng)
  • 臺州做網(wǎng)站的公司有哪些公司電子商務平臺建設
  • 幫朋友做網(wǎng)站 知乎seo概念的理解
  • 怎樣查網(wǎng)站用什么程序做的今天頭條新聞100條
  • 自己的網(wǎng)站在哪里找線上推廣渠道
  • 怎么看網(wǎng)站源碼用什么做的營銷廣告文案
  • 怎么做視頻網(wǎng)站賺錢嗎長春網(wǎng)站提升排名
  • 怎樣做私人網(wǎng)站重慶今天剛剛發(fā)生的重大新聞
  • 自己做的網(wǎng)站怎么連接計算機網(wǎng)絡推廣策劃案
  • 替人做賭彩網(wǎng)站被判刑外鏈推廣軟件
  • php網(wǎng)站用到的知識紹興百度seo
  • 百度首頁網(wǎng)站的設計詞語搜索排行