做微信的網(wǎng)站叫什么軟件網(wǎng)站快速上排名方法
一、前言
? ? 前面的幾篇博客我們學(xué)習(xí)了分類算法,今天我們來了解一下回歸類的算法吧。首先我們來談?wù)剝烧哂惺裁磪^(qū)別,首先是我們在之前的分類算法,這類算法可以將讓我們學(xué)會如何將不同的數(shù)據(jù)劃分到不同的類里面,輸出的是一些離散的值。而今天要學(xué)習(xí)的回歸類算法,是說經(jīng)過算法的預(yù)測將我們得到的結(jié)果是一個連續(xù)的值,其實是我們常說的函數(shù)關(guān)系。
二、相關(guān)關(guān)系
(1)概念
? 在談回歸(函數(shù))關(guān)系之前,先講一講,相關(guān)關(guān)系,因為回歸是一種研究自變量(x)與因變量(y)之間的關(guān)系形式的分析方法。而談到變量之間的關(guān)系就分成回歸關(guān)系和相關(guān)關(guān)系兩類。今天我們就先談?wù)勏嚓P(guān)關(guān)系。
定義:反映事物之間的非嚴格、不確定的線性依存關(guān)系。
特點①:
事物之間存在的一種內(nèi)在聯(lián)系。即一個事物的數(shù)量改變可以引起另一個事物的對應(yīng)數(shù)量發(fā)生改變。這其實好理解
特點②:
事物之間的的這種依存關(guān)系是不確定的,是有隨機性的。比較明顯的一點就是我們的自變量(x)可能對應(yīng)對個因變量(y),這和我們的函數(shù)關(guān)系,多個x可以對應(yīng)一個y的情形是不一樣的。這是因為影響y變化的因素不只是x,可能還有其他的因素。
(2)實現(xiàn)公式
三、相關(guān)關(guān)系實踐
求一下數(shù)據(jù)的之間的相關(guān)關(guān)系:
import numpy as np
import pandas as pdA = [250, 360, 165, 43, 92, 200, 355, 290, 230, 120, 73, 205, 400, 320, 72, 272, 94, 190, 235, 139]
B = [35, 29, 36, 60, 65, 30, 10, 70, 21, 55, 54, 48, 20, 39, 60, 20, 58, 40, 27, 30]
C = [3, 4, 7, 6, 5, 5, 6, 10, 9, 2, 12, 5, 5, 4, 8, 5, 7, 8, 9, 7]
D = [6, 10, 3, 9, 6, 5, 7, 10, 11, 5, 4, 1, 15, 7, 6, 8, 3, 11, 8, 5]df = pd.DataFrame({'取暖費': np.array(A), '溫度': np.array(B), '厚度': np.array(C), '年數(shù)': np.array(D)})
# 顯示分裝好的數(shù)據(jù)
print(df)
# 顯示所有數(shù)據(jù)之間的相關(guān)關(guān)系
print(df.corr())
# 顯示鍵為'溫度'的對應(yīng)的數(shù)據(jù)之間的相關(guān)關(guān)系
print(df.corr()[u'溫度'])
# 顯示'取暖費'與'溫度'之間的相似關(guān)系
print(df[u'取暖費'].corr(df[u'溫度']))
效果:
如上面的代碼所示,我們采用pandas庫中的corr()方法就可以直接實現(xiàn)上面那個復(fù)雜關(guān)于相關(guān)性運算的公式!
四、總結(jié)
? 博主也是初學(xué)者,有很多不懂的地方,如果有說錯的地方,歡迎大家指正。最后,該內(nèi)容是跟著B站up主【abilityjh】老師學(xué)習(xí)的,大家可以去看該老師的視頻學(xué)習(xí)!
?