简单线性回归
线性回归是机器学习中训练数据集的重要手段,首先是简单的线性回归,用到的代码和数据集:数据集,代码
数据集图示:
## 导入库
线性回归所使用到的库如下:
1 2 3 4
| import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression
|
导入数据集&&拆分数据集
1 2 3 4 5 6 7 8
| dataset = pd.read_csv('studentscores.csv') X = dataset.iloc[ : , : 1 ].values Y = dataset.iloc[ : , 1 ].values
from sklearn.model_selection import train_test_split X_train , X_test , Y_train , Y_test = train_test_split( X , Y , test_size = 1/4 , random_state = 0 )
|
使用简单线性回归模型训练数据集
使用LinearRegression中的模型训练数据集
1 2
| regressor = LinearRegression() regressor = regressor.fit( X_train , Y_train )
|
预测训练结果
使用LinearRegression库的predict函数预测训练结果:
1
| Y_pred = regressor.predict( X_test )
|
预测的结果如下:
结果可视化
使用matplotlib中的pyplot库可以将训练的数据集转化为图表,使结果可视化
1 2 3 4 5 6 7
| plt.scatter ( X_train , Y_train , color = 'red' ) plt.plot ( X_train , regressor.predict(X_train) , color = 'blue' ) plt.show()
plt.scatter( X_test , Y_test ,color = 'red' ) plt.plot( X_test , Y_test , color = 'blue' ) plt.show()
|
训练集可视化图表为:
测试集可视化图表为: