简单线性回归

线性回归是机器学习中训练数据集的重要手段,首先是简单的线性回归,用到的代码和数据集:数据集,代码
数据集图示:

## 导入库 线性回归所使用到的库如下:
1
2
3
4
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

导入数据集&&拆分数据集

1
2
3
4
5
6
7
8
## 导入数据集
dataset = pd.read_csv('studentscores.csv')
X = dataset.iloc[ : , : 1 ].values
Y = dataset.iloc[ : , 1 ].values

## 拆分数据集
from sklearn.model_selection import train_test_split
X_train , X_test , Y_train , Y_test = train_test_split( X , Y , test_size = 1/4 , random_state = 0 )

使用简单线性回归模型训练数据集

使用LinearRegression中的模型训练数据集

1
2
regressor = LinearRegression()
regressor = regressor.fit( X_train , Y_train )

预测训练结果

使用LinearRegression库的predict函数预测训练结果:

1
Y_pred = regressor.predict( X_test )

预测的结果如下:

结果可视化

使用matplotlib中的pyplot库可以将训练的数据集转化为图表,使结果可视化

1
2
3
4
5
6
7
plt.scatter ( X_train , Y_train , color = 'red' )
plt.plot ( X_train , regressor.predict(X_train) , color = 'blue' )
plt.show()

plt.scatter( X_test , Y_test ,color = 'red' )
plt.plot( X_test , Y_test , color = 'blue' )
plt.show()

训练集可视化图表为:

测试集可视化图表为: