DEV Community

Cover image for วิธีการสร้างอัลกอริทึมที่คาดการณ์ราคาบ้านในอนาคตโดยใช้ Scikit-Learn and Linear Regression
Jomjamcsd
Jomjamcsd

Posted on

วิธีการสร้างอัลกอริทึมที่คาดการณ์ราคาบ้านในอนาคตโดยใช้ Scikit-Learn and Linear Regression

ถ้าเราต้องการจะทำนายสิ่งต่าง ๆ ในอนาคต อาทิเช่น การทํานายอนาคตของประกรโลก ราคาทอง ราคาหุ้น ราคา bitcoin และผลกําไรทางธุรกิจของคุณ เรามีวิธีใน
การสร้างอัลกอริทึมสำหรับใช้ในการทำนายอนาคตโดยใช้ PYTHON มาเป็นตัวช่วยของเรา


บทความนี้ เราจะมาดูการสร้างอัลกอริทึมสำหรับใช้ในการทำนายอนาคตใน Python กัน ซึ่งใช้ Google Colab เป็นการรันชุดคำสั่งต่าง ๆและมีการใช้สูตรทางคณิตศาสตร์มาเกี่ยวข้อง


ซึ่งมีวิธีการและขั้นตอนในการสร้างอัลกอริทึม ดังต่อไปนี้


ขั้นตอนที่ 1 ติดตั้งไลบรารี

ขั้นตอนแรกต้องติดตั้งไลบรารี ช่วยให้เรียกใช้ไลบรารี Machine Learning ได้อย่างง่ายดาย ซึ่งสามารถติดตั้งไลบรารี โดยใช้

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
Enter fullscreen mode Exit fullscreen mode

ขั้นตอนที่ 2 โหลดชุดข้อมูล

USAhousing = pd.read_csv('USA_Housing.csv')
Enter fullscreen mode Exit fullscreen mode

การประมวลผลข้อมูลล่วงหน้า ใช้ฟังก์ชัน .head() ในไลบรารี Python เช่น Pandas เพื่อดูแถวเริ่มต้นของชุดข้อมูลอย่างรวดเร็ว ข้อมูลนี้จะแสดงภาพรวมของโครงสร้างข้อมูล ชื่อตัวแปร และรายการแรกๆ

USAhousing.head()
Enter fullscreen mode Exit fullscreen mode

ใช้ฟังก์ชัน .info() เพื่อรับภาพรวมย่อยของชุดข้อมูล ซึ่งรวมถึงประเภทข้อมูล จำนวนค่าที่ไม่ใช่ null และการใช้หน่วยความจำ

USAhousing.info()
Enter fullscreen mode Exit fullscreen mode

ใช้ .describe() เพื่อสร้างสถิติที่เป็นคำอธิบาย เช่นค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน และควอไทล์ เพื่อให้เข้าใจลึกลงเกี่ยวกับคุณสมบัติตัวเลขในชุดข้อมูล

USAhousing.describe()
Enter fullscreen mode Exit fullscreen mode

ขั้นตอนที่ 3: การสร้างกราฟ

การใช้ plt.scatter() ใช้สำหรับสร้างการกระจายของข้อมูล

plt.scatter(USAhousing['Avg. Area Income'],USAhousing['Price'])
Enter fullscreen mode Exit fullscreen mode

Image description

การฝึกโมเดล

ในบทนี้เราทำนายราคาบ้านโดยใช้ Linear Regression การฝึกโมเดลมีขั้นตอนดังนี้

ขั้นตอนที่ 1: การรับค่าของตัวแปรอิสระและตัวแปรตาม

X = USAhousing[['Avg. Area Income', 'Avg. Area House Age', 'Avg. Area Number of Rooms',
               'Avg. Area Number of Bedrooms', 'Area Population']]
y = USAhousing['Price']
Enter fullscreen mode Exit fullscreen mode

ขั้นตอนที่ 2: แยกข้อมูล

from sklearn.model_selection import train_test_split
Enter fullscreen mode Exit fullscreen mode
_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=101)
Enter fullscreen mode Exit fullscreen mode

ขั้นตอนที่ 3: นำเข้าข้อมูลและฝึกกับโมเดล

เมื่อทดลองโมเดลแล้ว นำชุดโมเดลนั้นเพื่อคาดการร์ชุดทดสอบ

from sklearn.linear_model import LinearRegression
Enter fullscreen mode Exit fullscreen mode
lm = LinearRegression()
Enter fullscreen mode Exit fullscreen mode
lm.fit(X_train,y_train)
Enter fullscreen mode Exit fullscreen mode

ทอลองหาผลลัพธ์กัน

predictions = lm.predict(X_test)
Enter fullscreen mode Exit fullscreen mode
plt.scatter(y_test,predictions)
Enter fullscreen mode Exit fullscreen mode

จากนั้นก็มาดูกราฟกัน

Image description

สรุปผล

จากการสร้างอัลกอริทึมจะเห็นได้ว่า ถ้าเราต้องการสร้างอัลกอริทึมเพื่อทำนายอนาคตสิ่งต่าง ๆ ในอนาคตนั้น สิ่งหนึ่งที่สำคัญที่สุดที่จะทำให้อัลกอริทึมที่เราสร้างขึ้นมาสามารถทำนายอนาคตได้ คือ สถิติของข้อมูลย้อนหลัง ที่จะเป็นสิ่งสำคัญที่ช่วยทำให้อัลกอริทึมของเราสามารถทำนายผลต่าง ๆ ล่วงหน้าได้ผ่านปัญญาประดิษฐ์ (AI) ที่อยู่ในชุดคำสั่ง PYTHON ของอัลกอริทึมดังกล่าวที่เราได้เรียบเรียงสร้างขึ้นในข้างต้นได้เป็นอย่างดีและเกิดประโยชน์สูงสุดทั้งในปัจจุบันและในอนาคตต่อไป


Reference

[(https://medium.com/@kaushiksimran827/house-price-prediction-a-simple-guide-with-scikit-learn-and-linear-regression-f91a27b9d650)]

Top comments (0)