<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Temimeno</title>
    <description>The latest articles on DEV Community by Temimeno (@temimeno).</description>
    <link>https://dev.to/temimeno</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F1425559%2Fae56ff4b-a14b-4332-9592-9e8e703f19dc.png</url>
      <title>DEV Community: Temimeno</title>
      <link>https://dev.to/temimeno</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/temimeno"/>
    <language>en</language>
    <item>
      <title>การจำแนกอารมณ์ของข้อความ ด้วย Machine Learning โดยใช้ Python</title>
      <dc:creator>Temimeno</dc:creator>
      <pubDate>Mon, 15 Apr 2024 12:00:48 +0000</pubDate>
      <link>https://dev.to/temimeno/kaarcchamaenkaarmnkhngkhkhwaam-dwy-machine-learning-odyaich-python-55ni</link>
      <guid>https://dev.to/temimeno/kaarcchamaenkaarmnkhngkhkhwaam-dwy-machine-learning-odyaich-python-55ni</guid>
      <description>&lt;p&gt;&lt;strong&gt;การจำแนกอารมณ์ของข้อความ (Text Emotions Classification)&lt;/strong&gt; เป็นปัญหาด้านการประมวลผลภาษาธรรมชาติหรือ Natural Language Processing (NLP) และการจำแนกข้อความหรือ Text Classification โดยเราจะต้องทำการฝึกโมเดล Text Classification เพื่อแบ่งแยกอารมณ์ของข้อความ&lt;/p&gt;

&lt;p&gt;ในการแก้ปัญหานี้ เราจะต้องกำหนดข้อมูลของข้อความและอารมณ์ของข้อความนั้นๆ ก่อน โดยเราจะใช้&lt;strong&gt;ชุดข้อมูล&lt;/strong&gt;จากเว็บไซต์ &lt;strong&gt;Kaggle&lt;/strong&gt; ในการแก้ปัญหานี้ คุณสามารถไป&lt;strong&gt;ดาวน์โหลด&lt;/strong&gt;ชุดข้อมูลได้จาก &lt;a href="https://www.kaggle.com/datasets/praveengovi/emotions-dataset-for-nlp"&gt;ที่นี่&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;ในบทความนี้เราจะ&lt;strong&gt;แสดงวิธีฝึกโมเดล&lt;/strong&gt; Text Classification สำหรับการจำแนกอารมณ์ของข้อความ โดยใช้ &lt;strong&gt;Machine Learning&lt;/strong&gt; และ &lt;strong&gt;Python&lt;/strong&gt;&lt;/p&gt;




&lt;h2&gt;
  
  
  ขั้นตอนการเตรียมการ
&lt;/h2&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 1&lt;/strong&gt;: เริ่มต้นจากการ import python libraries ต้องใช้ก่อน&lt;br&gt;
&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;import pandas as pd
import numpy as np
import keras
import tensorflow
from keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from keras.models import Sequential
from keras.layers import Embedding, Flatten, Dense
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 2&lt;/strong&gt;: ทำการ Upload ชุดข้อมูลที่เราได้ดาวน์โหลดมาลงใน Google Colab โดย...&lt;/p&gt;
&lt;/blockquote&gt;

&lt;ol&gt;
&lt;li&gt;คลิ๊กที่รูป Folder บริเวณแถบซ้าย&lt;/li&gt;
&lt;li&gt;คลิ๊กที่ปุ่ม Upload บริเวณด้ายซ้ายบนหลังจากที่ Folder เปิดขึ้นมาแล้ว&lt;/li&gt;
&lt;li&gt;เลือกไฟล์ที่ต้องการอัพโหลด&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxbua1q6nllydyz7eyp0s.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fxbua1q6nllydyz7eyp0s.png" alt="Image description" width="340" height="226"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 3&lt;/strong&gt;: ลองทดสอบว่าทำการ Upload ชุดข้อมูลสำเร็จหรือไม่โดยการลอง Print ชุดข้อมูล 5 ตัวแรก&lt;br&gt;
&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;data = pd.read_csv("train.txt", sep=';')
data.columns = ["Text", "Emotions"]
print(data.head())
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;ผลลัพธ์ที่ได้:&lt;br&gt;
&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fj6jwmwp7wckkoskt66nu.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fj6jwmwp7wckkoskt66nu.png" alt="Image description" width="489" height="118"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 4&lt;/strong&gt;: เนื่องจากนี่เป็นปัญหาที่เกี่ยวข้องกับ Natural Language Processing (NLP) เราจึงต้องป้องกันข้อมูลส่วนบุคคล เช่น เลขบัญชี โดยใช้ Data Tokenization&lt;br&gt;
&lt;/p&gt;


&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;texts = data["Text"].tolist()
labels = data["Emotions"].tolist()

# Tokenize the text data
tokenizer = Tokenizer()
tokenizer.fit_on_texts(texts)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 5&lt;/strong&gt;: จัดวางลำดับข้อความใหม่เพื่อให้มีความยาวเท่ากับข้อความต้นฉบับเพื่อป้อนข้อมูลให้ Neural Network&lt;br&gt;
&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;sequences = tokenizer.texts_to_sequences(texts)
max_length = max([len(seq) for seq in sequences])
padded_sequences = pad_sequences(sequences, maxlen=max_length)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 6&lt;/strong&gt;: ใช้ Label Encoder Method เพื่อเปลี่ยนข้อมูลตัวอักษรให้เป็นข้อมูลตัวเลข&lt;br&gt;
&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# Encode the string labels to integers
label_encoder = LabelEncoder()
labels = label_encoder.fit_transform(labels)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 7&lt;/strong&gt;: เราจะทำการ One-Hot Encode หรือก็คือการเปลี่ยนข้อมูลที่ถูกเก็บในลักษณะเป็น Categorical ให้เป็นเลขฐาน 2 ขั้นตอนนี้เป็นขั้นตอนที่&lt;strong&gt;จำเป็น&lt;/strong&gt;เพราะ Machine Learning Algorithms จะทำงานกับข้อมูลที่เป็นตัวเลข&lt;br&gt;
&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# One-hot encode the labels
one_hot_labels = keras.utils.to_categorical(labels)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  ขั้นตอนการฝึกโมเดล Text Emotions Classification
&lt;/h2&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 1&lt;/strong&gt;: ทำการแบ่งกลุ่มข้อมูลออกเป็น 2 กลุ่ม คือ...&lt;/p&gt;
&lt;/blockquote&gt;

&lt;ul&gt;
&lt;li&gt;กลุ่มข้อมูลสำหรับการฝึก&lt;/li&gt;
&lt;li&gt;กลุ่มข้อมูลสำหรับการทดสอบ
&lt;/li&gt;
&lt;/ul&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# Split the data into training and testing sets
xtrain, xtest, ytrain, ytest = train_test_split(padded_sequences, 
                                                one_hot_labels, 
                                                test_size=0.2)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 2&lt;/strong&gt;: กำหนด Neural Network Architecture ของปัญหาที่เรายกมา และใช้มันในการฝึกโมเดลการจำแนกอารมณ์&lt;br&gt;
&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# Define the model
model = Sequential()
model.add(Embedding(input_dim=len(tokenizer.word_index) + 1, 
                    output_dim=128, input_length=max_length))
model.add(Flatten())
model.add(Dense(units=128, activation="relu"))
model.add(Dense(units=len(one_hot_labels[0]), activation="softmax"))

model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])
model.fit(xtrain, ytrain, epochs=10, batch_size=32, validation_data=(xtest, ytest))
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;ผลลัพธ์ที่ได้:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Flf8b0hmiwyhu8tjoa140.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Flf8b0hmiwyhu8tjoa140.png" alt="Image description" width="800" height="290"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;ขั้นที่ 3&lt;/strong&gt;: ทำการทดสอบโมเดลที่ฝึกมาโดยการลองพิมพ์ประโยคที่เราต้องการ เช่น&lt;/p&gt;
&lt;/blockquote&gt;

&lt;ul&gt;
&lt;li&gt;ตัวอย่างที่ 1
&lt;/li&gt;
&lt;/ul&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;input_text = "She didn't come today because she lost her dog yestertay!"

# Preprocess the input text
input_sequence = tokenizer.texts_to_sequences([input_text])
padded_input_sequence = pad_sequences(input_sequence, maxlen=max_length)
prediction = model.predict(padded_input_sequence)
predicted_label = label_encoder.inverse_transform([np.argmax(prediction[0])])
print(predicted_label)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;ตัวอย่างที่ 2
&lt;/li&gt;
&lt;/ul&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;input_text = "I fear no man, but that thing... It scared me"

# Preprocess the input text
input_sequence = tokenizer.texts_to_sequences([input_text])
padded_input_sequence = pad_sequences(input_sequence, maxlen=max_length)
prediction = model.predict(padded_input_sequence)
predicted_label = label_encoder.inverse_transform([np.argmax(prediction[0])])
print(predicted_label)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;ตัวอย่างที่ 3
&lt;/li&gt;
&lt;/ul&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;input_text = "Remember last vacation? It was the best time of my life!"

# Preprocess the input text
input_sequence = tokenizer.texts_to_sequences([input_text])
padded_input_sequence = pad_sequences(input_sequence, maxlen=max_length)
prediction = model.predict(padded_input_sequence)
predicted_label = label_encoder.inverse_transform([np.argmax(prediction[0])])
print(predicted_label)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;ผลลัพธ์ที่ได้ :&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;ตัวอย่างที่ 1&lt;br&gt;
&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F3adw4agyf0wfmp18v604.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F3adw4agyf0wfmp18v604.png" alt="Image description" width="425" height="50"&gt;&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;ตัวอย่างที่ 2&lt;br&gt;
&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyrls8dpfzpz2jvsfbj5g.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fyrls8dpfzpz2jvsfbj5g.png" alt="Image description" width="414" height="47"&gt;&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;ตัวอย่างที่ 3&lt;br&gt;
&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fx74v5mw73r9zrywesg9s.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fx74v5mw73r9zrywesg9s.png" alt="Image description" width="417" height="49"&gt;&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  สรุปผล
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;การจำแนกอารมณ์ของข้อความ (Text Emotions Classification)&lt;/strong&gt; เป็นปัญหาด้านการกำหนด&lt;strong&gt;อารมณ์&lt;/strong&gt;ที่ข้อความสื่อออกมาผ่านเนื้อความนั้นๆ โดยหนึ่งตัวอย่างที่ที่ใช้โมเดลตัวนี้ในชีวิตประจำวันนั้นคือ การที่เราพิมพ์ข้อความลงบน&lt;strong&gt;แป้นพิมพ์&lt;/strong&gt;ของ iPhone และจะมี &lt;strong&gt;Emoji ที่เกี่ยวข้อง&lt;/strong&gt;กับเนื้อความแสดงขึ้นมาให้กดได้ ซึ่งทำให้เพิ่มความสะดวกให้กับผู้ใช้ได้โดยแทนที่จะต้องไปค้นหา Emoji นั้นๆ เอง การที่มี Emoji ขึ้นมาให้เลยจึงช่วย&lt;strong&gt;ประหยัดเวลา&lt;/strong&gt;ของผู้ใช้เป็นอย่างมาก&lt;/p&gt;

&lt;p&gt;ทั้งนี้ความแม่นยำของการฝึกโมเดลในบทความนี้ยังคงมี&lt;strong&gt;ความคลาดเคลื่อน&lt;/strong&gt;และ&lt;strong&gt;ผิดผลาด&lt;/strong&gt;อยู่ หากต้องการให้มีความแม่นยำมากกว่านี้ จะต้อง&lt;strong&gt;ป้อนข้อมูล&lt;/strong&gt;ให้กับ AI มากกว่านี้เช่นกัน เพื่อที่ AI ตัวนี้จะสามารถทำงานได้อย่าง&lt;strong&gt;สมบูรณ์&lt;/strong&gt;แบบมากขึ้น&lt;/p&gt;




&lt;h2&gt;
  
  
  แหล่งอ้างอิง
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Text Emotions Classification using Python: &lt;a href="https://thecleverprogrammer.com/2023/02/06/text-emotions-classification-using-python/"&gt;https://thecleverprogrammer.com/2023/02/06/text-emotions-classification-using-python/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;การประมวลผลภาษาธรรมชาติ (Natural Language Processing): &lt;a href="https://www.sas.com/th_th/insights/analytics/what-is-natural-language-processing-nlp.html"&gt;https://www.sas.com/th_th/insights/analytics/what-is-natural-language-processing-nlp.html&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;Text Classification: What it is And Why it Matters: &lt;a href="https://monkeylearn.com/text-classification/"&gt;https://monkeylearn.com/text-classification/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;Tokenization: &lt;a href="https://www.imperva.com/learn/data-security/tokenization/"&gt;https://www.imperva.com/learn/data-security/tokenization/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;Neural Network Architecture: &lt;a href="https://www.dremio.com/wiki/neural-network-architecture/"&gt;https://www.dremio.com/wiki/neural-network-architecture/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;One-Hot Encoding สร้างตัวแปร Dummies สำหรับ Classification model: &lt;a href="https://lengyi.medium.com/one-hot-encoding-737c66e5b1bd"&gt;https://lengyi.medium.com/one-hot-encoding-737c66e5b1bd&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>ai</category>
      <category>python</category>
      <category>nlp</category>
    </item>
  </channel>
</rss>
