<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Hoàng Mạnh Khiêm</title>
    <description>The latest articles on DEV Community by Hoàng Mạnh Khiêm (@hoangmanhkhiem).</description>
    <link>https://dev.to/hoangmanhkhiem</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F821195%2Fd84ac1cd-5b4b-45dd-ab6c-c2e4027e79a1.png</url>
      <title>DEV Community: Hoàng Mạnh Khiêm</title>
      <link>https://dev.to/hoangmanhkhiem</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/hoangmanhkhiem"/>
    <language>en</language>
    <item>
      <title>Full-Text Search Functions</title>
      <dc:creator>Hoàng Mạnh Khiêm</dc:creator>
      <pubDate>Mon, 18 May 2026 09:39:52 +0000</pubDate>
      <link>https://dev.to/hoangmanhkhiem/full-text-search-functions-55en</link>
      <guid>https://dev.to/hoangmanhkhiem/full-text-search-functions-55en</guid>
      <description>&lt;h2&gt;
  
  
  I) Cấu trúc chính
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight sql"&gt;&lt;code&gt;&lt;span class="k"&gt;MATCH&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;col1&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="n"&gt;col2&lt;/span&gt;&lt;span class="p"&gt;,...)&lt;/span&gt; &lt;span class="n"&gt;AGAINST&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;expr&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="n"&gt;search_modifier&lt;/span&gt;&lt;span class="p"&gt;])&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;col1, col2, ...&lt;/code&gt;: Các cột chứa dữ liệu văn bản mà bạn muốn tìm kiếm.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;expr&lt;/code&gt;: Biểu thức tìm kiếm, có thể là một chuỗi hoặc một biến&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;search_modifier&lt;/code&gt;: Tùy chọn để xác định cách thức tìm kiếm, có thể là &lt;code&gt;IN NATURAL LANGUAGE MODE&lt;/code&gt;, &lt;code&gt;IN BOOLEAN MODE&lt;/code&gt;, hoặc &lt;code&gt;WITH QUERY EXPANSION&lt;/code&gt;.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  II) Điều kiện dùng FULLTEXT
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;MySQL hỗ trợ InnoDB hoặc MyISAM&lt;/li&gt;
&lt;li&gt;Chỉ mục index dạng FULLTEXT&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  II) Các loại tìm kiếm FULLTEXT
&lt;/h2&gt;

&lt;h3&gt;
  
  
  1) Tìm kiếm bằng ngôn ngữ tự nhiên (A Natural Language)
&lt;/h3&gt;

&lt;h4&gt;
  
  
  1.1) Định nghĩa
&lt;/h4&gt;

&lt;p&gt;Tìm kiếm bằng ngôn ngữ tự nhiên được cài đặt mặc định khi dùng câu lệnh:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight sql"&gt;&lt;code&gt;&lt;span class="k"&gt;MATCH&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt; &lt;span class="p"&gt;...&lt;/span&gt; &lt;span class="n"&gt;AGAINST&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;
&lt;span class="k"&gt;MATCH&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt; &lt;span class="p"&gt;...&lt;/span&gt; &lt;span class="n"&gt;AGAINST&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;'keyword'&lt;/span&gt; &lt;span class="k"&gt;IN&lt;/span&gt; &lt;span class="k"&gt;NATURAL&lt;/span&gt; &lt;span class="k"&gt;LANGUAGE&lt;/span&gt; &lt;span class="k"&gt;MODE&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  1.2) Đặc điểm
&lt;/h4&gt;

&lt;ul&gt;
&lt;li&gt;Tìm kiếm bằng ngôn ngữ tự nhiên mặc định không có phân biệt rõ ràng chữ hoa với chữ thường. Để cho phép tìm kiếm bằng ngon ngữ tự nhiên phân biệt rõ ràng các chữ hoa chữ thường thì cần chuyển đổi kiểu &lt;strong&gt;&lt;em&gt;utf8mb4&lt;/em&gt;&lt;/strong&gt; sang &lt;strong&gt;&lt;em&gt;utf8mb4_0900_as_cs&lt;/em&gt;&lt;/strong&gt; hoặc &lt;strong&gt;&lt;em&gt;utf8mb4_bin&lt;/em&gt;&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;Có áp dụng danh sách stopwords&lt;/li&gt;
&lt;li&gt;MySQL tự động tính độ liên quan (relevance score)&lt;/li&gt;
&lt;li&gt;Kết quả thường được sắp xếp theo độ liên quan&lt;/li&gt;
&lt;li&gt;Chỉ hoạt động trên cột có &lt;strong&gt;FULLTEXT INDEX&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;Chỉ hỗ trợ các kiểu dữ liệu: &lt;strong&gt;CHAR, VARCHAR, TEXT&lt;/strong&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;h4&gt;
  
  
  1.3) Điểm mạnh
&lt;/h4&gt;

&lt;ul&gt;
&lt;li&gt;Tìm kiếm bằng ngôn ngữ tự nhiên có hiệu suất tìm kiếm full-text hơn cách quét toàn bộ bảng dữ liệu trong MySQL&lt;/li&gt;
&lt;li&gt;Hiệu suất tìm kiếm nhanh hơn LIKE '%keyword%'&lt;/li&gt;
&lt;li&gt;Tìm kiếm bằng ngôn ngữ tự nhiên giúp không cần sử dụng Order By trong query.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  2) Tìm kiếm Boolean (Boolean Search)
&lt;/h3&gt;

&lt;h4&gt;
  
  
  2.1) Định nghĩa
&lt;/h4&gt;

&lt;p&gt;Boolean Full-Text Search là kiểu tìm kiếm full-text sử dụng:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight sql"&gt;&lt;code&gt;&lt;span class="k"&gt;MATCH&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt; &lt;span class="p"&gt;...&lt;/span&gt; &lt;span class="n"&gt;AGAINST&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;'keyword'&lt;/span&gt; &lt;span class="k"&gt;IN&lt;/span&gt; &lt;span class="nb"&gt;BOOLEAN&lt;/span&gt; &lt;span class="k"&gt;MODE&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  2.2) Đặc điểm
&lt;/h4&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;Trong tìm kiếm Boolean cho phép sử dụng các toán tử, cụ thể:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;+&lt;/code&gt; : bắt buộc phải có
&lt;/li&gt;
&lt;li&gt;Ví dụ:
&lt;/li&gt;
&lt;/ul&gt;

&lt;pre class="highlight plaintext"&gt;&lt;code&gt; '+apple +juice' : Tìm các hàng chứa cả hai từ.
 '+apple macintosh' : Tìm các hàng có chứa từ _apple_ , nhưng xếp hạng các hàng cao hơn nếu chúng cũng chứa từ _macintosh _.
 '+apple +juice' : Tìm các hàng chứa cả hai từ.      
&lt;/code&gt;&lt;/pre&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;-&lt;/code&gt; : không được có
&lt;/li&gt;
&lt;li&gt;Ví dụ:
&lt;/li&gt;
&lt;/ul&gt;

&lt;pre class="highlight plaintext"&gt;&lt;code&gt; '+apple -macintosh' : Tìm các hàng có chứa từ “ apple ” nhưng không chứa từ _macintosh_ .
&lt;/code&gt;&lt;/pre&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;"&lt;/code&gt; : tìm chính xác cụm từ
&lt;/li&gt;
&lt;li&gt;Ví dụ:
&lt;/li&gt;
&lt;/ul&gt;

&lt;pre class="highlight plaintext"&gt;&lt;code&gt; '"some words"' : Tìm các hàng chính xác có từ _some words_
&lt;/code&gt;&lt;/pre&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;*&lt;/code&gt; : wildcard / prefix
&lt;/li&gt;
&lt;li&gt;Ví dụ:
&lt;/li&gt;
&lt;/ul&gt;

&lt;pre class="highlight plaintext"&gt;&lt;code&gt; 'apple*' : Tìm các hàng chứa các từ như _apple_ , _apples_ , _applesauce_ hoặc _applet_ 
&lt;/code&gt;&lt;/pre&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;&amp;gt;&lt;/code&gt; &lt;code&gt;&amp;lt;&lt;/code&gt; : tăng / giảm độ liên quan
&lt;/li&gt;
&lt;li&gt;Ví dụ:
&lt;/li&gt;
&lt;/ul&gt;

&lt;pre class="highlight plaintext"&gt;&lt;code&gt; '+apple +(&amp;gt;turnover &amp;lt;strudel)' : Tìm các hàng chứa các từ _apple_ và _turnover_ hoặc _apple_ và _strudel_ (theo bất kỳ thứ tự nào), nhưng xếp hạng _apple turnover_ cao hơn _apple strudel_
&lt;/code&gt;&lt;/pre&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;~&lt;/code&gt; : giảm điểm relevance
&lt;/li&gt;
&lt;li&gt;Ví dụ:
&lt;/li&gt;
&lt;/ul&gt;

&lt;pre class="highlight plaintext"&gt;&lt;code&gt; '+apple ~macintosh' : Tìm các hàng chứa từ _apple_ , nhưng nếu hàng đó cũng chứa từ _macintosh_ , hãy đánh giá thấp hơn so với trường hợp hàng đó không chứa từ _macintosh_ .
&lt;/code&gt;&lt;/pre&gt;



&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;()&lt;/code&gt; : nhóm biểu thức
&lt;/li&gt;
&lt;li&gt;Ví dụ:
&lt;/li&gt;
&lt;/ul&gt;

&lt;pre class="highlight plaintext"&gt;&lt;code&gt; '+apple +(&amp;gt;turnover &amp;lt;strudel)' : Nhóm 2 biểu thức bắt buộc phải có, và độ liên quan.
&lt;/code&gt;&lt;/pre&gt;




&lt;/li&gt;

&lt;li&gt;&lt;p&gt;Không tự động sắp xếp theo độ liên quan&lt;/p&gt;&lt;/li&gt;

&lt;li&gt;&lt;p&gt;Có áp dụng stopwords&lt;/p&gt;&lt;/li&gt;

&lt;li&gt;&lt;p&gt;Với &lt;strong&gt;InnoDB&lt;/strong&gt;, tất cả cột trong MATCH() phải có FULLTEXT INDEX&lt;/p&gt;&lt;/li&gt;

&lt;li&gt;

&lt;p&gt;&lt;strong&gt;MyISAM&lt;/strong&gt; có thể search dù không có FULLTEXT INDEX nhưng rất chậm&lt;/p&gt;

&lt;h4&gt;
  
  
  2.3) Điểm mạnh
&lt;/h4&gt;


&lt;/li&gt;

&lt;li&gt;&lt;p&gt;Tìm kiếm linh hoạt hơn &lt;/p&gt;&lt;/li&gt;

&lt;li&gt;&lt;p&gt;Hỗ trợ các logic Or, and, not&lt;/p&gt;&lt;/li&gt;

&lt;/ul&gt;

&lt;h3&gt;
  
  
  3) Tìm kiếm mở rộng truy vấn (Query Expansion Search)
&lt;/h3&gt;

&lt;h4&gt;
  
  
  3.1) Định nghĩa
&lt;/h4&gt;

&lt;p&gt;Query Expansion (mở rộng truy vấn) là một biến thể của tìm kiếm full-text trong MySQL, giúp mở rộng kết quả tìm kiếm bằng cách tự động bổ sung thêm từ khóa liên quan từ các kết quả ban đầu.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight sql"&gt;&lt;code&gt;&lt;span class="k"&gt;MATCH&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;col1&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;col2&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;...)&lt;/span&gt;
&lt;span class="n"&gt;AGAINST&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="s1"&gt;'keyword'&lt;/span&gt; &lt;span class="k"&gt;WITH&lt;/span&gt; &lt;span class="n"&gt;QUERY&lt;/span&gt; &lt;span class="n"&gt;EXPANSION&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  3.2) Đặc điểm
&lt;/h4&gt;

&lt;ul&gt;
&lt;li&gt;Tìm kiếm mở rộng truy vấn hoạt động dựa vào 2 bước chính là: 

&lt;ul&gt;
&lt;li&gt;Bước 1: Tìm kiếm như tìm kiếm theo ngôn ngữ tự nhiên&lt;/li&gt;
&lt;li&gt;Bước 2: Lấy một số từ quan trọng từ các kết quả đầu tiên và thực hiện lại tìm kiếm với tập từ khóa đã mở rộng.&lt;/li&gt;
&lt;/ul&gt;


&lt;/li&gt;

&lt;li&gt;Tìm kiếm mở rộng truy vấn dựa theo ngữ nghĩa&lt;/li&gt;

&lt;li&gt;Tự động mở rộng truy vấn tìm kiếm&lt;/li&gt;

&lt;li&gt;Không cần người dùng nhập đủ keywords&lt;/li&gt;

&lt;li&gt;Hỗ trợ tốt khi từ để tìm kiếm từ thiếu ngữ nghĩa&lt;/li&gt;

&lt;/ul&gt;

&lt;h4&gt;
  
  
  3.3) Điểm mạnh
&lt;/h4&gt;

&lt;ul&gt;
&lt;li&gt;Từ keyword thiếu ngữ nghĩa có thể mở rộng phạm vi kết quả tìm kiếm.&lt;/li&gt;
&lt;li&gt;Tăng khả năng tìm kiếm ý định tìm kiếm liên quan&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  III. Full-Text Stopwords
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Định nghĩa
&lt;/h3&gt;

&lt;p&gt;Stopwords là các từ quá phổ biến (như “the”, “a”, “is”, …) sẽ bị bỏ qua khi tạo index và khi tìm kiếm full-text trong MySQL.&lt;/p&gt;

&lt;h2&gt;
  
  
  IV. Full-Text Restrictions
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Định nghĩa
&lt;/h3&gt;

&lt;p&gt;Full-Text Restrictions là tập hợp các giới hạn và điều kiện bắt buộc khi sử dụng tính năng Full-Text Search trong MySQL. Các giới hạn này quy định những trường hợp mà FULLTEXT index và câu lệnh MATCH() ... AGAINST() được phép hoặc không được phép hoạt động.&lt;/p&gt;

&lt;h2&gt;
  
  
  V. Fine-Tuning MySQL Full-Text Search
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Định nghĩa
&lt;/h3&gt;

&lt;p&gt;Fine-Tuning Full-Text Search là quá trình điều chỉnh các tham số và cấu hình của MySQL Full-Text Search nhằm thay đổi hành vi tìm kiếm (như tokenization, stopwords, operator, indexing), tối ưu theo nhu cầu cụ thể.&lt;/p&gt;

&lt;h3&gt;
  
  
  Cấu hình
&lt;/h3&gt;

&lt;h4&gt;
  
  
  1) Cấu hình độ dài từ
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight ini"&gt;&lt;code&gt;&lt;span class="err"&gt;innodb_ft_min_token_size&lt;/span&gt;
&lt;span class="err"&gt;innodb_ft_max_token_size&lt;/span&gt;
&lt;span class="err"&gt;ft_min_word_len&lt;/span&gt;
&lt;span class="err"&gt;ft_max_word_len&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  2) Cấu hình ngưỡng Natural Language (MyISAM)
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight cpp"&gt;&lt;code&gt;&lt;span class="cp"&gt;#define GWS_IN_USE GWS_FREQ
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h4&gt;
  
  
  3) Cấu hình ngưỡng Natural Language (MyISAM)
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;ft_boolean_syntax
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



</description>
    </item>
  </channel>
</rss>
