<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Sebastian Petrus</title>
    <description>The latest articles on DEV Community by Sebastian Petrus (@sebbasstian).</description>
    <link>https://dev.to/sebbasstian</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F3818120%2F250bf99a-8038-4501-b069-c6b622112b06.png</url>
      <title>DEV Community: Sebastian Petrus</title>
      <link>https://dev.to/sebbasstian</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/sebbasstian"/>
    <language>en</language>
    <item>
      <title>Cách Sử Dụng DeepSeek V4 Miễn Phí</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 05:20:42 +0000</pubDate>
      <link>https://dev.to/sebbasstian/cach-su-dung-deepseek-v4-mien-phi-1gmm</link>
      <guid>https://dev.to/sebbasstian/cach-su-dung-deepseek-v4-mien-phi-1gmm</guid>
      <description>&lt;p&gt;DeepSeek V4 ra mắt ngày 23/4/2026 với lựa chọn miễn phí thực sự: trò chuyện web chính thức chạy V4-Pro mà không cần thẻ tín dụng, trọng số cấp phép MIT có thể tải về ngay, và các aggregator như OpenRouter, Chutes thường mở tầng miễn phí chỉ sau vài ngày. Bạn có thể bắt đầu ngay các tác vụ nghiêm túc mà không tốn chi phí trước khi quyết định trả tiền.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Bài viết này trình bày chi tiết các phương pháp miễn phí đã được xác minh, phù hợp từng trường hợp sử dụng, và hướng dẫn thiết lập bộ sưu tập sẵn sàng cho sản xuất trong &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để việc chuyển đổi trả phí diễn ra mượt mà khi cần.&lt;/p&gt;

&lt;p&gt;Tham khảo tổng quan sản phẩm tại &lt;a href="http://apidog.com/blog/what-is-deepseek-v4" rel="noopener noreferrer"&gt;DeepSeek V4 là gì&lt;/a&gt; và hướng dẫn API đầy đủ tại &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api" rel="noopener noreferrer"&gt;Cách sử dụng API DeepSeek V4&lt;/a&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  Tóm tắt
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;&lt;/strong&gt; — Giao diện chat web miễn phí trên V4-Pro, hỗ trợ Think High/Think Max. Không cần thẻ, hoạt động ngay.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Trọng số Hugging Face + GPU cá nhân&lt;/strong&gt; — MIT license, V4-Flash chạy trên 2-4 H100, V4-Pro cần cụm lớn hơn.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tầng miễn phí OpenRouter, Chutes&lt;/strong&gt; — Cổng bên thứ ba thường có quota miễn phí cho DeepSeek sau 1 tuần ra mắt.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Inference provider Hugging Face&lt;/strong&gt; — Điểm cuối dùng chung, giới hạn tốc độ, phù hợp thử nghiệm.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tín dụng thử Kaggle, Colab, RunPod&lt;/strong&gt; — Miễn phí cho các lần chạy thử nghiệm tự lưu trữ.&lt;/li&gt;
&lt;li&gt;Mọi phương pháp miễn phí đều có hạn mức sử dụng. Với tác vụ production, chuyển sang trả phí trước khi chạm ngưỡng.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1pwj8dblm7dbxk7xooey.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1pwj8dblm7dbxk7xooey.png" alt="ảnh" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Phương pháp 1: chat.deepseek.com (cách nhanh nhất và mặc định)
&lt;/h2&gt;

&lt;p&gt;Giao diện trò chuyện chính thức là cách miễn phí, nhanh, đáng tin cậy nhất để trải nghiệm V4-Pro. Chọn chế độ Non-Think, Think High hoặc Think Max ngay trên editor.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fod1zc2ye1qsto7o0xxbc.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fod1zc2ye1qsto7o0xxbc.png" alt="ảnh" width="800" height="434"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  Thiết lập
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;Truy cập &lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;Đăng nhập bằng email, Google hoặc WeChat.&lt;/li&gt;
&lt;li&gt;Xác nhận đang dùng model V4-Pro.&lt;/li&gt;
&lt;li&gt;Bắt đầu trò chuyện.&lt;/li&gt;
&lt;/ol&gt;

&lt;h3&gt;
  
  
  Tính năng
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Ngữ cảnh 1M token đầy đủ.&lt;/li&gt;
&lt;li&gt;Hỗ trợ upload PDF, ảnh, gói mã.&lt;/li&gt;
&lt;li&gt;Tìm kiếm web theo yêu cầu.&lt;/li&gt;
&lt;li&gt;Đầy đủ ba chế độ lập luận.&lt;/li&gt;
&lt;li&gt;Lưu lịch sử chat và tổ chức thư mục.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Giới hạn
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Không công bố số lượng tin nhắn/ngày, nhưng có giảm tốc độ nhẹ khi tải cao.&lt;/li&gt;
&lt;li&gt;Sử dụng nhiều có thể khiến phản hồi bị chậm hoặc hàng đợi, nhưng hiếm khi bị chặn cứng.&lt;/li&gt;
&lt;li&gt;Khi bị giới hạn tốc độ liên tục, cân nhắc giảm tần suất hoặc chuyển sang API.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Nên dùng webchat cho:&lt;/strong&gt; kiểm tra khả năng V4, dán repo, review hợp đồng lớn, thử Think Max.&lt;br&gt;&lt;br&gt;
&lt;strong&gt;Không nên dùng:&lt;/strong&gt; automation, yêu cầu tái lập.&lt;/p&gt;
&lt;h2&gt;
  
  
  Phương pháp 2: Tự lưu trữ V4-Flash trên GPU riêng
&lt;/h2&gt;

&lt;p&gt;V4-Flash là biến thể MIT, phù hợp tự lưu trữ thực tế. Tổng 284B, 13B hoạt động; chạy trên 2 H100 FP8 hoặc 1 H100 80GB INT4.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Ưu điểm:&lt;/strong&gt; Không phụ thuộc vào quota/tốc độ, không bị revoke.&lt;br&gt;&lt;br&gt;
&lt;strong&gt;Chi phí:&lt;/strong&gt; Chỉ tốn phần cứng.&lt;/p&gt;
&lt;h3&gt;
  
  
  Tải trọng số
&lt;/h3&gt;


&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-U&lt;/span&gt; &lt;span class="s2"&gt;"huggingface_hub[cli]"&lt;/span&gt;
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--local-dir&lt;/span&gt; ./models/deepseek-v4-flash
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;


&lt;blockquote&gt;
&lt;p&gt;Khoảng 500GB FP8, cần chuẩn bị ổ đĩa đủ lớn.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h3&gt;
  
  
  Phục vụ với vLLM
&lt;/h3&gt;


&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"vllm&amp;gt;=0.9.0"&lt;/span&gt;

vllm serve deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tensor-parallel-size&lt;/span&gt; 4 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--max-model-len&lt;/span&gt; 1048576 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--dtype&lt;/span&gt; auto &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 8000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;


&lt;blockquote&gt;
&lt;p&gt;Khi chạy, trỏ client OpenAI về &lt;code&gt;http://localhost:8000/v1&lt;/code&gt;. Định dạng API giống DeepSeek trả phí; &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; coi như một base URL mới, không cần sửa lại request.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h3&gt;
  
  
  Kiểm tra phần cứng thực tế
&lt;/h3&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Biến thể&lt;/th&gt;
&lt;th&gt;Card tối thiểu (FP8)&lt;/th&gt;
&lt;th&gt;Card tối thiểu (INT4)&lt;/th&gt;
&lt;th&gt;Thông lượng thực tế&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;V4-Flash&lt;/td&gt;
&lt;td&gt;2 × H100 80GB&lt;/td&gt;
&lt;td&gt;1 × H100 80GB&lt;/td&gt;
&lt;td&gt;50 – 150 tok/s&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;V4-Pro&lt;/td&gt;
&lt;td&gt;16 × H100 80GB&lt;/td&gt;
&lt;td&gt;8 × H100 80GB&lt;/td&gt;
&lt;td&gt;Phụ thuộc cụm&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Nếu không có GPU dư, dùng API rẻ hơn thuê GPU. Tự lưu trữ phù hợp với nhóm đã sẵn hạ tầng hoặc yêu cầu compliance.&lt;/p&gt;
&lt;h2&gt;
  
  
  Phương pháp 3: Tầng miễn phí OpenRouter
&lt;/h2&gt;

&lt;p&gt;OpenRouter tổng hợp nhiều model (open source, closed) qua một API. Tầng miễn phí thường mở cho DeepSeek chỉ sau 1 tuần ra mắt.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbir19t7193o5qk1c978b.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fbir19t7193o5qk1c978b.png" alt="ảnh" width="800" height="293"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h3&gt;
  
  
  Thiết lập
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;Đăng ký tại &lt;a href="https://openrouter.ai/" rel="noopener noreferrer"&gt;openrouter.ai&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;Sinh API key.&lt;/li&gt;
&lt;li&gt;Xem danh mục model: &lt;code&gt;deepseek/deepseek-v4-pro&lt;/code&gt; hoặc &lt;code&gt;deepseek/deepseek-v4-flash&lt;/code&gt;. Model miễn phí có hậu tố &lt;code&gt;:free&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Gọi API bằng SDK OpenAI.
&lt;/li&gt;
&lt;/ol&gt;
&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;OpenAI&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;OPENROUTER_KEY&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://openrouter.ai/api/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek/deepseek-v4-flash:free&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Write a Python CLI for semver bumping.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;h3&gt;
  
  
  Giới hạn
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;Thường ~vài trăm request/ngày/key, giảm ưu tiên khi tải cao.&lt;/li&gt;
&lt;li&gt;Phù hợp tạo mẫu, không đảm bảo production.&lt;/li&gt;
&lt;/ul&gt;
&lt;h2&gt;
  
  
  Phương pháp 4: Nhà cung cấp suy luận Hugging Face
&lt;/h2&gt;

&lt;p&gt;Hugging Face host endpoint inference cho các checkpoint V4. Miễn phí, nhưng tốc độ thấp, rate limit chặt.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;huggingface_hub&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;InferenceClient&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;InferenceClient&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-ai/DeepSeek-V4-Flash&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;chat_completion&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Summarize the V4 technical report in 5 bullets.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
    &lt;span class="n"&gt;max_tokens&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;512&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;Miễn phí token HF, vượt quota thì upgrade lên HF Pro (giá vẫn rẻ hơn API chính thức).&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Phương pháp 5: Tín dụng thử Colab, Kaggle, RunPod, Lambda
&lt;/h2&gt;

&lt;p&gt;Các provider GPU lớn đều cho tín dụng thử miễn phí. Sử dụng hợp lý có thể đủ chạy vài lần V4-Flash.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Google Colab:&lt;/strong&gt; Tầng T4 miễn phí quá nhỏ. Colab Pro+ có 500 compute units/tháng, chạy thử V4-Flash trên A100.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Kaggle:&lt;/strong&gt; Giờ GPU miễn phí T4/P100, chỉ đủ cho V4-Flash lượng tử hóa.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;RunPod:&lt;/strong&gt; $10 tín dụng thử, chạy H100 vài giờ (benchmark, test).&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Lambda:&lt;/strong&gt; Thỉnh thoảng có giờ miễn phí H100/H200 (theo dõi đăng ký).&lt;/li&gt;
&lt;/ul&gt;

&lt;blockquote&gt;
&lt;p&gt;Không dài hạn. Chỉ phù hợp một vài lần thử nghiệm.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  Xây dựng bộ sưu tập Apidog không phụ thuộc provider
&lt;/h2&gt;

&lt;p&gt;Bạn có thể kiểm thử cùng prompt trên mọi backend miễn phí/trả phí mà không cần lặp lại request.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Quy trình:&lt;/strong&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Tải &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;Tạo collection với 4 môi trường: &lt;code&gt;chat&lt;/code&gt; (placeholder), &lt;code&gt;deepseek&lt;/code&gt; (&lt;code&gt;https://api.deepseek.com/v1&lt;/code&gt;), &lt;code&gt;openrouter&lt;/code&gt; (&lt;code&gt;https://openrouter.ai/api/v1&lt;/code&gt;), &lt;code&gt;self-hosted&lt;/code&gt; (&lt;code&gt;http://localhost:8000/v1&lt;/code&gt;).&lt;/li&gt;
&lt;li&gt;Lưu một request POST đến &lt;code&gt;{{BASE_URL}}/chat/completions&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Lưu API key từng provider bằng biến secret, phần body giữ nguyên.&lt;/li&gt;
&lt;li&gt;Chuyển môi trường để A/B prompt trên mọi backend.&lt;/li&gt;
&lt;/ol&gt;

&lt;blockquote&gt;
&lt;p&gt;Mẫu tương tự &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api-for-free" rel="noopener noreferrer"&gt;bộ sưu tập tầng miễn phí GPT-5.5&lt;/a&gt;: một công cụ, nhiều provider, không lặp lại thao tác.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  Nên chọn phương pháp miễn phí nào?
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Muốn thử nhanh 5 phút:&lt;/strong&gt; Dùng &lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Muốn tạo mẫu sản phẩm:&lt;/strong&gt; Dùng tầng miễn phí OpenRouter tới khi hết quota, sau đó nạp tiền DeepSeek.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Có GPU, cần compliance:&lt;/strong&gt; Tự lưu trữ V4-Flash với vLLM.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Cần xài miễn phí dài hạn:&lt;/strong&gt; Không có. Tất cả tầng miễn phí đều giới hạn. Kết hợp &lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt; cho tác vụ tương tác + nạp tiền nhỏ cho automation.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Khi nào nên ngừng dùng miễn phí?
&lt;/h2&gt;

&lt;p&gt;Ba dấu hiệu bạn nên chuyển sang trả phí:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Bị rate limit nhiều lần/ngày&lt;/strong&gt; → Khối lượng đủ lớn để lên kế hoạch ngân sách.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Cần SLA&lt;/strong&gt; → Miễn phí không có SLA, API chính thức thì có.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Cần logging/audit/compliance&lt;/strong&gt; → API trả phí có hóa đơn, bản ghi rõ ràng; tầng miễn phí thường không.&lt;/li&gt;
&lt;/ol&gt;

&lt;blockquote&gt;
&lt;p&gt;Khi gặp bất kỳ dấu hiệu nào, hãy chuyển sang &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api" rel="noopener noreferrer"&gt;API chính thức&lt;/a&gt;. Nạp tiền tối thiểu $2, giá/token thấp nhất trong các pioneer tier.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2&gt;
  
  
  Câu hỏi thường gặp
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt; có thực sự miễn phí không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. Không cần thẻ tín dụng, không có trial. Có thể giảm tốc độ, nhưng không bị paywall.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Cần tài khoản Hugging Face để tải trọng số không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Về kỹ thuật là không (repo public), thực tế nên có tài khoản để tăng giới hạn tải xuống.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Phương pháp miễn phí nào chạy full V4-Pro?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt; chạy V4-Pro đầy đủ. OpenRouter miễn phí thường chỉ V4-Flash. Muốn đầu ra V4-Pro miễn phí, chỉ nên dùng webchat.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có thể đặt tầng miễn phí phía sau sản phẩm không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không nên. Tầng miễn phí bị rate limit, thay đổi điều khoản hoặc biến mất. Nếu build cho khách hàng, hãy dùng API trả phí hoặc tự host.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Tự lưu trữ có thực sự miễn phí không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Giấy phép miễn phí, phần cứng thì không. Nếu đã có GPU trống, chỉ tốn điện. Thuê GPU thường không kinh tế bằng API trả phí.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Apidog có tầng miễn phí thử nghiệm không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; miễn phí cho thiết kế, test API; chỉ mất phí khi gọi API trả phí qua nó. Bạn có thể dùng workspace Apidog miễn phí kết hợp &lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt; hoặc OpenRouter để có workflow hoàn toàn miễn phí.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Hướng Dẫn Chạy DeepSeek V4 Tại Nhà</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:37:28 +0000</pubDate>
      <link>https://dev.to/sebbasstian/huong-dan-chay-deepseek-v4-tai-nha-5gd7</link>
      <guid>https://dev.to/sebbasstian/huong-dan-chay-deepseek-v4-tai-nha-5gd7</guid>
      <description>&lt;p&gt;DeepSeek V4 ra mắt ngày 23/4/2026 với trọng số (weights) MIT trên Hugging Face. Giấy phép mở này giúp mọi đội nhóm có thể triển khai AI mạnh mẽ trên hạ tầng riêng. V4-Flash (284B, 13B hoạt động) chạy trên 2 × H100 FP8; V4-Pro (1.6T, 49B hoạt động) cần cụm và cạnh tranh với GPT-5.5/Claude Opus 4.6 về code/suy luận. Bài này hướng dẫn từng bước triển khai cục bộ: chuẩn bị phần cứng, lượng tử hóa, thiết lập vLLM/SGLang, cấu hình sử dụng công cụ, và kiểm thử qua Apidog trước khi đưa vào sản xuất. Xem tổng quan sản phẩm tại &lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 là gì&lt;/a&gt;, API hosted tại &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;cách sử dụng API DeepSeek V4&lt;/a&gt;, so sánh giá tại &lt;a href="http://apidog.com/blog/deepseek-v4-api-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;giá API DeepSeek V4&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Hãy thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;h2 id="tldr-tóm-tắt"&gt;TL;DR (Tóm tắt)&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flash&lt;/strong&gt; chạy trên 2 × H100 80GB (FP8), hoặc 1 × H100 (INT4). Trọng số ~500GB FP8.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro&lt;/strong&gt; cần 16+ H100 FP8 để đạt thông lượng sản xuất; không dành cho laptop.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;vLLM&lt;/strong&gt; là lựa chọn nhanh nhất cho server tương thích OpenAI. &lt;code&gt;vllm&amp;gt;=0.9.0&lt;/code&gt; hỗ trợ V4.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;SGLang&lt;/strong&gt; phù hợp nếu cần sử dụng công cụ, đầu ra cấu trúc tốt.&lt;/li&gt;
&lt;li&gt;Lượng tử hóa &lt;strong&gt;AWQ INT4&lt;/strong&gt; hoặc &lt;strong&gt;GPTQ INT4&lt;/strong&gt; giúp V4-Flash chạy trên 1 card 80GB, giảm ~5% chất lượng.&lt;/li&gt;
&lt;li&gt;Dùng &lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; trỏ vào &lt;code&gt;http://localhost:8000/v1&lt;/code&gt; để kiểm thử, dùng lại collection với API hosted.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="ai-nên-tự-lưu-trữ"&gt;Ai nên tự lưu trữ&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Đội nhóm ràng buộc quy định:&lt;/strong&gt; Y tế, tài chính, pháp lý, quốc phòng – dữ liệu không được rời mạng. MIT license, không thỏa thuận sử dụng, không có luồng dữ liệu qua biên giới.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Workload lớn, ổn định:&lt;/strong&gt; API V4-Pro giá 1.74$/triệu token vào, 3.48$/triệu token ra. Nếu &amp;gt;200B token/tháng, tự mua phần cứng sẽ rẻ hơn.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tinh chỉnh &amp;amp; nghiên cứu:&lt;/strong&gt; Có checkpoint Base cho pretraining, SFT, MIT license cho phép phân phối lại bản tinh chỉnh thương mại.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Không nên tự lưu trữ&lt;/strong&gt;: Prototyper, đội thiếu kinh nghiệm vận hành GPU, workload &amp;lt; 200$/tháng với API hosted. Chi phí vận hành sẽ vượt lợi ích ở quy mô nhỏ.&lt;/p&gt;

&lt;h2 id="yêu-cầu-phần-cứng"&gt;Yêu cầu phần cứng&lt;/h2&gt;

&lt;p&gt;DeepSeek V4: FP4 + FP8 mixed precision. Cần đủ VRAM cho tổng số experts (MoE), không chỉ active params.&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Biến thể&lt;/th&gt;
&lt;th&gt;Tổng tham số&lt;/th&gt;
&lt;th&gt;Tham số hoạt động&lt;/th&gt;
&lt;th&gt;VRAM FP8&lt;/th&gt;
&lt;th&gt;VRAM INT4&lt;/th&gt;
&lt;th&gt;Card tối thiểu&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;V4-Flash&lt;/td&gt;
&lt;td&gt;284B&lt;/td&gt;
&lt;td&gt;13B&lt;/td&gt;
&lt;td&gt;~500GB&lt;/td&gt;
&lt;td&gt;~140GB&lt;/td&gt;
&lt;td&gt;2 × H100 80GB (FP8) hoặc 1 × H100 (INT4)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;V4-Pro&lt;/td&gt;
&lt;td&gt;1.6T&lt;/td&gt;
&lt;td&gt;49B&lt;/td&gt;
&lt;td&gt;~2.4TB&lt;/td&gt;
&lt;td&gt;~700GB&lt;/td&gt;
&lt;td&gt;16 × H100 80GB (FP8) hoặc 8 × H100 (INT4)&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;VRAM cần cho toàn bộ MoE, không chỉ active.&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;H200, MI300X thay thế tốt.&lt;/strong&gt; Card 141GB/192GB giảm số card cần.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;GPU consumer không chạy nổi.&lt;/strong&gt; 24GB RTX không đủ, kể cả INT4.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Apple Silicon:&lt;/strong&gt; M3/M4 Max 128GB unified memory chỉ phù hợp dev/test, tốc độ chậm.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="bước-1-tải-xuống-trọng-số"&gt;Bước 1: Tải xuống trọng số (weights)&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash" rel="noopener noreferrer"&gt;&lt;code&gt;deepseek-ai/DeepSeek-V4-Flash&lt;/code&gt;&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro" rel="noopener noreferrer"&gt;&lt;code&gt;deepseek-ai/DeepSeek-V4-Pro&lt;/code&gt;&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Dùng &lt;code&gt;deepseek-ai/DeepSeek-V4-Flash-Base&lt;/code&gt; / &lt;code&gt;DeepSeek-V4-Pro-Base&lt;/code&gt; để tinh chỉnh.&lt;/li&gt;
&lt;/ul&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-U&lt;/span&gt; &lt;span class="s2"&gt;"huggingface_hub[cli]"&lt;/span&gt;
huggingface-cli login

huggingface-cli download deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--local-dir&lt;/span&gt; ./models/deepseek-v4-flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--local-dir-use-symlinks&lt;/span&gt; False
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Cần ~500GB ổ cho V4-Flash, vài TB cho V4-Pro. Nếu ở TQ, có thể dùng &lt;a href="https://modelscope.cn/models/deepseek-ai/DeepSeek-V4-Flash" rel="noopener noreferrer"&gt;modelscope.cn&lt;/a&gt; để tải nhanh hơn.&lt;/p&gt;

&lt;h2 id="bước-2-chọn-serving-engine"&gt;Bước 2: Chọn serving engine&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;vLLM:&lt;/strong&gt; Thông lượng cao, tương thích OpenAI, cộng đồng lớn. Nên dùng mặc định.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;SGLang:&lt;/strong&gt; Phù hợp workload dùng tool-calling, đầu ra JSON/primitives tốt hơn.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Cả hai đều hỗ trợ DeepSeek V4 (tuần phát hành V4).&lt;/p&gt;

&lt;h2 id="bước-3-phục-vụ-v4-flash-vllm"&gt;Bước 3: Phục vụ V4-Flash với vLLM&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"vllm&amp;gt;=0.9.0"&lt;/span&gt;

vllm serve deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tensor-parallel-size&lt;/span&gt; 2 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--max-model-len&lt;/span&gt; 1048576 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--dtype&lt;/span&gt; auto &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--enable-prefix-caching&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 8000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Chú thích:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;--tensor-parallel-size 2&lt;/code&gt;: Chạy trên 2 H100. Tăng lên nếu nhiều card.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;--max-model-len 1048576&lt;/code&gt;: Cửa sổ ngữ cảnh 1M-token. Giảm xuống nếu cần tiết kiệm VRAM.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;--enable-prefix-caching&lt;/code&gt;: Tối ưu cache-hit, tăng throughput.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;--dtype auto&lt;/code&gt;: Tự động FP8.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Sau khi chạy, client kiểu OpenAI trỏ &lt;code&gt;http://localhost:8000/v1&lt;/code&gt; là hoạt động.&lt;/p&gt;

&lt;h2 id="bước-4-phục-vụ-v4-pro-vllm"&gt;Bước 4: Phục vụ V4-Pro với vLLM&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;vllm serve deepseek-ai/DeepSeek-V4-Pro &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tensor-parallel-size&lt;/span&gt; 8 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--pipeline-parallel-size&lt;/span&gt; 2 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--max-model-len&lt;/span&gt; 524288 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--enable-prefix-caching&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 8000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Chạy cụm 16 × H100 (8 tensor × 2 pipeline). Có thể tăng context nếu còn VRAM. Hình thức này phù hợp cluster đa node.&lt;/p&gt;

&lt;h2 id="bước-5-phục-vụ-với-sglang"&gt;Bước 5: Phục vụ với SGLang (tool-calling)&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"sglang[all]&amp;gt;=0.4.0"&lt;/span&gt;

python &lt;span class="nt"&gt;-m&lt;/span&gt; sglang.launch_server &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--model-path&lt;/span&gt; deepseek-ai/DeepSeek-V4-Flash &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tp&lt;/span&gt; 2 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--context-length&lt;/span&gt; 1048576 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--port&lt;/span&gt; 30000
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;SGLang cho API OpenAI tại &lt;code&gt;http://localhost:30000/v1&lt;/code&gt;. Có DSL &lt;code&gt;lang&lt;/code&gt; cho tool-calling, đầu ra JSON tốt hơn vLLM.&lt;/p&gt;

&lt;h2 id="bước-6-lượng-tử-hóa-gpu-đơn"&gt;Bước 6: Lượng tử hóa cho GPU đơn&lt;/h2&gt;

&lt;p&gt;INT4 giúp V4-Flash chạy 1 × 80GB, giảm chất lượng nhẹ. Hai lựa chọn:&lt;/p&gt;

&lt;h3 id="awq"&gt;AWQ (khuyến nghị)&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install &lt;/span&gt;autoawq

python &lt;span class="nt"&gt;-c&lt;/span&gt; &lt;span class="s2"&gt;"
from awq import AutoAWQForCausalLM
from transformers import AutoTokenizer

model_path = './models/deepseek-v4-flash'
out_path = './models/deepseek-v4-flash-awq'
model = AutoAWQForCausalLM.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)
model.quantize(tokenizer, quant_config={'w_bit': 4, 'q_group_size': 128})
model.save_quantized(out_path)
tokenizer.save_pretrained(out_path)
"&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3 id="gptq"&gt;GPTQ&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install &lt;/span&gt;auto-gptq
&lt;span class="c"&gt;# Làm theo mẫu lượng tử hóa GPTQ, tương tự AWQ.&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Phục vụ checkpoint lượng tử hóa bằng &lt;code&gt;--quantization awq&lt;/code&gt; hoặc &lt;code&gt;--quantization gptq&lt;/code&gt; khi chạy vLLM.&lt;/p&gt;

&lt;h2 id="bước-7-kiểm-thử-apidog"&gt;Bước 7: Kiểm thử với Apidog&lt;/h2&gt;

&lt;p&gt;Không đưa vào production ngay, cần kiểm thử qua Apidog:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-228.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-228.png" alt="Cách chạy cục bộ DeepSeek V4 trên các máy chủ vLLM hoặc SGLang" width="800" height="530"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Tải và cài đặt Apidog.&lt;/li&gt;
&lt;li&gt;Tạo collection trỏ &lt;code&gt;http://localhost:8000/v1/chat/completions&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Dán prompt test đã dùng với API hosted. So sánh phản hồi.&lt;/li&gt;
&lt;li&gt;Test endpoint với context 500K-token để kiểm tra KV cache.&lt;/li&gt;
&lt;li&gt;Chạy quy trình tool-calling end-to-end trước khi kết nối agent.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Collection bạn dùng với &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API hosted&lt;/a&gt; dùng lại được cho server cục bộ, chỉ cần đổi URL base.&lt;/p&gt;

&lt;h2 id="khả-năng-quan-sát-giám-sát"&gt;Khả năng quan sát &amp;amp; giám sát&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Token/s:&lt;/strong&gt; Cả prompt và generate. vLLM: &lt;code&gt;/metrics&lt;/code&gt; Prometheus.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;GPU utilization:&lt;/strong&gt; &lt;code&gt;nvidia-smi&lt;/code&gt; hoặc DCGM. Dưới 70% nghĩa là batch chưa tối ưu.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;KV cache-hit rate:&lt;/strong&gt; &lt;code&gt;--enable-prefix-caching&lt;/code&gt; giúp đo. Tỉ lệ hit giảm thì prompt đa dạng quá mức.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Request latency p50/p95/p99:&lt;/strong&gt; Nếu p99 tăng, p50 ổn định =&amp;gt; queue nghẽn do request shape.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Đẩy 4 metric này lên Grafana hoặc hệ thống monitoring của bạn.&lt;/p&gt;

&lt;h2 id="tinh-chỉnh-v4-base"&gt;Tinh chỉnh checkpoint V4 Base&lt;/h2&gt;

&lt;p&gt;Dùng checkpoint Base cho pretraining/SFT. Ví dụ SFT với LoRA:&lt;/p&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="s2"&gt;"torch&amp;gt;=2.6"&lt;/span&gt; transformers accelerate peft trl

python &lt;span class="nt"&gt;-m&lt;/span&gt; trl sft &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--model_name_or_path&lt;/span&gt; deepseek-ai/DeepSeek-V4-Flash-Base &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--dataset_name&lt;/span&gt; your-org/your-sft-set &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--output_dir&lt;/span&gt; ./models/v4-flash-custom &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--per_device_train_batch_size&lt;/span&gt; 1 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--gradient_accumulation_steps&lt;/span&gt; 16 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--learning_rate&lt;/span&gt; 2e-5 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--bf16&lt;/span&gt; &lt;span class="nb"&gt;true&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--use_peft&lt;/span&gt; &lt;span class="nb"&gt;true&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--lora_r&lt;/span&gt; 64 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--lora_alpha&lt;/span&gt; 128
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Tinh chỉnh toàn bộ tham số V4-Pro là bài toán lớn. Với đội nhỏ, chỉ nên dùng LoRA trên V4-Flash-Base.&lt;/p&gt;

&lt;h2 id="lỗi-thường-gặp"&gt;Lỗi thường gặp&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;OOM khi khởi động:&lt;/strong&gt; &lt;code&gt;--max-model-len&lt;/code&gt; cao quá, hoặc &lt;code&gt;--tensor-parallel-size&lt;/code&gt; thấp. Giảm context/batch hoặc tăng song song.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Request đầu chậm:&lt;/strong&gt; vLLM compile kernel lần đầu. Gửi request dummy để khởi động.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Lỗi tool-calling:&lt;/strong&gt; DeepSeek encoding hơi khác OpenAI. Dùng SDK support V4 rõ ràng.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Lỗi FP8 trên card cũ:&lt;/strong&gt; A100 không hỗ trợ FP8. Chạy BF16 (tốn gấp đôi VRAM).&lt;/li&gt;
&lt;/ol&gt;

&lt;h2 id="khi-nào-nên-tự-lưu-trữ"&gt;Khi nào nên tự lưu trữ?&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flash, 200B token vào/tháng + 20B ra:&lt;/strong&gt; ~33.6K$ API hosted vs ~20K$/tháng thuê 8 × H100. Tự lưu trữ rẻ hơn ~40%.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro, 500B in + 50B out/tháng:&lt;/strong&gt; ~1.04M$ API hosted vs ~35K$/tháng thuê 16 × H100. Tiết kiệm &amp;gt;95%.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Break-even V4-Flash khoảng 100B token/tháng. Dưới mức này nên dùng API hosted.&lt;/p&gt;

&lt;h2 id="faq"&gt;Câu hỏi thường gặp&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Chạy V4-Flash trên A100 đơn được không?&lt;/strong&gt; Có, nếu lượng tử hóa nặng + context ngắn. INT4 trên A100 80GB chạy 5-15 token/s. Tốt nhất vẫn là H100.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Hỗ trợ LoRA?&lt;/strong&gt; Có. Dùng checkpoint Base + pipeline TRL/Axolotl.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Server cục bộ tương thích OpenAI không?&lt;/strong&gt; Có. vLLM, SGLang đều có &lt;code&gt;/v1/chat/completions&lt;/code&gt;, &lt;code&gt;/v1/completions&lt;/code&gt;. &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Hướng dẫn API hosted&lt;/a&gt; dùng được cho local.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Bật thinking mode thế nào?&lt;/strong&gt; Truyền &lt;code&gt;thinking_mode: "thinking"&lt;/code&gt; hoặc &lt;code&gt;"thinking_max"&lt;/code&gt; vào request body. vLLM/SGLang đều hỗ trợ.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Stream từ server cục bộ được không?&lt;/strong&gt; Được. Đặt &lt;code&gt;stream: true&lt;/code&gt; như API OpenAI/DeepSeek hosted.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Cách thử nhanh/hợp lý trước khi mua phần cứng?&lt;/strong&gt; Thuê H100 trên RunPod/Lambda vài giờ, chạy V4-Flash INT4, đo throughput với prompt thực tế. Test 10-30$ giúp quyết định nhanh hơn lên kế hoạch 1 tuần.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Hướng Dẫn Sử Dụng API DeepSeek V4 Chi Tiết</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:17:40 +0000</pubDate>
      <link>https://dev.to/sebbasstian/huong-dan-su-dung-api-deepseek-v4-chi-tiet-17b3</link>
      <guid>https://dev.to/sebbasstian/huong-dan-su-dung-api-deepseek-v4-chi-tiet-17b3</guid>
      <description>&lt;p&gt;DeepSeek V4 đã ra mắt với API có thể sử dụng ngay từ ngày đầu. Bạn có thể chọn các model &lt;code&gt;deepseek-v4-pro&lt;/code&gt; và &lt;code&gt;deepseek-v4-flash&lt;/code&gt;, sử dụng endpoint tương thích với OpenAI tại &lt;code&gt;https://api.deepseek.com&lt;/code&gt;. Bất kỳ client nào đang dùng GPT-5.5 hoặc API dạng OpenAI đều có thể chuyển sang V4 chỉ bằng việc đổi URL cơ sở.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-222.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-222.png" alt="" width="1200" height="825"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Bài viết này hướng dẫn từng bước xác thực, các tham số quan trọng, ví dụ Python &amp;amp; Node, cách dùng thinking mode, gọi hàm, truyền phát (streaming), và quy trình workflow với &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để kiểm soát chi phí khi phát triển, thử nghiệm API.&lt;/p&gt;

&lt;p&gt;Xem tổng quan sản phẩm tại &lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 là gì&lt;/a&gt;, hoặc hướng dẫn dùng miễn phí ở &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;cách sử dụng DeepSeek V4 miễn phí&lt;/a&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  Tóm tắt
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;DeepSeek V4 có endpoint &lt;strong&gt;tương thích OpenAI&lt;/strong&gt;:
&lt;code&gt;&lt;a href="https://api.deepseek.com/v1/chat/completions" rel="noopener noreferrer"&gt;https://api.deepseek.com/v1/chat/completions&lt;/a&gt;&lt;/code&gt;
và endpoint &lt;strong&gt;tương thích Anthropic&lt;/strong&gt;:
&lt;code&gt;&lt;a href="https://api.deepseek.com/anthropic" rel="noopener noreferrer"&gt;https://api.deepseek.com/anthropic&lt;/a&gt;&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;Model: &lt;code&gt;deepseek-v4-pro&lt;/code&gt; (1.6T, 49B active) và &lt;code&gt;deepseek-v4-flash&lt;/code&gt; (284B, 13B active)&lt;/li&gt;
&lt;li&gt;Hỗ trợ &lt;strong&gt;ngữ cảnh 1M token&lt;/strong&gt; và 3 chế độ thinking: &lt;code&gt;non-thinking&lt;/code&gt;, &lt;code&gt;thinking&lt;/code&gt;, &lt;code&gt;thinking_max&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;Nên dùng &lt;code&gt;temperature=1.0, top_p=1.0&lt;/code&gt; theo khuyến nghị của DeepSeek; không dùng mặc định GPT-5.5/Claude&lt;/li&gt;
&lt;li&gt;Các model cũ &lt;code&gt;deepseek-chat&lt;/code&gt;, &lt;code&gt;deepseek-reasoner&lt;/code&gt; sẽ dừng vào &lt;strong&gt;24/07/2026&lt;/strong&gt;; hãy chuyển đổi sớm&lt;/li&gt;
&lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Tải Apidog&lt;/a&gt; để phát lại request, so sánh thinking mode và bảo vệ API key&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-223.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-223.png" alt="" width="1200" height="887"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Điều kiện tiên quyết
&lt;/h2&gt;

&lt;p&gt;Trước khi bắt đầu, chuẩn bị:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Tài khoản developer DeepSeek tại &lt;a href="https://platform.deepseek.com/" rel="noopener noreferrer"&gt;platform.deepseek.com&lt;/a&gt; với số dư ≥ $2 (nếu không sẽ gặp lỗi &lt;code&gt;402 Insufficient Balance&lt;/code&gt;)&lt;/li&gt;
&lt;li&gt;API key giới hạn theo project (không dùng key toàn account cho sản xuất)&lt;/li&gt;
&lt;li&gt;SDK truy cập URL dạng OpenAI: Python &lt;code&gt;openai&amp;gt;=1.30.0&lt;/code&gt;, Node &lt;code&gt;&lt;a href="mailto:openai@4.x"&gt;openai@4.x&lt;/a&gt;&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;API client để phát lại request mà không làm đầy terminal. Dùng &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; cho workflow thực tế.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Xuất khóa API một lần như sau:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;export &lt;/span&gt;&lt;span class="nv"&gt;DEEPSEEK_API_KEY&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="s2"&gt;"sk-..."&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  Điểm cuối và xác thực
&lt;/h2&gt;

&lt;p&gt;Có hai định dạng endpoint:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight http"&gt;&lt;code&gt;&lt;span class="err"&gt;POST https://api.deepseek.com/v1/chat/completions    # OpenAI format
POST https://api.deepseek.com/anthropic/v1/messages  # Anthropic format
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Hầu hết trường hợp nên chọn dạng OpenAI. Xác thực qua Bearer Token trong header &lt;code&gt;Authorization&lt;/code&gt;:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl https://api.deepseek.com/v1/chat/completions &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Authorization: Bearer &lt;/span&gt;&lt;span class="nv"&gt;$DEEPSEEK_API_KEY&lt;/span&gt;&lt;span class="s2"&gt;"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Content-Type: application/json"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-d&lt;/span&gt; &lt;span class="s1"&gt;'{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "user", "content": "Giải thích định tuyến MoE trong hai câu."}
    ]
  }'&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Phản hồi thành công trả về JSON có &lt;code&gt;choices&lt;/code&gt;, &lt;code&gt;usage&lt;/code&gt; (đếm token đầu vào/ra và &lt;code&gt;reasoning_tokens&lt;/code&gt; nếu bật thinking), cùng &lt;code&gt;id&lt;/code&gt; để theo dõi. Lỗi trả về theo chuẩn OpenAI với &lt;code&gt;error.code&lt;/code&gt; và &lt;code&gt;error.message&lt;/code&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  Tham số yêu cầu
&lt;/h2&gt;

&lt;p&gt;Mỗi trường đều ảnh hưởng đến chi phí/hành vi. Dưới đây là bảng tham số chính cho &lt;code&gt;deepseek-v4-pro&lt;/code&gt;/&lt;code&gt;deepseek-v4-flash&lt;/code&gt;:&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Tham số&lt;/th&gt;
&lt;th&gt;Loại&lt;/th&gt;
&lt;th&gt;Giá trị&lt;/th&gt;
&lt;th&gt;Lưu ý&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;model&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;string&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;deepseek-v4-pro&lt;/code&gt;, &lt;code&gt;deepseek-v4-flash&lt;/code&gt;
&lt;/td&gt;
&lt;td&gt;Bắt buộc.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;messages&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;array&lt;/td&gt;
&lt;td&gt;cặp vai trò/nội dung&lt;/td&gt;
&lt;td&gt;Bắt buộc. Cùng schema với OpenAI.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;thinking_mode&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;string&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;non-thinking&lt;/code&gt;, &lt;code&gt;thinking&lt;/code&gt;, &lt;code&gt;thinking_max&lt;/code&gt;
&lt;/td&gt;
&lt;td&gt;Mặc định là &lt;code&gt;non-thinking&lt;/code&gt;.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;temperature&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;td&gt;0 đến 2&lt;/td&gt;
&lt;td&gt;DeepSeek khuyến nghị 1.0.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;top_p&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;td&gt;0 đến 1&lt;/td&gt;
&lt;td&gt;DeepSeek khuyến nghị 1.0.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;max_tokens&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;int&lt;/td&gt;
&lt;td&gt;1 đến 131.072&lt;/td&gt;
&lt;td&gt;Giới hạn độ dài đầu ra.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;stream&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;bool&lt;/td&gt;
&lt;td&gt;true hoặc false&lt;/td&gt;
&lt;td&gt;Bật truyền phát SSE.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;tools&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;array&lt;/td&gt;
&lt;td&gt;đặc tả công cụ OpenAI&lt;/td&gt;
&lt;td&gt;Để gọi hàm.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;tool_choice&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;string hoặc object&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;auto&lt;/code&gt;, &lt;code&gt;required&lt;/code&gt;, &lt;code&gt;none&lt;/code&gt;, hoặc công cụ cụ thể&lt;/td&gt;
&lt;td&gt;Kiểm soát việc sử dụng công cụ.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;response_format&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;object&lt;/td&gt;
&lt;td&gt;&lt;code&gt;{"type": "json_object"}&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;Đầu ra chế độ JSON.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;seed&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;int&lt;/td&gt;
&lt;td&gt;bất kỳ số nguyên nào&lt;/td&gt;
&lt;td&gt;Để tái tạo kết quả.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;presence_penalty&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;td&gt;-2 đến 2&lt;/td&gt;
&lt;td&gt;Phạt các chủ đề lặp lại.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;frequency_penalty&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;float&lt;/td&gt;
&lt;td&gt;-2 đến 2&lt;/td&gt;
&lt;td&gt;Phạt các token lặp lại.&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;code&gt;thinking_mode&lt;/code&gt; quyết định chi phí nhiều nhất:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;non-thinking&lt;/code&gt;: không suy luận, trả về rất nhanh như V3.2&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;thinking&lt;/code&gt;: bật block suy luận, tốn thêm token, tăng chính xác ở code/toán&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;thinking_max&lt;/code&gt;: max quality, tốn nhiều token nhất, chỉ dùng khi thực sự cần và với context ≥384K&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Client Python
&lt;/h2&gt;

&lt;p&gt;SDK &lt;code&gt;openai&lt;/code&gt; dùng được bằng cách chỉ định &lt;code&gt;base_url&lt;/code&gt;. Wrapper như LangChain, LlamaIndex, DSPy đều tương thích.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;os&lt;/span&gt;
&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;OpenAI&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;os&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;environ&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;DEEPSEEK_API_KEY&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://api.deepseek.com/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-v4-pro&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;
        &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;system&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Trả lời chỉ bằng mã.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
        &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Viết một hàm Rust để làm mượt các sự kiện.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;extra_body&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;thinking_mode&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;thinking&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="n"&gt;temperature&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mf"&gt;1.0&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;top_p&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mf"&gt;1.0&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;max_tokens&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="mi"&gt;2048&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;choice&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;
&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Nội dung:&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;choice&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Token suy luận:&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;usage&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;reasoning_tokens&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Tổng số token:&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;usage&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;total_tokens&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Dùng &lt;code&gt;extra_body&lt;/code&gt; để truyền tham số đặc biệt như &lt;code&gt;thinking_mode&lt;/code&gt; qua SDK OpenAI.&lt;/p&gt;

&lt;h2&gt;
  
  
  Client Node
&lt;/h2&gt;

&lt;p&gt;Cách gọi với NodeJS:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="nx"&gt;OpenAI&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;openai&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;new&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;apiKey&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;process&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;env&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;DEEPSEEK_API_KEY&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;baseURL&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;https://api.deepseek.com/v1&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nx"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;model&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;deepseek-v4-flash&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;messages&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;
    &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;role&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;user&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;content&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;Giải thích trình tối ưu hóa Muon bằng tiếng Anh đơn giản.&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
  &lt;span class="p"&gt;],&lt;/span&gt;
  &lt;span class="na"&gt;thinking_mode&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;thinking&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;temperature&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mf"&gt;1.0&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;top_p&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mf"&gt;1.0&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="nx"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;content&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
&lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="s2"&gt;Cách sử dụng:&lt;/span&gt;&lt;span class="dl"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;usage&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;SDK Node nhận các trường lạ như &lt;code&gt;thinking_mode&lt;/code&gt; trực tiếp.&lt;/p&gt;

&lt;h2&gt;
  
  
  Phản hồi truyền phát (Streaming)
&lt;/h2&gt;

&lt;p&gt;Để nhận phản hồi dạng stream, truyền &lt;code&gt;stream=True&lt;/code&gt; và lặp qua từng chunk SSE:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="n"&gt;stream&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-v4-pro&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Truyền phát một bài luận 300 từ về MoE.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
    &lt;span class="n"&gt;stream&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="bp"&gt;True&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;extra_body&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;thinking_mode&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;non-thinking&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="k"&gt;for&lt;/span&gt; &lt;span class="n"&gt;chunk&lt;/span&gt; &lt;span class="ow"&gt;in&lt;/span&gt; &lt;span class="n"&gt;stream&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;
    &lt;span class="n"&gt;delta&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;chunk&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;delta&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt; &lt;span class="ow"&gt;or&lt;/span&gt; &lt;span class="sh"&gt;""&lt;/span&gt;
    &lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;delta&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;end&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;""&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;flush&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="bp"&gt;True&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Nếu bật thinking mode, &lt;code&gt;delta.reasoning_content&lt;/code&gt; sẽ chứa trace suy luận. Bạn có thể hiển thị trace này hoặc bỏ qua.&lt;/p&gt;

&lt;h2&gt;
  
  
  Gọi công cụ
&lt;/h2&gt;

&lt;p&gt;DeepSeek V4 hỗ trợ schema gọi hàm chuẩn của OpenAI:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="n"&gt;tools&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;[{&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;function&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;function&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;name&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;get_weather&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;description&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Trả về thời tiết hiện tại cho một thành phố.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;parameters&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
            &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;object&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
            &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;properties&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
                &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;city&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;string&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
                &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;unit&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;string&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;enum&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;c&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;f&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;]},&lt;/span&gt;
            &lt;span class="p"&gt;},&lt;/span&gt;
            &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;required&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;city&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
        &lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;},&lt;/span&gt;
&lt;span class="p"&gt;}]&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-v4-pro&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Thời tiết ở Lagos theo độ C?&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
    &lt;span class="n"&gt;tools&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="n"&gt;tools&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;tool_choice&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;auto&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;extra_body&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;thinking_mode&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;thinking&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;tool_call&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;tool_calls&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;]&lt;/span&gt;
&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;tool_call&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;function&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;name&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="n"&gt;tool_call&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;function&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;arguments&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Sau đó, bạn gọi hàm thật, trả kết quả về &lt;code&gt;role: "tool"&lt;/code&gt; rồi tiếp tục gọi API. Cách này giống hệt với loop sử dụng function calling của OpenAI.&lt;/p&gt;

&lt;h2&gt;
  
  
  Chế độ JSON
&lt;/h2&gt;

&lt;p&gt;Để nhận output JSON chuẩn, truyền &lt;code&gt;response_format&lt;/code&gt;:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;deepseek-v4-flash&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;
        &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;system&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Trả lời bằng một đối tượng JSON duy nhất.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
        &lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Tóm tắt ghi chú phát hành này dưới dạng {tiêu đề, ngày, gạch đầu dòng}: ...&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="n"&gt;response_format&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;type&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;json_object&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="n"&gt;extra_body&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;thinking_mode&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;non-thinking&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Chế độ JSON buộc output hợp lệ JSON nhưng không enforce schema. Để xác thực schema, dùng Pydantic hoặc Zod ở phía client.&lt;/p&gt;

&lt;h2&gt;
  
  
  Xây dựng bộ sưu tập trong Apidog
&lt;/h2&gt;

&lt;p&gt;Việc phát lại request trực tiếp từ terminal dễ lãng phí credit &amp;amp; khó so sánh. Quy trình hiệu quả:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Tải Apidog&lt;/a&gt; và tạo project mới&lt;/li&gt;
&lt;li&gt;Khai báo môi trường với biến bí mật &lt;code&gt;{{DEEPSEEK_API_KEY}}&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;Lưu request POST đến &lt;code&gt;{{BASE_URL}}/chat/completions&lt;/code&gt;, header &lt;code&gt;Authorization: Bearer {{DEEPSEEK_API_KEY}}&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;Tham số hóa &lt;code&gt;model&lt;/code&gt; và &lt;code&gt;thinking_mode&lt;/code&gt; để test A/B giữa các biến thể&lt;/li&gt;
&lt;li&gt;Dùng viewer để kiểm tra &lt;code&gt;usage.reasoning_tokens&lt;/code&gt; và xác định chi phí thực tế từng lần chạy&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Nếu bạn đã có &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;bộ sưu tập API GPT-5.5&lt;/a&gt; trong Apidog, chỉ cần đổi base URL thành &lt;code&gt;&lt;a href="https://api.deepseek.com/v1" rel="noopener noreferrer"&gt;https://api.deepseek.com/v1&lt;/a&gt;&lt;/code&gt; và model ID để so sánh giữa hai provider.&lt;/p&gt;

&lt;h2&gt;
  
  
  Xử lý lỗi
&lt;/h2&gt;

&lt;p&gt;DeepSeek trả lỗi theo chuẩn OpenAI. Một số mã lỗi thường gặp:&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Mã&lt;/th&gt;
&lt;th&gt;Ý nghĩa&lt;/th&gt;
&lt;th&gt;Khắc phục&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;400&lt;/td&gt;
&lt;td&gt;Yêu cầu không hợp lệ&lt;/td&gt;
&lt;td&gt;Kiểm tra schema JSON, đặc biệt &lt;code&gt;messages&lt;/code&gt; và &lt;code&gt;tools&lt;/code&gt;.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;401&lt;/td&gt;
&lt;td&gt;Khóa không hợp lệ&lt;/td&gt;
&lt;td&gt;Tạo lại tại &lt;a href="https://platform.deepseek.com/" rel="noopener noreferrer"&gt;platform.deepseek.com&lt;/a&gt;.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;402&lt;/td&gt;
&lt;td&gt;Số dư không đủ&lt;/td&gt;
&lt;td&gt;Nạp tiền vào tài khoản.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;403&lt;/td&gt;
&lt;td&gt;Mô hình không được phép&lt;/td&gt;
&lt;td&gt;Kiểm tra phạm vi key và chính tả model ID.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;422&lt;/td&gt;
&lt;td&gt;Tham số ngoài phạm vi&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;max_tokens&lt;/code&gt; hoặc &lt;code&gt;thinking_mode&lt;/code&gt; có thể sai.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;429&lt;/td&gt;
&lt;td&gt;Giới hạn tốc độ&lt;/td&gt;
&lt;td&gt;Tạm dừng, thử lại với exponential backoff.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;500&lt;/td&gt;
&lt;td&gt;Lỗi máy chủ&lt;/td&gt;
&lt;td&gt;Thử lại 1 lần. Nếu lặp lại, kiểm tra trang trạng thái.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;503&lt;/td&gt;
&lt;td&gt;Quá tải&lt;/td&gt;
&lt;td&gt;Dùng V4-Flash hoặc thử lại sau 30s.&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Nên wrap mọi API call trong hàm retry, xử lý lỗi 429, 5xx với backoff lũy thừa. Không tự động retry lỗi 4xx.&lt;/p&gt;

&lt;h2&gt;
  
  
  Các mẫu kiểm soát chi phí
&lt;/h2&gt;

&lt;p&gt;Áp dụng 4 mẫu sau để tối ưu chi phí:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Mặc định dùng V4-Flash&lt;/strong&gt;. Chỉ dùng V4-Pro khi đã đo được improvement.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Giới hạn &lt;code&gt;thinking_max&lt;/code&gt; bằng flag&lt;/strong&gt;. Chỉ bật khi cần chất lượng cao, vì đây là mode đắt nhất.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Giới hạn &lt;code&gt;max_tokens&lt;/code&gt;&lt;/strong&gt;. Hầu hết câu trả lời nằm trong 2000 token output. 1M context dành cho input.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Ghi log &lt;code&gt;usage&lt;/code&gt; mỗi lần gọi&lt;/strong&gt;. Theo dõi input, output, reasoning token để phát hiện bất thường.&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  Di chuyển từ các mô hình DeepSeek cũ hơn
&lt;/h2&gt;

&lt;p&gt;Các model ID cũ &lt;code&gt;deepseek-chat&lt;/code&gt;, &lt;code&gt;deepseek-reasoner&lt;/code&gt; sẽ dừng vào 24/07/2026. Di chuyển chỉ cần đổi giá trị model:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight diff"&gt;&lt;code&gt;&lt;span class="gd"&gt;-  model="deepseek-chat"
&lt;/span&gt;&lt;span class="gi"&gt;+  model="deepseek-v4-pro"
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Nên so sánh A/B trong Apidog trước khi triển khai production để đảm bảo chất lượng cải thiện, đồng thời chuẩn bị cho việc ngừng hỗ trợ model cũ.&lt;/p&gt;

&lt;h2&gt;
  
  
  Câu hỏi thường gặp
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;API DeepSeek V4 đã sẵn sàng cho production chưa?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. API vận hành từ 23/04/2026, nền tảng ổn định.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;V4 có hỗ trợ format Anthropic không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. Chỉ cần trỏ sang &lt;code&gt;&lt;a href="https://api.deepseek.com/anthropic/v1/messages" rel="noopener noreferrer"&gt;https://api.deepseek.com/anthropic/v1/messages&lt;/a&gt;&lt;/code&gt;, gửi payload dạng Anthropic.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Context window bao nhiêu?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
1 triệu token trên cả V4-Pro và V4-Flash. &lt;code&gt;thinking_max&lt;/code&gt; nên dùng context tối thiểu 384K.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Đếm token đầu vào thế nào?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Dùng tokenizer OpenAI để ước lượng trước khi gửi. Số chính xác trả về trong trường &lt;code&gt;usage&lt;/code&gt; của response.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có hỗ trợ fine-tuning qua API không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Chưa. Hiện chỉ fine-tune qua checkpoint base trên Hugging Face.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;API có miễn phí dùng thử không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không có free tier, nhưng tài khoản mới đôi khi nhận được credit dùng thử.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Hướng Dẫn Sử Dụng DeepSeek V4: Web Chat, API và Tự Lưu Trữ</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:16:46 +0000</pubDate>
      <link>https://dev.to/sebbasstian/huong-dan-su-dung-deepseek-v4-web-chat-api-va-tu-luu-tru-5og</link>
      <guid>https://dev.to/sebbasstian/huong-dan-su-dung-deepseek-v4-web-chat-api-va-tu-luu-tru-5og</guid>
      <description>&lt;p&gt;DeepSeek V4 được phát hành ngày 23/4/2026 với 4 checkpoint, API trực tiếp và trọng số MIT trên Hugging Face. Bạn có thể dùng ngay qua web, gọi API sản xuất hoặc tự triển khai tại chỗ. Bài này hướng dẫn chi tiết từng cách, các bước thực hiện, ưu nhược điểm và quy trình sẵn sàng cho sản xuất.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Nếu bạn cần tổng quan sản phẩm, xem &lt;a href="http://apidog.com/blog/what-is-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;DeepSeek V4 là gì&lt;/a&gt;. Cần hướng dẫn API, xem &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API DeepSeek V4&lt;/a&gt;. Muốn dùng miễn phí, đọc &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;cách sử dụng DeepSeek V4 miễn phí&lt;/a&gt;. Khi sẵn sàng test thực tế, tải &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để chuẩn bị bộ sưu tập.&lt;/p&gt;

&lt;h2 id="tldr-tóm-tắt"&gt;TL;DR (Tóm tắt)&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Truy cập nhanh nhất: &lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;. Chat web miễn phí, mặc định V4-Pro, ba chế độ suy luận.&lt;/li&gt;
&lt;li&gt;API sản xuất: &lt;code&gt;https://api.deepseek.com/v1/chat/completions&lt;/code&gt;, model &lt;code&gt;deepseek-v4-pro&lt;/code&gt; hoặc &lt;code&gt;deepseek-v4-flash&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Tự host: tải trọng số từ &lt;a href="https://huggingface.co/collections/deepseek-ai/deepseek-v4" rel="noopener noreferrer"&gt;Hugging Face&lt;/a&gt;, chạy script &lt;code&gt;/inference&lt;/code&gt; trong repo.&lt;/li&gt;
&lt;li&gt;Chọn **Non-Think** cho định tuyến/phân loại, **Think High** cho code/phân tích, **Think Max** khi cần độ chính xác tối đa.&lt;/li&gt;
&lt;li&gt;Sampling khuyến nghị: &lt;code&gt;temperature=1.0, top_p=1.0&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Dùng &lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; làm client API; format OpenAI nên có thể dùng lại request với DeepSeek, OpenAI, Anthropic.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-220.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-220.png" alt="" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2 id="chọn-đường-dẫn-phù-hợp-cho-khối-lượng-công-việc-của-bạn"&gt;Chọn đường dẫn phù hợp cho khối lượng công việc của bạn&lt;/h2&gt;

&lt;p&gt;Bốn đường dẫn thực tế, mỗi loại phù hợp từng use case:&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Đường dẫn&lt;/th&gt;
&lt;th&gt;Chi phí&lt;/th&gt;
&lt;th&gt;Thời gian thiết lập&lt;/th&gt;
&lt;th&gt;Tốt nhất cho&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="http://chat.deepseek.com" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Miễn phí&lt;/td&gt;
&lt;td&gt;30 giây&lt;/td&gt;
&lt;td&gt;Kiểm tra nhanh, công việc tạm thời&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;API DeepSeek&lt;/td&gt;
&lt;td&gt;Thanh toán theo token&lt;/td&gt;
&lt;td&gt;5 phút&lt;/td&gt;
&lt;td&gt;Sản xuất, tác nhân, công việc hàng loạt&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;V4-Flash tự host&lt;/td&gt;
&lt;td&gt;Chỉ chi phí phần cứng&lt;/td&gt;
&lt;td&gt;Vài giờ&lt;/td&gt;
&lt;td&gt;Tuân thủ tại chỗ, suy luận offline&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;V4-Pro tự host&lt;/td&gt;
&lt;td&gt;Chỉ chi phí cụm&lt;/td&gt;
&lt;td&gt;Một ngày&lt;/td&gt;
&lt;td&gt;Nghiên cứu, tinh chỉnh tùy chỉnh&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;OpenRouter / aggregator&lt;/td&gt;
&lt;td&gt;Thanh toán theo token&lt;/td&gt;
&lt;td&gt;2 phút&lt;/td&gt;
&lt;td&gt;Dự phòng đa nhà cung cấp&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2 id="đường-dẫn-1-sử-dụng-v4-trong-trò-chuyện-web"&gt;Đường dẫn 1: Sử dụng V4 qua giao diện chat web&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;Truy cập &lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;Đăng nhập bằng email, Google hoặc WeChat.&lt;/li&gt;
&lt;li&gt;Chọn model ở đầu editor: V4-Pro mặc định, chuyển Non-Think / Think High / Think Max tùy tác vụ.&lt;/li&gt;
&lt;li&gt;Bắt đầu chat, upload file nếu cần.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-221.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-221.png" alt="" width="800" height="434"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Chat web hỗ trợ upload file, tìm kiếm web, ngữ cảnh 1 triệu token. Tốt cho: debug, tóm tắt file PDF lớn, so sánh với GPT-5.5/Claude. Không phù hợp cho tự động hóa hoặc phát lại lặp đi lặp lại.&lt;/p&gt;

&lt;h2 id="đường-dẫn-2-sử-dụng-api-deepseek"&gt;Đường dẫn 2: Sử dụng API DeepSeek&lt;/h2&gt;

&lt;p&gt;API DeepSeek tương thích OpenAI, giữ ID model &lt;code&gt;deepseek-v4-pro&lt;/code&gt; và &lt;code&gt;deepseek-v4-flash&lt;/code&gt; sau 24/7/2026.&lt;/p&gt;

&lt;h3 id="lấy-khóa-api"&gt;Lấy khóa API&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;Đăng ký tại &lt;a href="https://platform.deepseek.com/" rel="noopener noreferrer"&gt;platform.deepseek.com&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;Thêm phương thức thanh toán (tối thiểu $2).&lt;/li&gt;
&lt;li&gt;Tạo API Key tại mục &lt;strong&gt;API Keys&lt;/strong&gt;, copy ngay vì chỉ hiển thị một lần.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Xuất khóa cho client:&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;export DEEPSEEK_API_KEY="sk-..."
&lt;/code&gt;&lt;/pre&gt;

&lt;h3 id="yêu-cầu-tối-thiểu-khả-thi"&gt;Yêu cầu tối thiểu khả thi&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "user", "content": "Refactor this Python function to async. Reply with code only."}
    ],
    "thinking_mode": "thinking"
  }'
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Thay &lt;code&gt;deepseek-v4-pro&lt;/code&gt; bằng &lt;code&gt;deepseek-v4-flash&lt;/code&gt; nếu muốn tiết kiệm chi phí. Đổi &lt;code&gt;thinking&lt;/code&gt; thành &lt;code&gt;non-thinking&lt;/code&gt; nếu cần tốc độ.&lt;/p&gt;

&lt;h3 id="client-python"&gt;Client Python&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/v1",
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "You are a concise senior engineer."},
        {"role": "user", "content": "Explain the CSA+HCA hybrid attention stack."},
    ],
    extra_body={"thinking_mode": "thinking_max"},
    temperature=1.0,
    top_p=1.0,
)

print(response.choices[0].message.content)
&lt;/code&gt;&lt;/pre&gt;

&lt;h3 id="client-node"&gt;Client Node&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DEEPSEEK_API_KEY,
  baseURL: "https://api.deepseek.com/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [{ role: "user", content: "Write a fizzbuzz in Rust." }],
  temperature: 1.0,
  top_p: 1.0,
});

console.log(response.choices[0].message.content);
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Xem chi tiết tham số, xử lý lỗi trong &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API DeepSeek V4&lt;/a&gt;.&lt;/p&gt;

&lt;h2 id="đường-dẫn-3-lặp-lại-với-apidog"&gt;Đường dẫn 3: Lặp lại với Apidog&lt;/h2&gt;

&lt;p&gt;Curl tốt cho một lần test, nhưng chạy lại nhiều lần sẽ lãng phí và khó kiểm soát. Apidog giúp bạn lưu, phát lại, so sánh kết quả dễ dàng.&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Tải Apidog cho Mac/Win/Linux từ &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;apidog.com&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;Tạo project API mới, thêm request POST tới &lt;code&gt;https://api.deepseek.com/v1/chat/completions&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Thêm header &lt;code&gt;Authorization: Bearer {{DEEPSEEK_API_KEY}}&lt;/code&gt;, lưu biến môi trường.&lt;/li&gt;
&lt;li&gt;Dán body JSON, lưu lại. Từ đây chỉ cần nhấp để chạy lại, đổi prompt, đổi mode nhanh chóng.&lt;/li&gt;
&lt;li&gt;Dùng viewer tích hợp để so sánh trace giữa Non-Think vs Think Max trên cùng prompt.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Cùng bộ sưu tập có thể chứa request GPT-5.5, Claude, DeepSeek V4 – tiện cho A/B testing, theo dõi chi phí, logs token. Nếu đã dùng Apidog cho API AI khác, chỉ cần đổi base URL là xong.&lt;/p&gt;

&lt;h2 id="đường-dẫn-4-tự-host-v4-flash"&gt;Đường dẫn 4: Tự host V4-Flash&lt;/h2&gt;

&lt;p&gt;Yêu cầu compliance, airgap hoặc chi phí khiến bạn phải tự host? MIT license cho phép bạn làm chủ giải pháp này.&lt;/p&gt;

&lt;h3 id="phần-cứng"&gt;Phần cứng&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;V4-Flash (13B, tổng 284B):&lt;/strong&gt; 2-4 card H100/H200/MI300X FP8. INT4 có thể chạy trên 1 card 80GB.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro (49B, tổng 1.6T):&lt;/strong&gt; Cần cụm 16-32 H100 cho inference sản xuất.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="lấy-trọng-số"&gt;Lấy trọng số&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
  --local-dir ./models/deepseek-v4-flash \
  --local-dir-use-symlinks False
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Tải V4-Flash nặng khoảng 500GB (FP8), V4-Pro vài TB.&lt;/p&gt;

&lt;h3 id="chạy-suy-luận"&gt;Chạy suy luận&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;pip install "vllm&amp;gt;=0.9.0"

vllm serve deepseek-ai/DeepSeek-V4-Flash \
  --tensor-parallel-size 4 \
  --max-model-len 1048576 \
  --dtype auto
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Khi vLLM đã chạy, trỏ client OpenAI đến &lt;code&gt;http://localhost:8000/v1&lt;/code&gt;. Có thể dùng lại collection Apidog, chỉ thay base URL.&lt;/p&gt;

&lt;h2 id="thúc-đẩy-v4-hiệu-quả"&gt;Thúc đẩy V4 hiệu quả&lt;/h2&gt;

&lt;ol&gt;
&lt;li&gt;Luôn chỉ định &lt;code&gt;thinking_mode&lt;/code&gt; (non-thinking/thinking/thinking_max) rõ ràng.&lt;/li&gt;
&lt;li&gt;Lời nhắc hệ thống dùng để định hình tính cách, không nhồi task logic vào system prompt – đặt logic vào user message.&lt;/li&gt;
&lt;li&gt;Bài mã nên kèm test case rõ ràng. Paste đầu ra kiểm thử fail, model sẽ sửa code cho pass dễ hơn.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Với context dài, đặt tài liệu quan trọng ở đầu/cuối input. V4 vẫn có bias về tính gần đây và ưu tiên context đầu/cuối.&lt;/p&gt;

&lt;h2 id="kiểm-soát-chi-phí"&gt;Kiểm soát chi phí&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Mặc định dùng V4-Flash. Chỉ chuyển V4-Pro khi thật sự cần.&lt;/li&gt;
&lt;li&gt;Mặc định Non-Think. Chỉ tăng lên Think High/Max khi cần độ chính xác cao.&lt;/li&gt;
&lt;li&gt;Giới hạn &lt;code&gt;max_tokens&lt;/code&gt;. Output thực tế thường 2.000 tokens, không cần context 1M trong mọi case.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Trong Apidog, dùng biến môi trường cho &lt;code&gt;DEEPSEEK_API_KEY&lt;/code&gt; để tách tài khoản test và production. &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; tự động log số token mỗi response – giúp phát hiện prompt quá dài.&lt;/p&gt;

&lt;h2 id="di-chuyển-từ-deepseek-v3-hoặc-các-mô-hình-khác"&gt;Di chuyển từ DeepSeek V3 hoặc model khác&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Từ &lt;code&gt;deepseek-chat&lt;/code&gt;/&lt;code&gt;deepseek-reasoner&lt;/code&gt;:&lt;/strong&gt; Đổi model thành &lt;code&gt;deepseek-v4-pro&lt;/code&gt; hoặc &lt;code&gt;deepseek-v4-flash&lt;/code&gt; trước 24/7/2026.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Từ OpenAI GPT-5.x:&lt;/strong&gt; Đổi base URL thành &lt;code&gt;https://api.deepseek.com/v1&lt;/code&gt;, giữ format request. Xem &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API GPT-5.5&lt;/a&gt; để song song.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Từ Anthropic Claude:&lt;/strong&gt; Đổi endpoint &lt;code&gt;https://api.deepseek.com/anthropic&lt;/code&gt; hoặc chuyển sang format OpenAI.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="câu-hỏi-thường-gặp"&gt;Câu hỏi thường gặp&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Cần tài khoản trả phí không?&lt;/strong&gt; Chat web miễn phí. API cần nạp tối thiểu $2. Xem &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;cách dùng miễn phí&lt;/a&gt; nếu muốn.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Nên mặc định dùng model nào?&lt;/strong&gt; Bắt đầu với V4-Flash Non-Think, đo chất lượng và chỉ đổi khi cần.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Có thể chạy V4 trên MacBook không?&lt;/strong&gt; V4-Flash chạy trên M3 Max/M4 Max 128GB RAM (INT4) nhưng chậm. V4-Pro không chạy được. Nên dùng API hoặc chat web cho laptop.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4 hỗ trợ tool/function call không?&lt;/strong&gt; Có. Endpoint OpenAI chấp nhận array &lt;code&gt;tools&lt;/code&gt; và trả về &lt;code&gt;tool_calls&lt;/code&gt; chuẩn. Endpoint Anthropic dùng schema tool gốc.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Làm sao truyền tải phản hồi?&lt;/strong&gt; Đặt &lt;code&gt;stream: true&lt;/code&gt; trong body. SSE stream chuẩn OpenAI. Dùng lại lib OpenAI là đủ.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Có rate limit không?&lt;/strong&gt; API host công bố tại &lt;a href="https://api-docs.deepseek.com/" rel="noopener noreferrer"&gt;api-docs.deepseek.com&lt;/a&gt;. Tự host chỉ giới hạn bởi phần cứng.&lt;/li&gt;
&lt;/ul&gt;

</description>
    </item>
    <item>
      <title>DeepSeek V4 Là Gì?</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 04:14:15 +0000</pubDate>
      <link>https://dev.to/sebbasstian/deepseek-v4-la-gi-a1e</link>
      <guid>https://dev.to/sebbasstian/deepseek-v4-la-gi-a1e</guid>
      <description>&lt;p&gt;DeepSeek đã phát hành V4 vào ngày 23 tháng 4 năm 2026, và đây là một bản nâng cấp lớn. Phòng thí nghiệm Hàng Châu công bố đồng thời bốn checkpoint, dẫn đầu là DeepSeek-V4-Pro với 1,6 nghìn tỷ tham số, giấy phép MIT, và cửa sổ ngữ cảnh 1 triệu token. Phiên bản nhỏ hơn, DeepSeek-V4-Flash, có 284 tỷ tham số và ngữ cảnh tương tự. Các điểm chuẩn cho thấy Pro vượt Claude Opus 4.6 trên LiveCodeBench/Codeforces, xấp xỉ GPT-5.4 xHigh trên MMLU-Pro.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Nếu bạn đang cân nhắc chuyển từ Claude, GPT-5.5 hoặc Qwen sang DeepSeek V4, bài viết này sẽ cung cấp tổng quan về mô hình, so sánh với V3.2, chi tiết kiến trúc, các điểm benchmark quan trọng và hướng dẫn thực tiễn triển khai.&lt;/p&gt;

&lt;p&gt;Xem thêm &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API DeepSeek V4&lt;/a&gt;, &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn truy cập miễn phí&lt;/a&gt; và &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn sử dụng DeepSeek V4&lt;/a&gt;. Định dạng request tương thích OpenAI, bạn có thể tạo collection trước trong &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; mà không cần API key.&lt;/p&gt;

&lt;h2&gt;
  
  
  Tóm tắt
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek V4&lt;/strong&gt; là họ mô hình Mixture-of-Experts phát hành 23/4/2026, giấy phép &lt;strong&gt;MIT&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;Ra mắt 4 checkpoint: &lt;strong&gt;V4-Pro&lt;/strong&gt;, &lt;strong&gt;V4-Pro-Base&lt;/strong&gt;, &lt;strong&gt;V4-Flash&lt;/strong&gt;, &lt;strong&gt;V4-Flash-Base&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;V4-Pro:&lt;/strong&gt; 1,6T tham số, 49B hoạt động. &lt;strong&gt;V4-Flash:&lt;/strong&gt; 284B, 13B hoạt động.&lt;/li&gt;
&lt;li&gt;Cửa sổ ngữ cảnh &lt;strong&gt;1M token&lt;/strong&gt;, 3 chế độ suy luận: Non-Think, Think High, Think Max.&lt;/li&gt;
&lt;li&gt;Benchmark nổi bật: &lt;strong&gt;LiveCodeBench 93.5&lt;/strong&gt;, &lt;strong&gt;Codeforces 3206&lt;/strong&gt;, &lt;strong&gt;MMLU-Pro 87.5&lt;/strong&gt; (Pro).&lt;/li&gt;
&lt;li&gt;API tại &lt;code&gt;api.deepseek.com&lt;/code&gt;, model ID: &lt;code&gt;deepseek-v4-pro&lt;/code&gt; và &lt;code&gt;deepseek-v4-flash&lt;/code&gt;; trọng số trên Hugging Face, ModelScope.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  DeepSeek V4 là gì?
&lt;/h2&gt;

&lt;p&gt;DeepSeek V4 kế nhiệm V3/V3.2 với kiến trúc Mixture-of-Experts (MoE) nâng cấp. V4-Pro chỉ kích hoạt 49B/1,6T tham số mỗi token, nên chi phí tính toán tương đương mô hình dense 50B. Tham khảo &lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro" rel="noopener noreferrer"&gt;DeepSeek V4 trên Hugging Face&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpejjjliky55psxexo3l2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fpejjjliky55psxexo3l2.png" alt="DeepSeek V4 architecture" width="800" height="158"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  Bốn checkpoint:
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Pro&lt;/strong&gt;: 1.6T, 49B hoạt động, ngữ cảnh 1M. Gọi qua API.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Pro-Base&lt;/strong&gt;: Pretrain, chưa finetune. Dành cho nghiên cứu/tinh chỉnh.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Flash&lt;/strong&gt;: 284B, 13B hoạt động, ngữ cảnh 1M. Tối ưu độ trễ, chạy được trên 2-3 H100.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;DeepSeek-V4-Flash-Base&lt;/strong&gt;: Pretrain cho Flash.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Tất cả đều MIT license. Khác biệt lớn: V4-Pro trọng số mở, bạn có thể tải về, tùy biến, triển khai không phí bản quyền.&lt;/p&gt;

&lt;h2&gt;
  
  
  Những thay đổi so với V3.2
&lt;/h2&gt;

&lt;p&gt;V4 cải tiến vượt trội về kiến trúc attention và pipeline huấn luyện.&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Khả năng&lt;/th&gt;
&lt;th&gt;V3.2&lt;/th&gt;
&lt;th&gt;V4-Pro&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Tổng tham số&lt;/td&gt;
&lt;td&gt;685B&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;1.6T&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Tham số hoạt động&lt;/td&gt;
&lt;td&gt;37B&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;49B&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Cửa sổ ngữ cảnh&lt;/td&gt;
&lt;td&gt;128K&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;1M&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;FLOPs suy luận (1M)&lt;/td&gt;
&lt;td&gt;Cơ sở&lt;/td&gt;
&lt;td&gt;
&lt;strong&gt;27%&lt;/strong&gt; của V3.2&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;KV-cache (1M)&lt;/td&gt;
&lt;td&gt;Cơ sở&lt;/td&gt;
&lt;td&gt;
&lt;strong&gt;10%&lt;/strong&gt; của V3.2&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Độ chính xác&lt;/td&gt;
&lt;td&gt;FP8&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;FP4 + FP8 hỗn hợp&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Giấy phép&lt;/td&gt;
&lt;td&gt;DeepSeek&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;MIT&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Chế độ suy luận&lt;/td&gt;
&lt;td&gt;Đơn lẻ&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;Ba&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Ba cải tiến chính:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Attention lai&lt;/strong&gt;: Kết hợp Compressed Sparse Attention &amp;amp; Heavily Compressed Attention giúp giảm KV-cache chỉ còn 10%.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Manifold-Constrained Hyper-Connections&lt;/strong&gt;: Ổn định gradient khi tăng chiều sâu mô hình.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tối ưu hóa Muon&lt;/strong&gt;: Tăng tốc hội tụ so với AdamW.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Tập dữ liệu huấn luyện vượt 32 nghìn tỷ token, huấn luyện sau chia 2 giai đoạn: pretrain chuyên gia, rồi policy distillation.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0ohkm6y7q9i5q2swecu2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F0ohkm6y7q9i5q2swecu2.png" alt="DeepSeek V4 training improvements" width="800" height="550"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Điểm chuẩn quan trọng
&lt;/h2&gt;

&lt;p&gt;V4-Pro dẫn đầu về code và kiến thức, còn hạn chế ở truy xuất ngữ cảnh dài.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqn2q9hlfiouvipu8z13b.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fqn2q9hlfiouvipu8z13b.png" alt="DeepSeek V4 benchmark" width="800" height="591"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;V4-Flash: MMLU-Pro 86.2, GPQA Diamond 88.1, LiveCodeBench 91.6, Codeforces 3052, SWE Verified 79.0.&lt;/li&gt;
&lt;li&gt;V4-Pro mạnh nhất cho lập trình tự động, suy luận phức tạp.&lt;/li&gt;
&lt;li&gt;Claude vẫn nhỉnh hơn ở truy xuất 1M token.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Ba chế độ suy luận
&lt;/h2&gt;

&lt;p&gt;Chọn mode phù hợp giúp tối ưu chi phí và chất lượng:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Non-Think&lt;/strong&gt;: Phản hồi nhanh, không sinh chuỗi suy nghĩ. Dùng cho phân loại, định tuyến, tóm tắt ngắn.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Think High&lt;/strong&gt;: Mặc định cho task khó, sinh token suy luận trước khi trả lời, lập kế hoạch tool-call, kiểm tra output.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Think Max&lt;/strong&gt;: Dấu vết suy luận dài, tự phê bình mạnh, khuyến nghị ngữ cảnh ≥ 384K token. Đạt điểm LiveCodeBench cao nhất nhưng tốn token.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Chuyển đổi qua tham số API &lt;code&gt;thinking_mode&lt;/code&gt;. Đề xuất sampling: &lt;code&gt;temperature=1.0, top_p=1.0&lt;/code&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  Kiến trúc đơn giản hoá
&lt;/h2&gt;

&lt;p&gt;Ba yếu tố then chốt:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Attention lai&lt;/strong&gt;: Hầu hết layer dùng Compressed Sparse Attention, một số ít layer dùng Heavily Compressed Attention để tối ưu chi phí ở 1M token.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Manifold-Constrained Hyper-Connections&lt;/strong&gt;: Kiểm soát residual để tránh hỗn loạn gradient khi stack nhiều layer.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Muon optimizer&lt;/strong&gt;: Thay AdamW, hội tụ nhanh hơn cho MoE.&lt;/li&gt;
&lt;/ol&gt;

&lt;h2&gt;
  
  
  Khả năng triển khai thực tế
&lt;/h2&gt;

&lt;p&gt;Ảnh chụp nhanh (24/4/2026):&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Nền tảng&lt;/th&gt;
&lt;th&gt;Truy cập&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;&lt;/td&gt;
&lt;td&gt;Chat web miễn phí, V4-Pro mặc định, cần đăng nhập&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;API DeepSeek&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;api.deepseek.com&lt;/code&gt; với model ID &lt;code&gt;deepseek-v4-pro&lt;/code&gt; và &lt;code&gt;deepseek-v4-flash&lt;/code&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Trọng số Hugging Face&lt;/td&gt;
&lt;td&gt;
&lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro" rel="noopener noreferrer"&gt;V4-Pro&lt;/a&gt;, &lt;a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash" rel="noopener noreferrer"&gt;V4-Flash&lt;/a&gt;
&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;ModelScope&lt;/td&gt;
&lt;td&gt;Bản sao trọng số cho người dùng tại Trung Quốc&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;OpenRouter &amp;amp; aggregator&lt;/td&gt;
&lt;td&gt;Sắp có&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;
&lt;code&gt;deepseek-chat&lt;/code&gt;/&lt;code&gt;reasoner&lt;/code&gt;
&lt;/td&gt;
&lt;td&gt;Ngừng hỗ trợ từ 24/7/2026&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;&lt;strong&gt;Lưu ý:&lt;/strong&gt; Nếu còn dùng &lt;code&gt;deepseek-chat&lt;/code&gt;, cần chuyển sang &lt;code&gt;deepseek-v4-pro&lt;/code&gt; hoặc &lt;code&gt;deepseek-v4-flash&lt;/code&gt; trong vòng 3 tháng.&lt;/p&gt;

&lt;h2&gt;
  
  
  So sánh với GPT-5.5 &amp;amp; Claude
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Chi phí:&lt;/strong&gt; V4-Pro/V4-Flash trọng số mở, tự host tiết kiệm hơn GPT-5.5/Claude (đều đóng).&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Lập trình:&lt;/strong&gt; V4-Pro 93.5 LiveCodeBench, 3206 Codeforces, vượt GPT-5.5/Claude.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Kiến thức:&lt;/strong&gt; Gemini 3.1 Pro dẫn đầu MMLU-Pro. V4-Pro ngang GPT-5.5, hơn Claude trên SimpleQA-Verified.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Truy xuất dài:&lt;/strong&gt; Claude Opus vẫn mạnh nhất.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Giấy phép:&lt;/strong&gt; MIT cho phép tích hợp sản phẩm thương mại dễ dàng.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Ứng dụng thực tiễn
&lt;/h2&gt;

&lt;h3&gt;
  
  
  Nên dùng V4 cho:
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Agentic coding loops:&lt;/strong&gt; Gỡ lỗi đa tệp, refactor, sửa lỗi tự động. Kết hợp với &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để kiểm thử API request/response khi tinh chỉnh prompt.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Suy luận tài liệu dài:&lt;/strong&gt; 1M token phù hợp monorepo, hợp đồng lớn, dataset nghiên cứu. Chọn Think High.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Sản phẩm AI tự lưu trữ:&lt;/strong&gt; V4-Flash là mô hình mở đầu tiên cạnh tranh chất lượng với API đóng.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Nghiên cứu &amp;amp; tinh chỉnh:&lt;/strong&gt; Dùng các checkpoint Base + dữ liệu riêng để tạo model chuyên biệt.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;Không phù hợp:&lt;/strong&gt; Phân loại số lượng lớn, truy xuất embedding, chat prompt ngắn (V4-Flash vẫn quá mạnh, dùng V3.2 hiệu quả hơn).&lt;/p&gt;

&lt;h2&gt;
  
  
  Giá cả
&lt;/h2&gt;

&lt;p&gt;Chưa có giá API chính thức. V3.2: ~$0.28/triệu token input, ~$0.42/triệu token output. Dự kiến V4-Flash ngang giá, V4-Pro cao hơn nhẹ. Đối thủ đóng: $5–15/triệu token input. Theo dõi cập nhật tại &lt;a href="https://api-docs.deepseek.com/" rel="noopener noreferrer"&gt;trang giá DeepSeek&lt;/a&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  Cách thử nghiệm V4 ngay
&lt;/h2&gt;

&lt;p&gt;Ba cách, ưu tiên tốc độ nhận token đầu tiên:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Chat web:&lt;/strong&gt; Truy cập &lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;, đăng nhập, mặc định V4-Pro, chuyển Think High trong UI. Miễn phí, không cần thẻ.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;API:&lt;/strong&gt; Lấy API key, trỏ client tới &lt;code&gt;https://api.deepseek.com&lt;/code&gt;, set &lt;code&gt;"model": "deepseek-v4-pro"&lt;/code&gt;. Request format tương thích OpenAI. Xem &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API DeepSeek V4&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Trọng số local:&lt;/strong&gt; Tải từ Hugging Face hoặc ModelScope. V4-Flash chạy 2–4 H100; V4-Pro cần cluster lớn. Code inference trong &lt;code&gt;/inference&lt;/code&gt; của repo model.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Để có hướng dẫn chi tiết về prompt engineering với Apidog, xem &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;cách sử dụng DeepSeek V4&lt;/a&gt;. Muốn dùng miễn phí, xem &lt;a href="http://apidog.com/blog/how-to-use-deepseek-v4-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn DeepSeek V4 miễn phí&lt;/a&gt;. &lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Tải Apidog&lt;/a&gt; và tạo trước collection; định dạng OpenAI giúp một request chạy được trên DeepSeek, OpenAI, v.v.&lt;/p&gt;

&lt;h2&gt;
  
  
  Câu hỏi thường gặp
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;DeepSeek V4 có thực sự mã nguồn mở không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. Bốn checkpoint MIT, dùng thương mại/tùy biến/phân phối lại không cần xin phép.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Chạy V4-Flash cần cụm GPU mạnh không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Cần 2–4 H100/H200 cho V4-Flash full precision, ít hơn nếu lượng tử hóa. V4-Pro cần cluster lớn. Nếu không có GPU, hãy dùng API hoặc &lt;a href="https://chat.deepseek.com/" rel="noopener noreferrer"&gt;chat.deepseek.com&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;API DeepSeek đã hỗ trợ V4 chưa?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Đã hoạt động từ 23/4/2026. Model ID: &lt;code&gt;deepseek-v4-pro&lt;/code&gt;, &lt;code&gt;deepseek-v4-flash&lt;/code&gt;. &lt;code&gt;deepseek-chat&lt;/code&gt; và &lt;code&gt;deepseek-reasoner&lt;/code&gt; ngừng từ 24/7/2026.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;V4 so với Kimi, Qwen thế nào?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
V4-Pro điểm LiveCodeBench/Codeforces cao hơn Kimi K2, Qwen 3 Max. Cả ba đều MoE, trọng số mở, triển khai tương tự. Chọn theo benchmark phù hợp workload.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có thể tinh chỉnh V4 không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. Dùng checkpoint Base + dữ liệu bạn, pipeline SFT tiêu chuẩn. MIT license cho phép phân phối thương mại.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;V4 dùng được với công cụ OpenAI cũ không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. API nhận định dạng OpenAI, Anthropic tại &lt;code&gt;https://api.deepseek.com&lt;/code&gt; và &lt;code&gt;https://api.deepseek.com/anthropic&lt;/code&gt;. Hầu hết client OpenAI chỉ cần đổi base URL. Xem &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API GPT-5.5&lt;/a&gt; để biết mẫu code.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Bảng Giá GPT-5.5: Chi Tiết API, Codex và Chi Phí ChatGPT (Tháng 4/2026)</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 02:30:25 +0000</pubDate>
      <link>https://dev.to/sebbasstian/bang-gia-gpt-55-chi-tiet-api-codex-va-chi-phi-chatgpt-thang-42026-4hkn</link>
      <guid>https://dev.to/sebbasstian/bang-gia-gpt-55-chi-tiet-api-codex-va-chi-phi-chatgpt-thang-42026-4hkn</guid>
      <description>&lt;p&gt;OpenAI đã tăng gấp đôi giá mỗi token trên dòng GPT-5 với việc phát hành GPT-5.5 vào ngày 23/4/2026. Giá đầu vào tăng từ 2,50 USD lên 5,00 USD cho mỗi triệu token, đầu ra tăng từ 15,00 USD lên 30,00 USD mỗi triệu. Giá Pro vẫn giữ nguyên ở mức 30/180 USD. Đó là tiêu đề chính; các chi tiết là nơi ẩn chứa chi phí thực tế.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Bài viết này hướng dẫn chi tiết cách tính chi phí và các phương án triển khai thực tế: từ giá API chuẩn, Batch, Flex, Priority, đến giá Pro, giới hạn Codex và cách dự toán chi phí cho khối lượng công việc thực tế trước khi chuyển đổi mô hình.&lt;/p&gt;

&lt;p&gt;Tham khảo tổng quan mô hình tại &lt;a href="http://apidog.com/blog/what-is-gpt-5-5?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5 là gì&lt;/a&gt;. Hướng dẫn dành cho developer: &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cách sử dụng API GPT-5.5&lt;/a&gt;.&lt;/p&gt;

&lt;h2 id="tóm-tắt"&gt;Tóm tắt&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Dịch vụ&lt;/th&gt;
&lt;th&gt;Đầu vào / Triệu&lt;/th&gt;
&lt;th&gt;Đầu ra / Triệu&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;API tiêu chuẩn GPT-5.5&lt;/td&gt;
&lt;td&gt;$5.00&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;API GPT-5.5 Pro&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;td&gt;$180.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Batch (giảm 50%)&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Flex (giảm 50%)&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Priority (gấp 2,5 lần)&lt;/td&gt;
&lt;td&gt;$12.50&lt;/td&gt;
&lt;td&gt;$75.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;API tiêu chuẩn GPT-5.4&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;API GPT-5.4-mini&lt;/td&gt;
&lt;td&gt;$0.25&lt;/td&gt;
&lt;td&gt;$2.00&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;GPT-5.5 có giá gấp đôi GPT-5.4 ở cấp token, nhưng OpenAI tuyên bố hiệu quả tăng ~20% khi tính đến hiệu quả sử dụng token.&lt;/p&gt;

&lt;h2 id="các-con-số-chính"&gt;Các con số chính&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;GPT-5.5&lt;/strong&gt;: $5.00/m triệu token đầu vào, $30.00/m triệu token đầu ra.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;GPT-5.5 Pro&lt;/strong&gt;: $30.00/m triệu đầu vào, $180.00/m triệu đầu ra.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Cửa sổ ngữ cảnh&lt;/strong&gt;: 1 triệu token trên cả hai biến thể. Token suy luận tính vào hóa đơn đầu ra.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="batch-flex-và-priority"&gt;Batch, Flex và Priority&lt;/h2&gt;

&lt;p&gt;OpenAI cung cấp 3 cấp độ giá ngoài chuẩn giúp bạn chủ động kiểm soát chi phí và tốc độ.&lt;/p&gt;

&lt;h3 id="api-batch"&gt;API Batch&lt;/h3&gt;

&lt;p&gt;
Gửi request qua endpoint Batch, bạn được giảm 50% giá tiêu chuẩn, hoàn thành dưới 24h. Batch rất phù hợp cho:
&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Chạy batch đánh giá trên toàn bộ dataset&lt;/li&gt;
&lt;li&gt;Bổ sung hoặc xử lý lại dữ liệu lịch sử&lt;/li&gt;
&lt;li&gt;Quy trình off-line, độ trễ hàng giờ không ảnh hưởng&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;
Với giá này, GPT-5.5 ngang giá GPT-5.4. Hãy cân nhắc batch cho mọi tác vụ không cần realtime.
&lt;/p&gt;

&lt;h3 id="xử-lý-flex"&gt;Xử lý Flex&lt;/h3&gt;

&lt;p&gt;Flex cũng giảm 50% chi phí, thời gian phản hồi thay đổi từ vài giây đến vài phút tùy tải. Dùng Flex khi chấp nhận được biến động latency và muốn giá rẻ gần như Batch cho trải nghiệm gần realtime.&lt;/p&gt;

&lt;h3 id="xử-lý-ưu-tiên"&gt;Xử lý ưu tiên&lt;/h3&gt;

&lt;p&gt;Priority giá gấp 2,5 lần chuẩn (12,50 USD / 75,00 USD mỗi triệu token trên GPT-5.5), mang lại thông lượng và rate limit cao, độ trễ gần bằng 0. Dùng cho các tính năng user-facing realtime đòi hỏi tốc độ phản hồi cao.&lt;/p&gt;

&lt;h2 id="tính-toán-chi-phí-chế-độ-suy-nghĩ"&gt;Tính toán chi phí chế độ suy nghĩ (Thinking mode)&lt;/h2&gt;

&lt;p&gt;
Chế độ suy nghĩ (GPT-5.5 Thinking, dùng &lt;code&gt;reasoning.effort&lt;/code&gt; cao hơn) không tăng giá mỗi token, nhưng tăng số token sử dụng trên mỗi request. Hệ số nhân tùy nỗ lực:
&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Nỗ lực&lt;/th&gt;
&lt;th&gt;Hệ số token đầu ra&lt;/th&gt;
&lt;th&gt;Khi nào nên dùng&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;
&lt;code&gt;thấp&lt;/code&gt; (mặc định)&lt;/td&gt;
&lt;td&gt;1×&lt;/td&gt;
&lt;td&gt;Đa số use case thông thường&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;trung bình&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;1.3–2×&lt;/td&gt;
&lt;td&gt;Mã hóa multi-step, content có cấu trúc&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;cao&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;2–4×&lt;/td&gt;
&lt;td&gt;Nghiên cứu chuyên sâu, yêu cầu độ chính xác&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;code&gt;rất cao&lt;/code&gt;&lt;/td&gt;
&lt;td&gt;3–8×&lt;/td&gt;
&lt;td&gt;Agent loop, chuỗi tool, lập kế hoạch chi tiết&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;
Ví dụ: 1 call &lt;code&gt;xhigh&lt;/code&gt; với prompt dài có thể dùng 20k token suy luận. Với giá $30/m triệu token, chỉ riêng phần này đã tốn $0.60, chưa kể token đầu ra.
&lt;/p&gt;

&lt;p&gt;
Lập ngân sách theo workload, không theo từng request lẻ.
&lt;/p&gt;

&lt;h2 id="giá-codex"&gt;Giá Codex&lt;/h2&gt;

&lt;p&gt;
Codex gắn với các gói ChatGPT, không tính phí từng token. Ngày 23/4/2026, cấu trúc như sau:
&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Gói&lt;/th&gt;
&lt;th&gt;Truy cập Codex&lt;/th&gt;
&lt;th&gt;GPT-5.5&lt;/th&gt;
&lt;th&gt;Ghi chú&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Miễn phí&lt;/td&gt;
&lt;td&gt;Có (giới hạn thời gian)&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Giới hạn weekly&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Go&lt;/td&gt;
&lt;td&gt;Có (giới hạn thời gian)&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Gấp đôi Free&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Plus ($20/tháng)&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Giới hạn tiêu chuẩn&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Pro ($200/tháng)&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Có + Thinking + Pro (trong ChatGPT)&lt;/td&gt;
&lt;td&gt;Giới hạn cao nhất/user&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Business&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Tính theo seat&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Doanh nghiệp/Giáo dục&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Hợp đồng riêng&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;
Nếu bạn làm việc nhiều trên terminal với Codex, Plus/Pro là cách rẻ nhất để chạy GPT-5.5 - đặc biệt khi vượt vài trăm nghìn token/ngày. Xem &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-free-codex?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn về con đường miễn phí&lt;/a&gt; để tận dụng tối đa.
&lt;/p&gt;

&lt;h2 id="so-sánh-gpt-55-với-các-phien-bản-còn-lại"&gt;So sánh: GPT-5.5 và các phiên bản còn lại&lt;/h2&gt;

&lt;p&gt;
Khi nào nên trả tiền cho GPT-5.5, khi nào nên giữ GPT-5.4 hoặc GPT-5.4-mini? Tính toán chi phí dựa vào mức độ phức tạp và khối lượng đầu ra.
&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Mô hình&lt;/th&gt;
&lt;th&gt;Đầu vào / Triệu&lt;/th&gt;
&lt;th&gt;Đầu ra / Triệu&lt;/th&gt;
&lt;th&gt;Chi phí cho 1k token đầu ra&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.4-mini&lt;/td&gt;
&lt;td&gt;$0.25&lt;/td&gt;
&lt;td&gt;$2.00&lt;/td&gt;
&lt;td&gt;$0.0020&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.4&lt;/td&gt;
&lt;td&gt;$2.50&lt;/td&gt;
&lt;td&gt;$15.00&lt;/td&gt;
&lt;td&gt;$0.0150&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5&lt;/td&gt;
&lt;td&gt;$5.00&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;td&gt;$0.0300&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GPT-5.5 Pro&lt;/td&gt;
&lt;td&gt;$30.00&lt;/td&gt;
&lt;td&gt;$180.00&lt;/td&gt;
&lt;td&gt;$0.1800&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;ul&gt;
&lt;li&gt;Đầu ra lớn, rủi ro thấp (phân loại, tóm tắt, chat đơn giản): &lt;strong&gt;GPT-5.4-mini&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;Khối lượng sản xuất, 5.4 đáp ứng chất lượng: &lt;strong&gt;GPT-5.4&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;Mã hóa phức tạp, agent multi-step, nghiên cứu sâu: &lt;strong&gt;GPT-5.5&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;Yêu cầu cực cao về độ chính xác: &lt;strong&gt;GPT-5.5 Pro&lt;/strong&gt;.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="ví-dụ-thực-tế-chi-phí-tác-nhân-mã-hóa"&gt;Ví dụ thực tế: chi phí agent mã hóa mỗi tác vụ&lt;/h2&gt;

&lt;p&gt;
Một phiên agent thông qua API GPT-5.5 với &lt;code&gt;reasoning.effort: "medium"&lt;/code&gt;:
&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Token đầu vào/tác vụ (context + prompt): ~15,000&lt;/li&gt;
&lt;li&gt;Token đầu ra/tác vụ (code + giải thích): ~3,000&lt;/li&gt;
&lt;li&gt;Token suy luận/tác vụ (medium): ~6,000&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;
Chi phí/tác vụ với giá chuẩn:
&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Đầu vào: 15k × $5.00/m = $0.075&lt;/li&gt;
&lt;li&gt;Đầu ra: (3k+6k) × $30.00/m = $0.27&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Tổng: $0.345/tác vụ mã hóa hoàn thành&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;
Chạy cùng workload trên GPT-5.4:
&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Đầu vào: 15k × $2.50/m = $0.0375&lt;/li&gt;
&lt;li&gt;Đầu ra: 9k × $15.00/m = $0.135&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Tổng: $0.1725/tác vụ&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;
GPT-5.5 đắt gấp 2 lần/tác vụ với cùng mức effort. Việc nâng cấp chỉ hợp lý khi hiệu năng (SWE-bench 88,7% vs ~74%) giúp hoàn thành nhiều tác vụ hơn mà không phải làm lại thủ công.
&lt;/p&gt;

&lt;h2 id="kiểm-soát-chi-phí"&gt;Các biện pháp kiểm soát chi phí nên áp dụng từ đầu&lt;/h2&gt;

&lt;p&gt;
5 đòn bẩy giúp kiểm soát bill GPT-5.5:
&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Giới hạn cứng &lt;code&gt;max_output_tokens&lt;/code&gt;&lt;/strong&gt; cho mọi call. Mặc định 2.000, tăng nếu thật sự cần đầu ra dài.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;JSON schema nghiêm ngặt.&lt;/strong&gt; Output lỗi phải retry, retry là 1 call tính phí đầy đủ.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Routing theo độ khó.&lt;/strong&gt; Request dễ giao cho GPT-5.4-mini, khó mới giao GPT-5.5. 10 dòng code routing tiết kiệm hơn tối ưu prompt.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Batch cho mọi tác vụ offline.&lt;/strong&gt; Đánh giá, dữ liệu, report ban đêm đều giảm 50% giá.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Theo dõi &lt;code&gt;usage.reasoning_tokens&lt;/code&gt;&lt;/strong&gt;. Bill bất ngờ thường do token suy luận ở effort cao. Nên đặt cảnh báo usage bất thường.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="ước-tính-chi-phí-hàng-tháng-theo-gói"&gt;Ước tính chi phí hàng tháng theo gói&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Gói&lt;/th&gt;
&lt;th&gt;Giá hàng tháng&lt;/th&gt;
&lt;th&gt;Phù hợp nhất&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Miễn phí&lt;/td&gt;
&lt;td&gt;$0&lt;/td&gt;
&lt;td&gt;Dùng thử GPT-5.5 với Codex trước khi commit&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Go&lt;/td&gt;
&lt;td&gt;$4/tháng&lt;/td&gt;
&lt;td&gt;Học sinh, sinh viên, người dùng ít&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Plus&lt;/td&gt;
&lt;td&gt;$20/tháng&lt;/td&gt;
&lt;td&gt;Dev cá nhân dùng Codex + ChatGPT hàng ngày&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Pro&lt;/td&gt;
&lt;td&gt;$200/tháng&lt;/td&gt;
&lt;td&gt;Power user cần Thinking &amp;amp; Pro trên ChatGPT&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Business&lt;/td&gt;
&lt;td&gt;$25/seat/tháng&lt;/td&gt;
&lt;td&gt;Nhóm cần workspace chung&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Doanh nghiệp/Giáo dục&lt;/td&gt;
&lt;td&gt;Tùy chỉnh&lt;/td&gt;
&lt;td&gt;Hợp đồng riêng, có SLA&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;
Nếu chạy &amp;gt;4 triệu token đầu ra/tháng qua API, gói Pro + Codex CLI sẽ rẻ hơn trả phí từng token, miễn là workload nằm trong context window 400k token của CLI.
&lt;/p&gt;

&lt;h2 id="tín-hiệu-thay-đổi-giá-cần-theo-dõi"&gt;Tín hiệu thay đổi giá cần theo dõi&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;GA (General Availability) API GPT-5.5&lt;/strong&gt;: Giá có thể giảm khi cạnh tranh với Anthropic, Gemini, các mô hình open source trên &lt;a href="https://www.vellum.ai/llm-leaderboard" rel="noopener noreferrer"&gt;bảng xếp hạng Vellum&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Dân chủ hóa Pro&lt;/strong&gt;: OpenAI thường hạ giá gói Pro sau 3–6 tháng. Không nên mặc định giá 30/180 USD là cố định mãi mãi.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="câu-hỏi-thường-gặp"&gt;Câu hỏi thường gặp&lt;/h2&gt;

&lt;p&gt;
&lt;strong&gt;Lưu cache có giảm chi phí đầu vào không?&lt;/strong&gt; Có. Token đầu vào cache trên GPT-5.5 tính phí thấp hơn nhiều so với chuẩn; &lt;a href="https://openai.com/api/pricing/" rel="noopener noreferrer"&gt;trang giá OpenAI&lt;/a&gt; có hệ số cụ thể. Cache mọi thứ tái sử dụng được (prompt system, schema tool, context repo).
&lt;/p&gt;

&lt;p&gt;
&lt;strong&gt;Có chiết khấu số lượng lớn không?&lt;/strong&gt; Chưa công bố. Doanh nghiệp lớn ký hợp đồng riêng, OpenAI điều chỉnh giá nếu usage lớn. Liên hệ sales nếu annual spending &amp;gt;1 triệu USD.
&lt;/p&gt;

&lt;p&gt;
&lt;strong&gt;Chế độ suy nghĩ có tốn thêm chi phí ngoài giá token?&lt;/strong&gt; Không. Tốn vì dùng nhiều token hơn, không phải do giá token khác.
&lt;/p&gt;

&lt;p&gt;
&lt;strong&gt;Sử dụng Codex CLI có tính phí riêng với API không?&lt;/strong&gt; Chỉ khi đăng nhập bằng API key. Đăng nhập ChatGPT tính vào gói, còn API key tính usage riêng.
&lt;/p&gt;

&lt;p&gt;
&lt;strong&gt;Cách rẻ nhất để dùng thử GPT-5.5?&lt;/strong&gt; Gói Free/Go + Codex CLI. Xem &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn con đường miễn phí&lt;/a&gt; để biết các lựa chọn không tốn phí.
&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Cách sử dụng GPT-5.5 miễn phí với Codex</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 02:28:56 +0000</pubDate>
      <link>https://dev.to/sebbasstian/cach-su-dung-gpt-55-mien-phi-voi-codex-4phh</link>
      <guid>https://dev.to/sebbasstian/cach-su-dung-gpt-55-mien-phi-voi-codex-4phh</guid>
      <description>&lt;p&gt;OpenAI đã phát hành GPT-5.5 vào ngày 23 tháng 4 năm 2026 và, trong đợt ra mắt này, Codex đã được triển khai cho mọi gói ChatGPT, bao gồm cả gói Miễn phí và Go trong thời gian giới hạn. Đây là cách nhanh và miễn phí nhất để trải nghiệm mô hình mới: cài đặt Codex CLI, đăng nhập bằng tài khoản ChatGPT và dùng GPT-5.5 ngay trên terminal mà không cần khóa API hay thẻ tín dụng.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Hướng dẫn dưới đây tập trung vào các bước cài đặt, xác thực, chuyển đổi mô hình, quản lý hạn mức, và tích hợp Codex vào quy trình dev thực tế. Để nắm tổng quan về mô hình, xem &lt;a href="http://apidog.com/blog/what-is-gpt-5-5?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;GPT-5.5 là gì&lt;/a&gt;. Các phương án miễn phí khác (tín dụng thử, công cụ tổng hợp) được liệt kê trong &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api-for-free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn sử dụng GPT-5.5 miễn phí&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;&amp;lt;!--kg-card-begin: html--&amp;gt;&lt;/p&gt;
&lt;br&gt;
        &lt;br&gt;
        &lt;br&gt;
    &amp;lt;!--kg-card-end: html--&amp;gt;
&lt;h2&gt;
  
  
  Tóm tắt
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Codex CLI chạy GPT-5.5 trực tiếp trên repository cục bộ, với cửa sổ ngữ cảnh 400K.&lt;/li&gt;
&lt;li&gt;Tất cả các gói ChatGPT &lt;strong&gt;Miễn phí, Go, Plus, Pro, Business, Enterprise, Edu&lt;/strong&gt; đều truy cập Codex; Miễn phí và Go chỉ có trong &lt;strong&gt;thời gian giới hạn&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;Cài đặt qua &lt;code&gt;npm install -g @openai/codex&lt;/code&gt; hoặc &lt;code&gt;brew install codex&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Đăng nhập với ChatGPT OAuth (trình duyệt) hoặc mã thiết bị (máy chủ không giao diện đồ họa).&lt;/li&gt;
&lt;li&gt;Chuyển đổi mô hình qua &lt;code&gt;/model gpt-5.5&lt;/code&gt;; kiểm tra hạn ngạch bằng &lt;code&gt;/status&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Kết hợp CLI với &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để chuẩn hóa, kiểm thử và triển khai các lệnh gọi API.&lt;/li&gt;
&lt;/ul&gt;
&lt;h2&gt;
  
  
  Tại sao Codex là cách tiếp cận miễn phí dễ dàng nhất
&lt;/h2&gt;

&lt;p&gt;OpenAI API mặc định chỉ dành cho người dùng trả phí; GPT-5.5 trên endpoint Responses có giá $5/triệu token đầu vào và $30/triệu token đầu ra khi public. Codex đóng gói mô hình này vào CLI xác thực bằng tài khoản ChatGPT thay vì khóa API. Gói dịch vụ sẽ quyết định hạn mức—mô hình bên dưới vẫn là GPT-5.5 thực.&lt;/p&gt;

&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-214.png" alt="" width="1911" height="1149"&gt;
&lt;h2&gt;
  
  
  Cài đặt Codex CLI
&lt;/h2&gt;

&lt;p&gt;Có 2 cách cài đặt chính:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="c"&gt;# npm (cross-platform)&lt;/span&gt;
npm &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-g&lt;/span&gt; @openai/codex

&lt;span class="c"&gt;# hoặc Homebrew (macOS / Linux)&lt;/span&gt;
brew &lt;span class="nb"&gt;install &lt;/span&gt;codex
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Kiểm tra cài đặt:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;codex &lt;span class="nt"&gt;--version&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Phiên bản phải &amp;gt;= &lt;code&gt;0.28.0&lt;/code&gt; để hỗ trợ GPT-5.5.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-216.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fassets.apidog.com%2Fblog-next%2F2026%2F04%2Fimage-216.png" alt="" width="1960" height="1044"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Xác thực bằng tài khoản ChatGPT
&lt;/h2&gt;

&lt;p&gt;Chạy CLI lần đầu sẽ yêu cầu đăng nhập.&lt;/p&gt;

&lt;h3&gt;
  
  
  OAuth trình duyệt (máy cục bộ)
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;codex
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Một tab trình duyệt mở ra, đăng nhập với email ChatGPT. CLI lưu phiên làm việc, các lần sau không cần lặp lại.&lt;/p&gt;

&lt;h3&gt;
  
  
  Mã thiết bị (máy chủ không giao diện đồ họa)
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;codex login &lt;span class="nt"&gt;--device-auth&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Copy mã hiển thị, mở URL trên thiết bị khác, dán mã và xác nhận.&lt;/p&gt;

&lt;h3&gt;
  
  
  Sử dụng khóa API (tùy chọn)
&lt;/h3&gt;

&lt;p&gt;Nếu có khóa API trả phí:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;printenv &lt;/span&gt;OPENAI_API_KEY | codex login &lt;span class="nt"&gt;--with-api-key&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Cách này phí sử dụng sẽ tính vào tài khoản API, không phải ChatGPT.&lt;/p&gt;

&lt;h2&gt;
  
  
  Chọn GPT-5.5 làm mô hình
&lt;/h2&gt;

&lt;p&gt;Codex mặc định dùng mô hình "recommended" cho gói; với gói miễn phí/Go có thể cần chuyển thủ công.&lt;/p&gt;

&lt;h3&gt;
  
  
  Trong phiên làm việc
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;/model gpt-5.5
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Khởi chạy với flag
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;codex &lt;span class="nt"&gt;--model&lt;/span&gt; gpt-5.5
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Kiểm tra hạn ngạch
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;/status
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Xem ngân sách tin nhắn, cửa sổ ngữ cảnh, thời gian hết hạn dùng thử.&lt;/p&gt;

&lt;h2&gt;
  
  
  Phiên đầu tiên: ví dụ thực tế
&lt;/h2&gt;

&lt;p&gt;Ví dụ sử dụng thực tế:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="nb"&gt;cd&lt;/span&gt; ~/Projects/my-app
codex &lt;span class="nt"&gt;--model&lt;/span&gt; gpt-5.5
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Trong CLI, thử:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight markdown"&gt;&lt;code&gt;&lt;span class="gt"&gt;&amp;gt; Read README.md, then open scripts/deploy.sh and summarize what it does in five bullets.&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Codex sẽ mở file, tóm tắt nội dung. Tiếp theo:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="o"&gt;&amp;gt;&lt;/span&gt; Refactor deploy.sh so it exits on any failed step, and add a dry-run flag. Keep backwards compatibility.
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Sau khi model đề xuất diff, bạn phê duyệt. Có thể chạy kiểm thử ngay:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;&lt;span class="o"&gt;&amp;gt;&lt;/span&gt; Run the deploy &lt;span class="nb"&gt;test &lt;/span&gt;suite and show me the failing &lt;span class="k"&gt;case&lt;/span&gt;&lt;span class="nb"&gt;.&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;CLI trả về output kiểm thử; tiếp tục fix với GPT-5.5 cho đến khi pass.&lt;/p&gt;

&lt;p&gt;OpenAI báo cáo điểm SWE-bench của GPT-5.5 đạt 88,7% (so với 74% của GPT-5.4), cải thiện rõ ở các tác vụ đa tệp và automation.&lt;/p&gt;

&lt;h2&gt;
  
  
  Điểm mạnh của Codex so với gọi API thô
&lt;/h2&gt;

&lt;p&gt;CLI Codex mang lại:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Ngữ cảnh repo:&lt;/strong&gt; Đọc cây tệp, index các file liên quan, truyền vào model mà không cần copy-paste.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Thực thi lệnh có phê duyệt:&lt;/strong&gt; Model đề xuất, bạn duyệt trước khi chạy, tránh rủi ro shell.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Xem trước diff:&lt;/strong&gt; Mọi edit file đều hiển thị diff để chấp nhận/từ chối/sửa.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Lưu lịch sử phiên:&lt;/strong&gt; Quay lại CLI sau vẫn giữ ngữ cảnh cũ.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Nếu dùng API thuần, bạn phải tự xây lại từng tính năng trên. &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Hướng dẫn API GPT-5.5&lt;/a&gt; có ví dụ, nhưng để dev hàng ngày, CLI hiệu quả hơn.&lt;/p&gt;

&lt;h2&gt;
  
  
  Giới hạn tốc độ và hạn mức theo gói
&lt;/h2&gt;

&lt;p&gt;Bảng hạn mức tính đến 23/4/2026:&lt;/p&gt;

&lt;p&gt;&amp;lt;!--kg-card-begin: html--&amp;gt;&lt;/p&gt;
&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;br&gt;
&lt;thead&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;th&gt;Gói&lt;/th&gt;
&lt;br&gt;
&lt;th&gt;Truy cập GPT-5.5 trong Codex&lt;/th&gt;
&lt;br&gt;
&lt;th&gt;Hạn mức hàng tuần&lt;/th&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;/thead&gt;
&lt;br&gt;
&lt;tbody&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;Miễn phí&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Có (thời gian giới hạn)&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Chặt chẽ; kích thước nguyên mẫu&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;Go&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Có (thời gian giới hạn), gấp 2 lần giới hạn gói Miễn phí&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Nhỏ&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;Plus&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Trung bình&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;Pro&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Có, hạn mức cao nhất cho người dùng cá nhân&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Cao&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;Business&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Có, dựa trên số chỗ&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Cao cho mỗi chỗ&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;tr&gt;
&lt;br&gt;
&lt;td&gt;Doanh nghiệp / Giáo dục&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Có, dựa trên hợp đồng&lt;/td&gt;
&lt;br&gt;
&lt;td&gt;Tùy chỉnh&lt;/td&gt;
&lt;br&gt;
&lt;/tr&gt;
&lt;br&gt;
&lt;/tbody&gt;
&lt;br&gt;
&lt;/table&gt;&lt;/div&gt;&amp;lt;!--kg-card-end: html--&amp;gt;

&lt;p&gt;Khi chạm hạn mức, Codex sẽ báo lỗi cụ thể. Sử dụng &lt;code&gt;/status&lt;/code&gt; để kiểm tra số lượng còn lại.&lt;/p&gt;

&lt;h2&gt;
  
  
  Tích hợp với Editor và IDE
&lt;/h2&gt;

&lt;p&gt;Tên đăng nhập Codex dùng chung cho extension VS Code, plugin JetBrains, app Cloud Codex. Sau khi login CLI, extension IDE sẽ tự nhận session, không cần đăng nhập lại.&lt;/p&gt;

&lt;p&gt;Workflow kết hợp với Apidog:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Tạo prototype request trong Codex CLI (prompt GPT-5.5 trên file).&lt;/li&gt;
&lt;li&gt;Xuất prompt &amp;amp; output có cấu trúc sang collection &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để chia sẻ với team.&lt;/li&gt;
&lt;li&gt;Khi hợp đồng ổn định, chuyển sang gọi API trực tiếp.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Xem &lt;a href="http://apidog.com/blog/how-to-use-apidog-inside-vscode?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog trong VS Code&lt;/a&gt; để kết nối collection vào editor.&lt;/p&gt;

&lt;h2&gt;
  
  
  Bảo vệ quy trình trên gói Miễn phí và Go
&lt;/h2&gt;

&lt;p&gt;Hai cấu hình nên áp dụng ngay:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Luôn phê duyệt thao tác ghi file:&lt;/strong&gt; Trong &lt;code&gt;~/.codex/config.json&lt;/code&gt;, đặt &lt;code&gt;"autoApproveWrites": false&lt;/code&gt;. Mặc định an toàn trên gói Miễn phí, nhưng Go có thể auto-apply diff nhỏ.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Giới hạn workspace:&lt;/strong&gt; Chạy &lt;code&gt;codex&lt;/code&gt; trong thư mục dự án. Nếu mở từ &lt;code&gt;~&lt;/code&gt;, CLI sẽ đọc toàn bộ thư mục gốc.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;OpenAI đã kiểm thử an toàn cho GPT-5.5, nhưng CLI vẫn chạy local—hãy luôn xem xét diff trước khi apply.&lt;/p&gt;

&lt;h2&gt;
  
  
  Khi nào nên chuyển khỏi gói miễn phí
&lt;/h2&gt;

&lt;p&gt;"Thời gian giới hạn" nghĩa là Codex Free/Go sẽ cần nâng cấp trong tương lai. Lên kế hoạch sớm nếu:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Vượt hạn mức weekly:&lt;/strong&gt; Đã dùng thực tế, nên lên Plus/Pro.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Cần API trực tiếp:&lt;/strong&gt; Khối lượng lớn, nên xem &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API GPT-5.5&lt;/a&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Team cần thanh toán theo vị trí:&lt;/strong&gt; Dùng Business/Enterprise, phân tích giá tại &lt;a href="http://apidog.com/blog/gpt-5-5-pricing?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;đây&lt;/a&gt;.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Chuyển gói chỉ thay đổi phương thức thanh toán và UI—mô hình vẫn giữ nguyên.&lt;/p&gt;

&lt;h2&gt;
  
  
  Câu hỏi thường gặp
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Codex có chạy GPT-5.5 Pro không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không. CLI chỉ dùng model GPT-5.5 chuẩn trên mọi gói; Pro chỉ cho ChatGPT web và API sau này.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có thể dùng Codex mà không có tài khoản ChatGPT?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không. Bắt buộc đăng nhập ChatGPT hoặc dùng API key OpenAI.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Truy cập Free/Go kéo dài bao lâu?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
"Thời gian giới hạn"—dự kiến vài tuần đến vài tháng; nên chuẩn bị nâng cấp khi cần.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Codex chạy offline được không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không. Mọi request GPT-5.5 đều gửi tới server OpenAI.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Khác biệt so với ChatGPT web?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Codex chạy trong terminal, truy cập hệ thống file local, shell, ngữ cảnh repo—web app không có các tính năng này.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Cách Sử Dụng API GPT-5.5 Miễn Phí</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Fri, 24 Apr 2026 02:16:03 +0000</pubDate>
      <link>https://dev.to/sebbasstian/cach-su-dung-api-gpt-55-mien-phi-5237</link>
      <guid>https://dev.to/sebbasstian/cach-su-dung-api-gpt-55-mien-phi-5237</guid>
      <description>&lt;p&gt;GPT-5.5 đã ra mắt ngày 23/4/2026 với hệ thống trả phí cho hầu hết các dịch vụ: gói Plus, Pro, Business, Enterprise trong ChatGPT, và token API trả phí cho các lệnh gọi lập trình. Tuy nhiên, bên trong đợt phát hành này vẫn có ba cách sử dụng miễn phí còn hoạt động tới hiện tại. Nếu chấp nhận giới hạn tốc độ và một số hạn chế thời gian, bạn vẫn có thể thực hiện các lệnh gọi GPT-5.5 thực tế mà không cần phương thức thanh toán.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Bài này hướng dẫn từng cách miễn phí đã được kiểm tra, cách chọn phương pháp phù hợp với từng tình huống, và cách chuẩn hóa bộ sưu tập API sẵn sàng sản xuất trong &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để chuyển đổi mượt mà từ free sang trả phí khi nhu cầu tăng.&lt;/p&gt;

&lt;h2&gt;
  
  
  TL;DR
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Codex CLI trên ChatGPT Free hoặc Go&lt;/strong&gt; — truy cập tạm thời GPT-5.5 qua CLI Codex, không cần thẻ tín dụng.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tín dụng dùng thử OpenAI cho tài khoản API mới&lt;/strong&gt; — số dư nhỏ trên khóa API đầu tiên, mở các lệnh gọi GPT-5.5 khi Responses API được unlock.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Các gói miễn phí của OpenRouter và aggregator&lt;/strong&gt; — cổng bên thứ ba thỉnh thoảng cấp quota free cho các model mới ngay vài ngày đầu phát hành.&lt;/li&gt;
&lt;li&gt;Mỗi phương pháp đều có giới hạn. Khi sản xuất, hãy chuyển sang thanh toán trước khi hết hạn dùng thử.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Cách 1: Codex CLI (phương pháp miễn phí thực tế nhất)
&lt;/h2&gt;

&lt;p&gt;OpenAI tích hợp Codex vào mọi gói ChatGPT khi ra mắt, kể cả Free/Go, trong một khoảng thời gian giới hạn. Điểm quan trọng là Codex cho phép truy cập GPT-5.5 qua đăng nhập ChatGPT thay vì API key. Đăng nhập bằng tài khoản free, chạy CLI, model phản hồi trong 400K token context.&lt;/p&gt;

&lt;h3&gt;
  
  
  Cài đặt
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;npm &lt;span class="nb"&gt;install&lt;/span&gt; &lt;span class="nt"&gt;-g&lt;/span&gt; @openai/codex
&lt;span class="c"&gt;# hoặc&lt;/span&gt;
brew &lt;span class="nb"&gt;install &lt;/span&gt;codex
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Kiểm tra:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;codex &lt;span class="nt"&gt;--version&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Xác thực
&lt;/h3&gt;

&lt;p&gt;Chạy &lt;code&gt;codex&lt;/code&gt; lần đầu, trình duyệt sẽ mở để xác thực ChatGPT OAuth. Nếu trên server headless:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;codex login &lt;span class="nt"&gt;--device-auth&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Quy trình device code sẽ cấp 1 URL ngắn + mã để dán vào máy khác. Không cần API key.&lt;/p&gt;

&lt;h3&gt;
  
  
  Chọn model
&lt;/h3&gt;

&lt;p&gt;Trong phiên Codex:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;/model gpt-5.5
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Hoặc khởi động CLI với:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;codex &lt;span class="nt"&gt;--model&lt;/span&gt; gpt-5.5
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Kiểm tra quota còn lại với &lt;code&gt;/status&lt;/code&gt;. Gói Free/Go bị giới hạn chặt hơn trả phí nhưng đủ để tạo mẫu công cụ nhỏ.&lt;/p&gt;

&lt;h3&gt;
  
  
  Bạn nhận được gì / không nhận được gì
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Được&lt;/strong&gt;: Model GPT-5.5 thực, context 400K, đọc file, thực thi terminal, edit repo trong CLI.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Không được&lt;/strong&gt;: Không có API trực tiếp, chỉ truy cập qua Codex khi đã login.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Xem hướng dẫn chi tiết tại &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-free-codex?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn sử dụng GPT-5.5 miễn phí với Codex&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;OpenAI ghi rõ truy cập Codex Free/Go chỉ "có thời hạn". Lập trình nên dùng biến cấu hình cho model ID để chuyển đổi dễ dàng khi hết quota free.&lt;/p&gt;

&lt;h2&gt;
  
  
  Cách 2: Tín dụng dùng thử OpenAI cho tài khoản API mới
&lt;/h2&gt;

&lt;p&gt;Tài khoản dev OpenAI mới thường được cấp một ít tín dụng dùng thử. Số tiền thay đổi từng đợt phát hành; thường là $5 trong 90 ngày đầu, có thể cao hơn cho email .edu. Khi API GPT-5.5 unlock rộng rãi, số dư này cho phép gọi thực tế tới &lt;code&gt;gpt-5.5&lt;/code&gt;.&lt;/p&gt;

&lt;h3&gt;
  
  
  Cách nhận
&lt;/h3&gt;

&lt;ol&gt;
&lt;li&gt;Đăng ký tài khoản developer mới tại &lt;code&gt;platform.openai.com&lt;/code&gt;. Dùng email chưa từng đăng ký trước.&lt;/li&gt;
&lt;li&gt;Xác minh số điện thoại. Bắt buộc để nhận trial credit.&lt;/li&gt;
&lt;li&gt;Tạo API key thuộc tổ chức thử nghiệm.&lt;/li&gt;
&lt;li&gt;Kiểm tra dashboard usage để biết số tiền và ngày hết hạn.&lt;/li&gt;
&lt;/ol&gt;

&lt;h3&gt;
  
  
  Có thể làm gì với GPT-5.5
&lt;/h3&gt;

&lt;p&gt;Với $5 credit và giá hiện tại $5/triệu token input, $30/triệu token output, bạn chạy được khoảng 1 triệu token input hoặc ~160K token output với &lt;code&gt;gpt-5.5&lt;/code&gt;. Đủ để thử nghiệm mẫu nhỏ, kiểm tra workflow, hoặc prototyping agent loop — không đủ cho traffic production.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Tips tiết kiệm:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Dùng chế độ Batch:&lt;/strong&gt; Batch API chạy với 50% tốc độ tiêu chuẩn, tốt cho workflow không cần phản hồi realtime (&lt;a href="https://openai.com/api/pricing/" rel="noopener noreferrer"&gt;tham khảo pricing tại OpenAI&lt;/a&gt;).&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Giữ &lt;code&gt;reasoning.effort&lt;/code&gt; ở &lt;code&gt;low&lt;/code&gt;:&lt;/strong&gt; Mode này tiết kiệm token, phù hợp với hành vi GPT-5.4.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Điểm hạn chế
&lt;/h3&gt;

&lt;p&gt;Trial credit không tự refill. Hết quota, API trả về lỗi 402. Không có lần dùng thử thứ hai cho cùng 1 tài khoản/thiết bị/số điện thoại.&lt;/p&gt;

&lt;h2&gt;
  
  
  Cách 3: Các gói miễn phí của trình tổng hợp (Aggregator)
&lt;/h2&gt;

&lt;p&gt;Các cổng model bên thứ ba như OpenRouter, Together, Groq thỉnh thoảng cấp quota miễn phí cho model mới. Các ưu đãi này có thể biến mất bất kỳ lúc nào, nên hãy kiểm tra tình trạng thực tế trước khi sử dụng.&lt;/p&gt;

&lt;p&gt;Quy trình chung:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Tạo tài khoản, xác minh email.&lt;/li&gt;
&lt;li&gt;Lấy API key aggregator.&lt;/li&gt;
&lt;li&gt;Đổi base URL trong SDK sang URL aggregator.&lt;/li&gt;
&lt;li&gt;Đổi model string sang alias của aggregator, ví dụ: &lt;code&gt;openai/gpt-5.5&lt;/code&gt;.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Ví dụ với Python SDK:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="kn"&gt;from&lt;/span&gt; &lt;span class="n"&gt;openai&lt;/span&gt; &lt;span class="kn"&gt;import&lt;/span&gt; &lt;span class="n"&gt;OpenAI&lt;/span&gt;

&lt;span class="n"&gt;client&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nc"&gt;OpenAI&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;base_url&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;https://openrouter.ai/api/v1&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;api_key&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;sk-or-v1-...&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="n"&gt;response&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;client&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;chat&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;completions&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;create&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="n"&gt;model&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;openai/gpt-5.5&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="n"&gt;messages&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="p"&gt;[{&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;role&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;content&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;Explain the Responses API in two paragraphs.&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;}],&lt;/span&gt;
&lt;span class="p"&gt;)&lt;/span&gt;

&lt;span class="nf"&gt;print&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="n"&gt;response&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;choices&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;].&lt;/span&gt;&lt;span class="n"&gt;message&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="n"&gt;content&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Lưu ý: aggregator có rate limit và quota riêng, hạn mức free chia sẻ. Khi nhà cung cấp rút GPT-5.5 khỏi free tier, yêu cầu trả về lỗi 402/429. Đây chỉ là giải pháp tạo mẫu, không dùng cho sản xuất.&lt;/p&gt;

&lt;h2&gt;
  
  
  Bạn nên chọn cách nào trong các cách miễn phí này?
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Trường hợp sử dụng&lt;/th&gt;
&lt;th&gt;Cách miễn phí tốt nhất&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Trợ lý mã hóa dựa trên Terminal&lt;/td&gt;
&lt;td&gt;Codex CLI (Cách 1)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Thử nghiệm Python hoặc Node nhanh&lt;/td&gt;
&lt;td&gt;Tín dụng dùng thử (Cách 2)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Kiểm tra từ một ứng dụng lưu trữ&lt;/td&gt;
&lt;td&gt;Trình tổng hợp (Cách 3)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;So sánh GPT-5.5 với GPT-5.4 trên các lời nhắc thực tế&lt;/td&gt;
&lt;td&gt;Tín dụng dùng thử + Bộ sưu tập Apidog&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Nghiên cứu một lần "cái này có thể trả lời câu hỏi của tôi không"&lt;/td&gt;
&lt;td&gt;ChatGPT Plus (không miễn phí, nhưng rẻ nhất mỗi giờ)&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Với mọi tác vụ lớn hơn bản mẫu, cả ba hình thức này sẽ hết hạn mức rất nhanh. Hãy tập trung tối ưu cấu trúc request và prompt trước khi chi trả token thực sự.&lt;/p&gt;

&lt;h2&gt;
  
  
  Chuẩn hóa cấu trúc request trong Apidog
&lt;/h2&gt;

&lt;p&gt;Cách chuyển từ "dùng thử free" sang "khóa production" mà không phải rewrite code là xây dựng request một lần, kiểm soát qua versioned collection.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ffuujni1mvtoy9wit88i2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ffuujni1mvtoy9wit88i2.png" alt="Giao diện Apidog hiển thị cấu hình API"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Trong Apidog:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Tạo collection mới, thêm request &lt;code&gt;POST https://api.openai.com/v1/responses&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Đặt header xác thực từ biến môi trường, giúp đổi key dễ dàng mà không sửa body.&lt;/li&gt;
&lt;li&gt;Lưu response mẫu để dev sau làm việc với mock khi chưa có key thật.&lt;/li&gt;
&lt;li&gt;Nhân bản collection cho aggregator bằng cách trỏ &lt;code&gt;baseUrl&lt;/code&gt; sang OpenRouter, đổi chuỗi model.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Khi hết trial hoặc chuyển gói, chỉ cần đổi biến môi trường, collection vẫn chạy. Xem thêm &lt;a href="http://apidog.com/blog/how-to-use-apidog-inside-vscode?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn sử dụng Apidog trong VS Code&lt;/a&gt; nếu muốn tích hợp ngay trong Cursor hoặc Claude Code.&lt;/p&gt;

&lt;h2&gt;
  
  
  Hạn chế của các phương pháp miễn phí cần lưu ý
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Giới hạn tốc độ phụ thuộc tải:&lt;/strong&gt; Codex Free/Go sẽ chậm lại vào giờ cao điểm.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tín dụng không cộng dồn:&lt;/strong&gt; Tài khoản OpenAI thứ hai không có trial nếu trùng thẻ/điện thoại/IP.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;GPT-5.5 Pro không có trên bất kỳ bề mặt free nào:&lt;/strong&gt; Chỉ dành cho trả phí.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Chế độ tư duy (Thinking mode) tốn quota:&lt;/strong&gt; Dùng &lt;code&gt;reasoning.effort&lt;/code&gt; ở mức &lt;code&gt;low&lt;/code&gt; nếu không cần benchmark chính xác.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Gói miễn phí chỉ là tạm thời:&lt;/strong&gt; Quyền truy cập Codex Free/Go là "trong thời hạn" theo &lt;a href="https://openai.com/index/introducing-gpt-5-5/" rel="noopener noreferrer"&gt;thông báo ra mắt của OpenAI&lt;/a&gt;.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Mẫu thử nghiệm thực tế với gói miễn phí
&lt;/h2&gt;

&lt;p&gt;Quy trình tối ưu tận dụng quota free:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;Chọn tác vụ thật sự nhóm bạn thực hiện (báo cáo, review code, tóm tắt nghiên cứu).&lt;/li&gt;
&lt;li&gt;Chạy 10 ví dụ thực tế với GPT-5.4 trên công cụ hiện tại, ghi lại chất lượng.&lt;/li&gt;
&lt;li&gt;Chạy 10 ví dụ tương tự qua GPT-5.5 trên Codex CLI hoặc trial credit.&lt;/li&gt;
&lt;li&gt;So sánh chất lượng output token và tỷ lệ lỗi.&lt;/li&gt;
&lt;li&gt;Đánh giá liệu việc nâng cấp lên GPT-5.5 có xứng đáng với chi phí tăng gấp đôi cho workload của bạn không.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Chỉ mất một buổi chiều để thực thi — tiết kiệm chi phí ngay từ tháng đầu khi chuyển sang production.&lt;/p&gt;

&lt;h2&gt;
  
  
  FAQ
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Codex Free và Go có vĩnh viễn không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không. &lt;a href="https://openai.com/index/introducing-gpt-5-5/" rel="noopener noreferrer"&gt;Thông báo của OpenAI&lt;/a&gt; ghi rõ chỉ "có thời hạn", dự kiến hết sau vài tháng từ ngày phát hành.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;ChatGPT Free có GPT-5.5 trong trình duyệt không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không. ChatGPT Free vẫn là GPT-5.3 mặc định. GPT-5.5 yêu cầu ChatGPT Plus trở lên.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có thể chạy GPT-5.5 trên Hugging Face/Ollama free không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không được. GPT-5.5 là closed-weight, chỉ chạy trên hạ tầng OpenAI hoặc qua login Codex.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;OpenAI còn giảm giá cho sinh viên không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Từng có chương trình giảm giá cho email .edu và trial credit cao hơn các đợt trước. Xem &lt;a href="https://openai.com/education/" rel="noopener noreferrer"&gt;trang giáo dục của OpenAI&lt;/a&gt; để kiểm tra ưu đãi hiện tại.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Chuyển từ free sang trả phí mà không rewrite code thế nào?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Dùng biến môi trường cho key và base URL (&lt;code&gt;OPENAI_API_KEY&lt;/code&gt;, &lt;code&gt;OPENAI_BASE_URL&lt;/code&gt;). Khi hết trial, chỉ cần đổi biến. Xem &lt;a href="http://apidog.com/blog/how-to-use-gpt-5-5-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn API GPT-5.5&lt;/a&gt; để thực hiện theo best practice.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Cách Sử Dụng Hy3 Preview API Miễn Phí</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Thu, 23 Apr 2026 10:45:50 +0000</pubDate>
      <link>https://dev.to/sebbasstian/cach-su-dung-hy3-preview-api-mien-phi-23fo</link>
      <guid>https://dev.to/sebbasstian/cach-su-dung-hy3-preview-api-mien-phi-23fo</guid>
      <description>&lt;p&gt;Tencent đã công bố mã nguồn mở Hy3 Preview vào ngày 22 tháng 4 năm 2026, và chỉ sau 1 ngày, OpenRouter đã thêm nó như một điểm cuối miễn phí hoàn toàn. Không cần thẻ tín dụng, không phí token, không giới hạn dùng thử. Bạn có thể gọi mô hình Mixture-of-Experts 295B-tham số mà Tencent sử dụng cho Yuanbao và CodeBuddy, trực tiếp từ mã nguồn của bạn, hoàn toàn miễn phí.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Bài viết này hướng dẫn cách sử dụng API Hy3 Preview miễn phí qua OpenRouter, Hugging Face Space và repo Hy3 gốc. Bạn sẽ biết các chế độ suy luận đặc biệt của Hy3 và cách kiểm thử API trong Apidog mà không cần viết script một lần.&lt;/p&gt;

&lt;p&gt;Nếu bạn muốn nhận kết quả nhanh nhất, hãy chuyển ngay tới mục “Hướng dẫn từng bước: gọi Hy3 Preview miễn phí trên OpenRouter.”&lt;/p&gt;

&lt;h2&gt;
  
  
  TL;DR
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Hy3 Preview miễn phí trên OpenRouter&lt;/strong&gt; với model ID &lt;code&gt;tencent/hy3-preview:free&lt;/code&gt;, giá $0 cho cả input và output.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Mô hình Mixture-of-Experts&lt;/strong&gt;: 295B tham số tổng, 21B tham số hoạt động, 192 chuyên gia, định tuyến top-8, &lt;strong&gt;cửa sổ ngữ cảnh 256K-token&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Ba chế độ suy luận tích hợp&lt;/strong&gt;: &lt;code&gt;no_think&lt;/code&gt; cho trả lời nhanh; &lt;code&gt;low&lt;/code&gt; và &lt;code&gt;high&lt;/code&gt; cho chuỗi suy nghĩ sâu cho tác vụ agent/lập trình.&lt;/li&gt;
&lt;li&gt;Điểm chuẩn mạnh cho mô hình mã nguồn mở: &lt;strong&gt;SWE-bench Verified 74.4&lt;/strong&gt;, &lt;strong&gt;Terminal-Bench 2.0 54.4&lt;/strong&gt;, &lt;strong&gt;GPQA Diamond 87.2&lt;/strong&gt;, &lt;strong&gt;MMLU 87.42&lt;/strong&gt;.&lt;/li&gt;
&lt;li&gt;Có thể sử dụng miễn phí qua: gói free của OpenRouter, &lt;a href="https://huggingface.co/spaces/tencent/Hy3-preview" rel="noopener noreferrer"&gt;Hy3-preview Space&lt;/a&gt; của Hugging Face, hoặc chạy cục bộ với vLLM và trọng số mở.&lt;/li&gt;
&lt;li&gt;Apidog tích hợp tốt với endpoint OpenRouter vì Hy3 dùng schema OpenAI Chat Completions; chỉ cần trỏ request tới OpenRouter là chạy.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Hy3 Preview là gì?
&lt;/h2&gt;

&lt;p&gt;Hy3 Preview là bản phát hành nền tảng lớn đầu tiên từ nhóm Hunyuan Platform Models đã tái cấu trúc của Tencent, do Yao Shunyu (cựu OpenAI) dẫn dắt. Đây là mô hình mạnh nhất của Tencent, cạnh tranh trực tiếp với các mô hình mã nguồn mở hàng đầu Trung Quốc như DeepSeek, Alibaba, Zhipu.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft3okmwbravxkkwnbywfk.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ft3okmwbravxkkwnbywfk.png" alt="hy3 model" width="800" height="535"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Thông số kỹ thuật từ &lt;a href="https://huggingface.co/tencent/Hy3-preview" rel="noopener noreferrer"&gt;thẻ mô hình chính thức&lt;/a&gt;:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Kiến trúc&lt;/strong&gt;: Mixture-of-Experts, 80 lớp + 1 lớp MTP, 64 head attention, attention nhóm truy vấn.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tham số&lt;/strong&gt;: 295B tổng, 21B hoạt động mỗi lượt forward.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Chuyên gia&lt;/strong&gt;: 192 chuyên gia, định tuyến top-8/token.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Ngữ cảnh&lt;/strong&gt;: 256K token (OpenRouter hiển thị 262.144).&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tokenizer&lt;/strong&gt;: 120.832 mục, BF16.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Giấy phép&lt;/strong&gt;: Tencent Hy Community License, cho phép thương mại trong điều khoản.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Điểm khác biệt là huấn luyện theo hướng agent: Tencent xây lại hạ tầng RL cho multi-turn tool use, đạt điểm benchmark SWE-bench, Terminal-Bench, WildClawBench tiệm cận mô hình đóng cho tác vụ code/shell.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fr9r1k4hiwnqmxfzcxkrv.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fr9r1k4hiwnqmxfzcxkrv.png" alt="benchmark" width="800" height="823"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Ba cách miễn phí để sử dụng Hy3 Preview
&lt;/h2&gt;

&lt;p&gt;Bạn có 3 lựa chọn tùy nhu cầu: giao diện chat, API, hay tự lưu trữ trọng số.&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Đường dẫn&lt;/th&gt;
&lt;th&gt;Nó là gì&lt;/th&gt;
&lt;th&gt;Miễn phí?&lt;/th&gt;
&lt;th&gt;Thích hợp cho&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;OpenRouter &lt;code&gt;tencent/hy3-preview:free&lt;/code&gt;
&lt;/td&gt;
&lt;td&gt;API OpenAI-compatible hosted&lt;/td&gt;
&lt;td&gt;Có, $0 input/output&lt;/td&gt;
&lt;td&gt;Xây agent, script, backend&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Hugging Face Space&lt;/td&gt;
&lt;td&gt;Chat demo trên browser&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Nhắc lệnh nhanh, test sơ bộ&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Tự lưu trữ (vLLM/SGLang)&lt;/td&gt;
&lt;td&gt;Chạy trọng số mở trên GPU của bạn&lt;/td&gt;
&lt;td&gt;Phần mềm free, tốn phần cứng&lt;/td&gt;
&lt;td&gt;Công việc cần bảo mật, khối lượng lớn&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Đa số dev sẽ chọn OpenRouter – nhanh nhất từ đăng ký tới gọi API, rate limit free đủ cho prototype.&lt;/p&gt;

&lt;h2&gt;
  
  
  Hướng dẫn từng bước: gọi Hy3 Preview miễn phí trên OpenRouter
&lt;/h2&gt;

&lt;p&gt;Đây là quy trình đơn giản nhất để gọi Hy3 Preview qua API:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fa447qs4ksvaydcv2u7nb.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fa447qs4ksvaydcv2u7nb.png" alt="openrouter key" width="800" height="493"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Đăng ký tài khoản OpenRouter&lt;/strong&gt; tại &lt;a href="https://openrouter.ai" rel="noopener noreferrer"&gt;openrouter.ai&lt;/a&gt;. Chỉ cần email, không yêu cầu thanh toán cho model free.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tạo API key.&lt;/strong&gt; Vào "Keys" → tạo mới, copy vào biến môi trường, vd: &lt;code&gt;export OPENROUTER_API_KEY=sk-or-...&lt;/code&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Mở trang mô hình.&lt;/strong&gt; Vào &lt;a href="https://openrouter.ai/tencent/hy3-preview:free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;danh sách miễn phí Hy3 Preview&lt;/a&gt; và xác nhận trạng thái "Free". Xem usage và trạng thái.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4z8fvz17rlpo92tt34x4.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4z8fvz17rlpo92tt34x4.png" alt="openrouter quota" width="800" height="208"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Gửi request đầu tiên.&lt;/strong&gt; Schema OpenAI Chat Completions; mọi OpenAI SDK đều dùng được:
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl https://openrouter.ai/api/v1/chat/completions &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Authorization: Bearer &lt;/span&gt;&lt;span class="nv"&gt;$OPENROUTER_API_KEY&lt;/span&gt;&lt;span class="s2"&gt;"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Content-Type: application/json"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-d&lt;/span&gt; &lt;span class="s1"&gt;'{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explain the MoE routing decision inside a top-8 of 192 setup in 3 sentences."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Bật suy luận khi cần.&lt;/strong&gt; Thêm tham số &lt;code&gt;reasoning&lt;/code&gt; với &lt;code&gt;effort&lt;/code&gt; là &lt;code&gt;low&lt;/code&gt; hoặc &lt;code&gt;high&lt;/code&gt;. OpenRouter trả về dấu vết suy nghĩ trong mảng &lt;code&gt;reasoning_details&lt;/code&gt;:
&lt;/li&gt;
&lt;/ol&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"model"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"tencent/hy3-preview:free"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"messages"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="nl"&gt;"role"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"user"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="nl"&gt;"content"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Plan, then write a Bash script that rotates daily log files older than 30 days into a dated archive folder."&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"reasoning"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="nl"&gt;"effort"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"high"&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Lặp lại.&lt;/strong&gt; Giữ nguyên thread để tận dụng cửa sổ 256K token, phù hợp với codebase lớn hoặc context dài.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Mô hình này giống bản trên Hugging Face; chất lượng trên OpenRouter free = các bản trả phí khác.&lt;/p&gt;

&lt;h2&gt;
  
  
  Miễn phí, Plus, và tự lưu trữ: điểm khác biệt
&lt;/h2&gt;

&lt;p&gt;So sánh nhanh:&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Khả năng&lt;/th&gt;
&lt;th&gt;OpenRouter Free&lt;/th&gt;
&lt;th&gt;OpenRouter Trả phí&lt;/th&gt;
&lt;th&gt;Tự lưu trữ (vLLM/SGLang)&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Giá/token&lt;/td&gt;
&lt;td&gt;$0&lt;/td&gt;
&lt;td&gt;Theo provider&lt;/td&gt;
&lt;td&gt;Điện + khấu hao GPU&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Chế độ suy luận&lt;/td&gt;
&lt;td&gt;
&lt;code&gt;no_think&lt;/code&gt;, &lt;code&gt;low&lt;/code&gt;, &lt;code&gt;high&lt;/code&gt;
&lt;/td&gt;
&lt;td&gt;Như trên&lt;/td&gt;
&lt;td&gt;Như trên&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Độ dài ngữ cảnh&lt;/td&gt;
&lt;td&gt;256K&lt;/td&gt;
&lt;td&gt;256K&lt;/td&gt;
&lt;td&gt;256K (tùy RAM)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Thông lượng tải cao&lt;/td&gt;
&lt;td&gt;Nhóm chung, ưu tiên thấp&lt;/td&gt;
&lt;td&gt;Riêng biệt&lt;/td&gt;
&lt;td&gt;Tùy cluster&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Giới hạn rate&lt;/td&gt;
&lt;td&gt;Theo chính sách free OpenRouter&lt;/td&gt;
&lt;td&gt;Theo provider&lt;/td&gt;
&lt;td&gt;Không có&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Lưu trữ dữ liệu&lt;/td&gt;
&lt;td&gt;Theo OpenRouter&lt;/td&gt;
&lt;td&gt;Theo provider&lt;/td&gt;
&lt;td&gt;Trên máy bạn&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Hiển thị reasoning tokens&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;td&gt;Có&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Miễn phí phù hợp cho prototype, dự án phụ, agent traffic thấp. Trả phí hoặc tự lưu trữ khi cần độ trễ thấp, vượt giới hạn rate.&lt;/p&gt;

&lt;h2&gt;
  
  
  Mẹo nhắc lệnh &amp;amp; tham số tận dụng tối đa Hy3
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Phối hợp nhiệt độ với chế độ.&lt;/strong&gt; Dùng &lt;code&gt;temperature=0.9&lt;/code&gt;, &lt;code&gt;top_p=1.0&lt;/code&gt; mặc định. Output có cấu trúc giảm xuống 0.3, sáng tạo giữ 0.9.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Dùng &lt;code&gt;no_think&lt;/code&gt; cho chat thường.&lt;/strong&gt; Chỉ bật &lt;code&gt;low&lt;/code&gt;/&lt;code&gt;high&lt;/code&gt; khi cần planning, code đa bước, toán học.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Đặt tên tool trong system prompt.&lt;/strong&gt; Luôn mô tả tool, đừng chỉ dựa vào schema.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Paste code, không tóm tắt.&lt;/strong&gt; Cửa sổ 256K, paste nguyên file rồi hỏi.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Sửa nhiều file cùng lúc.&lt;/strong&gt; Đưa toàn bộ files vào 1 message, không drip từng file.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Bắt mô hình lên kế hoạch.&lt;/strong&gt; Với agent, dùng mẫu 2 bước: "plan trước, chờ tôi xác nhận, rồi thực hiện".&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Giới hạn cần biết trước khi triển khai
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Rate limit thay đổi theo tải.&lt;/strong&gt; Free group chia nhau, giờ cao điểm dễ lỗi 429. Luôn retry với exponential backoff.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Token suy luận tính vào output.&lt;/strong&gt; &lt;code&gt;reasoning_details&lt;/code&gt; miễn phí trên OpenRouter free, nhưng bản trả phí tính phí như output.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;License không phải Apache 2.0.&lt;/strong&gt; Đọc kỹ &lt;a href="https://github.com/Tencent-Hunyuan/Hy3-preview" rel="noopener noreferrer"&gt;giấy phép trên GitHub&lt;/a&gt; nếu thương mại hóa.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tool call cần parser đúng.&lt;/strong&gt; Tự host phải dùng vLLM/SGLang kèm &lt;code&gt;--tool-call-parser hy_v3&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tiếng Anh/Trung mạnh nhất.&lt;/strong&gt; Ngôn ngữ khác hỗ trợ nhưng chất lượng thấp hơn.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Chưa bằng flagship Mỹ trên benchmark suy luận khó.&lt;/strong&gt; Hy3 ngang top Trung Quốc, nhưng vẫn dưới OpenAI/Google DeepMind trên một số test.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Lối tắt phát triển: Hy3 Preview + Apidog
&lt;/h2&gt;

&lt;p&gt;Dùng curl để test nhanh, nhưng để lặp lại thực tế, nên dùng client API trực quan như Apidog.&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;
&lt;strong&gt;Tạo dự án mới trên Apidog.&lt;/strong&gt; Nhập OpenAPI spec của OpenAI Chat Completions.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Đặt base URL&lt;/strong&gt; là &lt;code&gt;https://openrouter.ai/api/v1&lt;/code&gt;, thêm biến môi trường cho &lt;code&gt;OPENROUTER_API_KEY&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tạo request&lt;/strong&gt; tới &lt;code&gt;/chat/completions&lt;/code&gt; với model &lt;code&gt;tencent/hy3-preview:free&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Clone request&lt;/strong&gt; để so sánh các chế độ reasoning (&lt;code&gt;no_think&lt;/code&gt;, &lt;code&gt;low&lt;/code&gt;, &lt;code&gt;high&lt;/code&gt;) song song.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Lưu prompt templates.&lt;/strong&gt; Dùng biến của Apidog để tái sử dụng system prompt, tool schema, lượt user.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Nếu chuyển từ Postman, tham khảo &lt;a href="http://apidog.com/blog/api-testing-without-postman-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn kiểm thử API không dùng Postman năm 2026&lt;/a&gt;. Làm việc trong VS Code? Xem &lt;a href="http://apidog.com/blog/how-to-use-apidog-inside-vscode?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;cách dùng Apidog trong VS Code&lt;/a&gt; để chỉnh prompt cạnh code.&lt;/p&gt;

&lt;h2&gt;
  
  
  Các lựa chọn thay thế miễn phí nếu chạm giới hạn
&lt;/h2&gt;

&lt;p&gt;Nếu rate limit free của OpenRouter khiến bạn chậm vào giờ cao điểm, thử:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Hugging Face Space:&lt;/strong&gt; &lt;a href="https://huggingface.co/spaces/tencent/Hy3-preview" rel="noopener noreferrer"&gt;Hy3-preview Space&lt;/a&gt; cho chat demo trên browser (không script, nhưng free và nhanh).&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Các model mã nguồn mở Trung Quốc khác:&lt;/strong&gt; Qwen 3.5 Omni của Alibaba có free tier mạnh, đa phương thức; xem &lt;a href="http://apidog.com/blog/qwen-3-5-omni-announcement?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;thông báo Qwen 3.5 Omni&lt;/a&gt; và &lt;a href="http://apidog.com/blog/how-to-use-qwen-3-5-omni?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn sử dụng&lt;/a&gt;. Zhipu GLM 5V Turbo cũng miễn phí rộng; hướng dẫn tại &lt;a href="http://apidog.com/blog/glm-5v-turbo-api-guide?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API GLM 5V Turbo&lt;/a&gt;.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Các model này không vượt Hy3 ở agentic coding, nhưng đáp ứng tốt chat, đa ngôn ngữ, đa phương thức. Để test thực tế, hãy thiết lập bộ sưu tập trên Apidog cho từng model và benchmark với prompt thực tế của bạn.&lt;/p&gt;

&lt;h2&gt;
  
  
  Tự lưu trữ Hy3 Preview với vLLM
&lt;/h2&gt;

&lt;p&gt;Muốn suy luận cục bộ? Thẻ model khuyên dùng vLLM với tensor-parallel 8, bật multi-token speculative decoding:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;vllm serve tencent/Hy3-preview &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tensor-parallel-size&lt;/span&gt; 8 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--speculative-config&lt;/span&gt;.method mtp &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--speculative-config&lt;/span&gt;.num_speculative_tokens 1 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--tool-call-parser&lt;/span&gt; hy_v3 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--reasoning-parser&lt;/span&gt; hy_v3 &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--enable-auto-tool-choice&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;--served-model-name&lt;/span&gt; hy3-preview
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;SGLang dùng &lt;code&gt;--tool-call-parser hunyuan&lt;/code&gt; và &lt;code&gt;--reasoning-parser hunyuan&lt;/code&gt;. Khi server chạy ở &lt;code&gt;http://localhost:8000/v1&lt;/code&gt;, dùng bất kỳ SDK OpenAI nào, chỉ đổi base URL và key.&lt;/p&gt;

&lt;p&gt;Cần tối thiểu 8 GPU H100 với BF16 để chạy model đầy đủ. Bản lượng tử hóa cộng đồng sẽ sớm ra mắt, nhưng hiện tại chỉ có bản full precision.&lt;/p&gt;

&lt;h2&gt;
  
  
  Câu hỏi thường gặp
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;Hy3 Preview có miễn phí không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. OpenRouter liệt kê &lt;code&gt;tencent/hy3-preview:free&lt;/code&gt; với $0 cho 1M token input/output. Token reasoning cũng miễn phí trên free tier (nhưng tính vào rate limit). Kiểm tra trạng thái tại &lt;a href="https://openrouter.ai/tencent/hy3-preview:free?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;trang model OpenRouter&lt;/a&gt; trước khi dùng sản xuất.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Hy3 Preview so với DeepSeek V3 &amp;amp; Qwen 3 thế nào?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Điểm SWE-bench 74.4, Terminal-Bench 54.4 của Hy3 ngang top open models Trung Quốc, mạnh về agent/tool use. Với chat thường, Qwen 3 và DeepSeek V3 cạnh tranh; về agent/lập trình, Hy3 nổi trội nhờ RL tool use.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Các chế độ reasoning của Hy3 là gì?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Ba chế độ: &lt;code&gt;no_think&lt;/code&gt; (mặc định, trả lời trực tiếp), &lt;code&gt;low&lt;/code&gt;, &lt;code&gt;high&lt;/code&gt;. Chuyển qua tham số &lt;code&gt;reasoning&lt;/code&gt; khi gọi OpenRouter, hoặc &lt;code&gt;chat_template_kwargs={"reasoning_effort": "high"}&lt;/code&gt; khi gọi trực tiếp. Dùng &lt;code&gt;high&lt;/code&gt; cho planning, code đa bước, toán học; tắt khi chỉ chat.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có thể dùng Hy3 Preview cho mục đích thương mại?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có, theo Tencent Hy Community License. Đọc kỹ &lt;a href="https://github.com/Tencent-Hunyuan/Hy3-preview" rel="noopener noreferrer"&gt;license trên GitHub&lt;/a&gt; nếu muốn nhúng vào sản phẩm có thu.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Free tier hỗ trợ context dài bao nhiêu?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
256K token. OpenRouter hiển thị 262.144 token, đúng với thẻ model. Đủ chứa nguyên codebase trung bình, tool schema và history.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Kiểm thử Hy3 Preview mà không viết code thế nào?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Dùng &lt;a href="https://huggingface.co/spaces/tencent/Hy3-preview" rel="noopener noreferrer"&gt;Hugging Face Space&lt;/a&gt; để chat demo trên browser, hoặc trỏ &lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; vào endpoint OpenRouter. Apidog nhập spec OpenAI, chỉ cần base URL, API key, model name là chạy.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>API Mua Bán Fiat Tốt Nhất 2026</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Thu, 23 Apr 2026 09:53:51 +0000</pubDate>
      <link>https://dev.to/sebbasstian/api-mua-ban-fiat-tot-nhat-2026-5f5l</link>
      <guid>https://dev.to/sebbasstian/api-mua-ban-fiat-tot-nhat-2026-5f5l</guid>
      <description>&lt;p&gt;Cổng chuyển đổi tiền pháp định (fiat on-ramp) và cổng rút tiền pháp định (fiat off-ramp) là giải pháp kết nối ngân hàng với tiền mã hóa. Khi xây dựng ví điện tử, ngân hàng số hoặc ứng dụng stablecoin, bạn sẽ gặp bài toán: làm sao chuyển đổi thẻ Visa ở Lagos hoặc chuyển khoản SEPA ở Berlin thành USDC, rồi sau đó rút euro về tài khoản mà không phải xây lại hệ thống PSP từ con số 0?&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Hãy thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Thông thường, các đội ngũ sẽ tích hợp API cổng chuyển đổi/rút tiền pháp định. Một lần tích hợp duy nhất để xử lý KYC, thanh toán, tuân thủ, chọn chuỗi và chuyển tiền – bạn tập trung vào sản phẩm. Các tiêu chí chọn lựa xoay quanh quốc gia, phương thức thanh toán, phí và trải nghiệm lập trình viên. Tham khảo thêm tại &lt;a href="https://stripe.com/crypto/onramp" rel="noopener noreferrer"&gt;Stripe Crypto Onramp&lt;/a&gt; và &lt;a href="https://www.moonpay.com/business" rel="noopener noreferrer"&gt;MoonPay Business&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;Bài viết này so sánh 6 nhà cung cấp sẵn sàng để triển khai cho năm 2026 và hướng dẫn bạn kiểm thử nhanh qua &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;. Nếu xây dựng trên nền tảng stablecoin, hãy kết hợp hướng dẫn về &lt;a href="http://apidog.com/blog/how-to-use-circle-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;cách sử dụng API Circle&lt;/a&gt;.&lt;/p&gt;

&lt;h2 id="tóm-tắt"&gt;Tóm tắt&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;API cổng chuyển đổi tiền pháp định giúp chuyển đổi tiền ngân hàng thành crypto; cổng rút tiền pháp định làm ngược lại và chuyển tiền về tài khoản ngân hàng.&lt;/li&gt;
&lt;li&gt;Chọn dựa trên phạm vi quốc gia, phương thức thanh toán (thẻ, ACH, SEPA, UPI, Pix), cấu trúc phí và nhu cầu widget nhúng hay API đầy đủ.&lt;/li&gt;
&lt;li&gt;MoonPay và Transak có phạm vi quốc gia rộng nhất; Ramp Network tối ưu cho EU/UK ở trải nghiệm lập trình viên.&lt;/li&gt;
&lt;li&gt;Coinbase Onramp và Stripe Crypto Onramp mạnh ở thị trường Mỹ, phù hợp nếu bạn cần thương hiệu lớn.&lt;/li&gt;
&lt;li&gt;Kado dẫn đầu về phí rút tiền pháp định thấp và các luồng stablecoin.&lt;/li&gt;
&lt;li&gt;Luôn kiểm thử toàn bộ luồng chuyển đổi và rút tiền pháp định ở môi trường sandbox trước khi triển khai; các vấn đề phí và KYC sẽ lộ diện nhanh chóng.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="những-điều-cần-tìm-kiếm-ở-một-api-cổng-chuyển-đổi-và-rút-tiền-pháp-định"&gt;Những điều cần kiểm tra khi chọn API cổng chuyển đổi/rút tiền pháp định&lt;/h2&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;strong&gt;Phạm vi quốc gia &amp;amp; tiền tệ:&lt;/strong&gt; Kiểm tra danh sách quốc gia và loại tiền pháp định thực tế được hỗ trợ, tránh trường hợp ghi "hỗ trợ 150 nước" nhưng chỉ chấp nhận thanh toán thẻ ở một nửa số đó.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Phương thức thanh toán:&lt;/strong&gt; Thẻ tín dụng/ghi nợ tiện nhưng phí cao. ACH, SEPA, UPI, Pix, iDEAL thường rẻ hơn và tăng tỷ lệ chuyển đổi. Thị trường Ấn Độ/Brazil thì UPI/Pix là bắt buộc.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Xử lý KYC:&lt;/strong&gt; Xác định nhà cung cấp có xử lý KYC đầu-cuối hay chuyển giao lại. Full-KYC giúp tích hợp nhanh, ủy quyền lại giúp kiểm soát trải nghiệm người dùng. Xem thêm về &lt;a href="http://apidog.com/blog/best-kyc-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API KYC tốt nhất&lt;/a&gt;.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Thời gian &amp;amp; phí giao dịch:&lt;/strong&gt; Thẻ nhanh (phút), phí 3-5%. ACH/SEPA chậm hơn (1-3 ngày), phí &amp;lt;1%. Phí rút tiền pháp định thay đổi, có nhà cung cấp lấy 2%.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Nhúng widget vs API:&lt;/strong&gt; Widget lưu trữ tích hợp cực nhanh (~30 phút). API đầy đủ cho phép tùy biến giao diện nhưng yêu cầu giấy phép. Đa số đội ngũ chọn widget trước, sau đó chuyển sang API.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Hỗ trợ stablecoin &amp;amp; rút tiền pháp định:&lt;/strong&gt; USDC/USDT trên Ethereum, Solana, Base, Polygon là tiêu chuẩn. Xác minh kỹ phạm vi rút tiền pháp định, nhiều nhà cung cấp chỉ hỗ trợ vài quốc gia.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="bảng-so-sánh"&gt;Bảng so sánh&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Nhà cung cấp&lt;/th&gt;
&lt;th&gt;Giá cả&lt;/th&gt;
&lt;th&gt;Phạm vi&lt;/th&gt;
&lt;th&gt;Trải nghiệm nhà phát triển&lt;/th&gt;
&lt;th&gt;Phù hợp nhất cho&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;MoonPay&lt;/td&gt;
&lt;td&gt;1%–4.5% thẻ, 1% ACH&lt;/td&gt;
&lt;td&gt;160+ quốc gia, 30+ tiền pháp định&lt;/td&gt;
&lt;td&gt;Widget + REST API, tài liệu đầy đủ&lt;/td&gt;
&lt;td&gt;Ví cần phạm vi thẻ toàn cầu&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Ramp Network&lt;/td&gt;
&lt;td&gt;0.49%–2.9%&lt;/td&gt;
&lt;td&gt;150+ quốc gia, mạnh ở EU/UK&lt;/td&gt;
&lt;td&gt;SDK hiện đại, tài liệu rõ ràng&lt;/td&gt;
&lt;td&gt;Ứng dụng ở EU/UK muốn ít rào cản&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Transak&lt;/td&gt;
&lt;td&gt;0.99%–5.5%&lt;/td&gt;
&lt;td&gt;150+ quốc gia, 75+ tiền pháp định&lt;/td&gt;
&lt;td&gt;Widget + API, dễ nhúng&lt;/td&gt;
&lt;td&gt;Phạm vi rộng, mạnh Ấn Độ (UPI)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Coinbase Onramp&lt;/td&gt;
&lt;td&gt;1%–3.99%&lt;/td&gt;
&lt;td&gt;Mỹ + 90 quốc gia&lt;/td&gt;
&lt;td&gt;Pay SDK, React components&lt;/td&gt;
&lt;td&gt;App ưu tiên Mỹ, cần thương hiệu lớn&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Kado&lt;/td&gt;
&lt;td&gt;1.5% phí rút tiền pháp định cố định&lt;/td&gt;
&lt;td&gt;170+ quốc gia&lt;/td&gt;
&lt;td&gt;API ưu tiên stablecoin&lt;/td&gt;
&lt;td&gt;App stablecoin, rút tiền pháp định rẻ&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Stripe Crypto Onramp&lt;/td&gt;
&lt;td&gt;1.5% + phí Stripe&lt;/td&gt;
&lt;td&gt;Mỹ + quốc tế hạn chế&lt;/td&gt;
&lt;td&gt;Tích hợp sâu với Stripe&lt;/td&gt;
&lt;td&gt;App đã dùng Stripe&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;h2 id="các-nhà-cung-cấp-cổng-chuyển-đổi-và-rút-tiền-pháp-định-hàng-đầu"&gt;Nhà cung cấp nổi bật&lt;/h2&gt;

&lt;h3 id="moonpay"&gt;MoonPay&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;Hỗ trợ 160+ quốc gia, 30+ tiền pháp định.&lt;/li&gt;
  &lt;li&gt;Phương thức: thẻ, ACH, SEPA, Apple Pay, Google Pay, Pix.&lt;/li&gt;
  &lt;li&gt;Widget xử lý KYC/AML/chống gian lận; API REST cho phép tích hợp sâu nếu bạn có giấy phép.&lt;/li&gt;
  &lt;li&gt;Phí: 1–4.5% (tùy phương thức/khu vực). Hỗ trợ rút tiền pháp định về thẻ/tài khoản ngân hàng ở hầu hết thị trường lớn.&lt;/li&gt;
  &lt;li&gt;Hướng dẫn: &lt;a href="http://apidog.com/blog/how-to-use-moonpay-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Cách sử dụng API MoonPay&lt;/a&gt;.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Phù hợp nhất:&lt;/strong&gt; Ví tiêu dùng cần độ phủ toàn cầu với 1 nhà cung cấp duy nhất.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="ramp-network"&gt;Ramp Network&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;Mạnh ở EU/UK: SDK rõ ràng, phí minh bạch, KYC nhanh với SEPA.&lt;/li&gt;
  &lt;li&gt;Hỗ trợ 150+ quốc gia, tối ưu phí Open Banking (~0.49%).&lt;/li&gt;
  &lt;li&gt;Widget nhúng vào React/JS, SDK mobile có sẵn.&lt;/li&gt;
  &lt;li&gt;Rút tiền pháp định khả dụng ở EU, UK; danh sách quốc gia đang mở rộng.&lt;/li&gt;
  &lt;li&gt;Kết hợp tốt với các ví kiểu MetaMask – &lt;a href="http://apidog.com/blog/how-to-use-metamask-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;xem hướng dẫn API MetaMask&lt;/a&gt;.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Phù hợp nhất:&lt;/strong&gt; Ứng dụng EU/UK ưu tiên SEPA, Open Banking, ít rào cản.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="transak"&gt;Transak&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;Hỗ trợ 150+ quốc gia, 75+ tiền pháp định.&lt;/li&gt;
  &lt;li&gt;Rộng phương thức thanh toán bản địa: UPI (Ấn Độ), Pix (Brazil).&lt;/li&gt;
  &lt;li&gt;Widget nhúng mọi web/mobile app; API cho luồng white-label.&lt;/li&gt;
  &lt;li&gt;Phí 0.99–5.5% tùy hành lang/thanh toán.&lt;/li&gt;
  &lt;li&gt;KYC đầu-cuối, hỗ trợ đổi/rút pháp định ở đa số thị trường mới nổi.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Phù hợp nhất:&lt;/strong&gt; App nhắm tới Ấn Độ, Đông Nam Á, LATAM.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="coinbase-onramp-pay-sdk"&gt;Coinbase Onramp (Pay SDK)&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;Pay SDK cho phép nạp tiền ví chỉ vài thao tác với tài khoản Coinbase.&lt;/li&gt;
  &lt;li&gt;Mạnh với người dùng Mỹ (nhiều người đã có tài khoản Coinbase).&lt;/li&gt;
  &lt;li&gt;Hỗ trợ ngoài Mỹ ở 90 quốc gia qua thẻ/phương thức bản địa.&lt;/li&gt;
  &lt;li&gt;SDK cung cấp React components, luồng lưu trữ, tận dụng KYC sẵn có.&lt;/li&gt;
  &lt;li&gt;Rút tiền pháp định mới triển khai, giới hạn quốc gia.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Phù hợp nhất:&lt;/strong&gt; App ưu tiên Mỹ, tận dụng thương hiệu Coinbase để tăng chuyển đổi.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="kado"&gt;Kado&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;Chuyên stablecoin (USDC/USDT trên Solana, Base, Polygon, Ethereum).&lt;/li&gt;
  &lt;li&gt;Phí rút tiền pháp định rẻ nhất (~1.5% cố định).&lt;/li&gt;
  &lt;li&gt;Hỗ trợ 170+ quốc gia, phương thức chuyển khoản ngân hàng, thẻ, SEPA.&lt;/li&gt;
  &lt;li&gt;API tối ưu cho app stablecoin: nạp ví, rút về bank cùng 1 tài khoản.&lt;/li&gt;
  &lt;li&gt;Tài liệu ngắn gọn, rõ ràng.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Phù hợp nhất:&lt;/strong&gt; App stablecoin, ngân hàng số, công cụ payroll muốn phí rút tiền thấp.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="stripe-crypto-onramp"&gt;Stripe Crypto Onramp&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;Phù hợp nhất nếu bạn đã dùng Stripe.&lt;/li&gt;
  &lt;li&gt;Dùng lại account/anti-fraud/dashboard Stripe, phí 1.5% + phí Stripe.&lt;/li&gt;
  &lt;li&gt;Phạm vi ưu tiên Mỹ, đang mở rộng quốc tế.&lt;/li&gt;
  &lt;li&gt;Nhúng đơn giản: 1 embed, Stripe lo KYC/thanh toán.&lt;/li&gt;
  &lt;li&gt;Rút tiền pháp định không phải trọng tâm – chủ yếu là chuyển tiền vào USDC/ETH.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Phù hợp nhất:&lt;/strong&gt; App Stripe Mỹ muốn on-ramp nhanh, không tích hợp nhà cung cấp mới.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="cách-lựa-chọn"&gt;Cách lựa chọn&lt;/h2&gt;

&lt;ol&gt;
  &lt;li&gt;Liệt kê 3 quốc gia lớn nhất &amp;amp; phương thức thanh toán phổ biến tại đó.&lt;/li&gt;
  &lt;li&gt;Nếu cần UPI, Pix, hoặc phạm vi thẻ rộng ở châu Phi → chọn Transak hoặc MoonPay.&lt;/li&gt;
  &lt;li&gt;Ưu tiên EU → chọn Ramp.&lt;/li&gt;
  &lt;li&gt;Thị trường Mỹ, cần thương hiệu lớn → chọn Coinbase hoặc Stripe SDK.&lt;/li&gt;
  &lt;li&gt;App gốc stablecoin, rút tiền pháp định lớn → cân nhắc Kado.&lt;/li&gt;
  &lt;li&gt;So sánh thêm về giá, hỗ trợ rút tiền pháp định, sự khác biệt widget/API.&lt;/li&gt;
  &lt;li&gt;Luôn thử nghiệm song song 2 nhà cung cấp; dữ liệu thực tế quan trọng hơn mọi bản trình bày.&lt;/li&gt;
&lt;/ol&gt;

&lt;h2 id="kiểm-tra-api-cổng-chuyển-đổi-tiền-pháp-định-với-apidog"&gt;Kiểm tra API cổng chuyển đổi tiền pháp định với Apidog&lt;/h2&gt;

&lt;ol&gt;
  &lt;li&gt;Trước khi chọn nhà cung cấp, hãy kiểm thử toàn bộ luồng chuyển đổi/rút tiền pháp định ở môi trường thử nghiệm (sandbox).&lt;/li&gt;
  &lt;li&gt;Dùng &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; để import OpenAPI spec của MoonPay, Ramp, Transak... và chạy các request đã xác thực trên sandbox.&lt;/li&gt;
  &lt;li&gt;Tạo script cho endpoint báo giá, mô phỏng KYC, quan sát payload webhook về workspace.&lt;/li&gt;
  &lt;li&gt;Thiết lập 3 môi trường: sandbox, staging, production. Lưu API key từng nhà cung cấp vào biến môi trường Apidog để tránh hard-code secret.&lt;/li&gt;
  &lt;li&gt;Chuỗi các request: lấy báo giá → tạo giao dịch → kiểm tra trạng thái → xác nhận webhook → kích hoạt rút tiền pháp định.&lt;/li&gt;
  &lt;li&gt;Khi flow chạy ổn định trên Apidog, chuyển sang backend chỉ mất vài giờ.&lt;/li&gt;
  &lt;li&gt;
&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Tải Apidog&lt;/a&gt; để bắt đầu kiểm thử.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Nếu bạn quan tâm đến phía ví, xem thêm tổng hợp &lt;a href="http://apidog.com/blog/best-crypto-wallet-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API ví tiền mã hóa tốt nhất&lt;/a&gt;.&lt;/p&gt;

&lt;h2 id="câu-hỏi-thường-gặp"&gt;Câu hỏi thường gặp&lt;/h2&gt;

&lt;ul&gt;
  &lt;li&gt;
    &lt;strong&gt;Khác biệt giữa cổng chuyển đổi (on-ramp) và cổng rút tiền (off-ramp) là gì?&lt;/strong&gt;
    Cổng chuyển đổi đưa tiền pháp định (thẻ, chuyển khoản ngân hàng, hệ thống địa phương) thành crypto và chuyển vào ví. Cổng rút tiền làm ngược lại: nhận crypto, chuyển tiền pháp định về tài khoản/thẻ.
  &lt;/li&gt;
  &lt;li&gt;
    &lt;strong&gt;Có cần giấy phép chuyển tiền để dùng các API này không?&lt;/strong&gt;
    Thường là không. Đa số nhà cung cấp đã có giấy phép và xử lý tuân thủ đầu-cuối, bạn chỉ là đối tác kỹ thuật. Nếu muốn giữ tiền khách hàng hoặc tùy chỉnh KYC sâu, có thể phải xin giấy phép riêng – đọc kỹ điều khoản từng nhà cung cấp.
  &lt;/li&gt;
  &lt;li&gt;
    &lt;strong&gt;Nhà cung cấp nào phí thấp nhất?&lt;/strong&gt;
    Thẻ ở EU: Ramp Network thường thấp nhất (0.49–2.9%). Rút tiền pháp định: Kado chỉ 1.5% cố định. Stripe cũng rẻ nếu bạn đã dùng. Luôn so sánh thực tế theo hành lang thanh toán.
  &lt;/li&gt;
  &lt;li&gt;
    &lt;strong&gt;Có thể dùng nhiều nhà cung cấp đồng thời không?&lt;/strong&gt;
    Có, nhiều app đang routing theo quốc gia, phương thức, tiền tệ để tối ưu chuyển đổi và chi phí. Xem thêm &lt;a href="http://apidog.com/blog/how-to-use-moonpay-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn chi tiết API MoonPay&lt;/a&gt;.
  &lt;/li&gt;
  &lt;li&gt;
    &lt;strong&gt;KYC mất bao lâu?&lt;/strong&gt;
    Thẻ + upload tài liệu: 2–5 phút. KYC liên kết bank qua Open Banking (Ramp) có thể xong dưới 30 giây với user cũ. Nếu bị flag rủi ro cao, review thủ công 24–48 giờ.
  &lt;/li&gt;
  &lt;li&gt;
    &lt;strong&gt;Các nhà cung cấp này có hỗ trợ stablecoin không?&lt;/strong&gt;
    Có. USDC/USDT trên Ethereum, Solana, Base, Polygon đều được hỗ trợ. Kado &amp;amp; Stripe Crypto Onramp tối ưu cho stablecoin; các nhà cung cấp khác coi stablecoin là 1 lựa chọn trong nhiều loại coin.
  &lt;/li&gt;
&lt;/ul&gt;

</description>
    </item>
    <item>
      <title>Cách Sử Dụng MetaMask API: Kết Nối dApp với Ví Ethereum</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Thu, 23 Apr 2026 07:45:52 +0000</pubDate>
      <link>https://dev.to/sebbasstian/cach-su-dung-metamask-api-ket-noi-dapp-voi-vi-ethereum-4b8j</link>
      <guid>https://dev.to/sebbasstian/cach-su-dung-metamask-api-ket-noi-dapp-voi-vi-ethereum-4b8j</guid>
      <description>&lt;p&gt;MetaMask là cổng truy cập Ethereum mặc định cho hàng chục triệu người dùng. Nếu bạn xây dựng dApp, MetaMask API là cầu nối giữa frontend và khóa ký của người dùng. "MetaMask API" thực chất gồm hai phần: nhà cung cấp &lt;code&gt;window.ethereum&lt;/code&gt; (chuẩn &lt;a href="https://eips.ethereum.org/EIPS/eip-1193" rel="noopener noreferrer"&gt;EIP-1193&lt;/a&gt;) được inject vào trình duyệt, và MetaMask SDK mở rộng cho mobile, React Native, Node.js. Nắm chắc provider này, bạn đã kiểm soát được 80% tích hợp ví trên web.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Bài này hướng dẫn bạn phát hiện provider, yêu cầu tài khoản, đọc chain hiện tại, ký message với &lt;code&gt;personal_sign&lt;/code&gt; và EIP-712, gửi transaction, thêm/chuyển chain, và sử dụng MetaMask SDK ngoài browser extension. Ngoài ra, bạn sẽ thấy ethers.js v6, viem đóng vai trò wrapper như thế nào, và &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; hỗ trợ kiểm thử JSON-RPC mà không cần viết code frontend một lần.&lt;/p&gt;

&lt;p&gt;Nếu làm việc với ví, hãy bookmark hướng dẫn &lt;a href="http://apidog.com/blog/best-crypto-wallet-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API ví tiền điện tử tốt nhất&lt;/a&gt; để tổng quan hơn về các provider.&lt;/p&gt;

&lt;h2&gt;
  
  
  TL;DR (Tóm tắt)
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;MetaMask API là EIP-1193 provider ở &lt;code&gt;window.ethereum&lt;/code&gt; + MetaMask SDK cho mobile/Node.&lt;/li&gt;
&lt;li&gt;Khởi đầu với &lt;code&gt;eth_requestAccounts&lt;/code&gt; để kết nối, sau đó lắng nghe &lt;code&gt;accountsChanged&lt;/code&gt; và &lt;code&gt;chainChanged&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;Ký message với &lt;code&gt;personal_sign&lt;/code&gt;; ký dữ liệu cấu trúc với &lt;code&gt;eth_signTypedData_v4&lt;/code&gt; (EIP-712).&lt;/li&gt;
&lt;li&gt;Chuyển network bằng &lt;code&gt;wallet_switchEthereumChain&lt;/code&gt; (EIP-3326), thêm chain mới với &lt;code&gt;wallet_addEthereumChain&lt;/code&gt; (EIP-3085).&lt;/li&gt;
&lt;li&gt;ethers.js v6, viem và wagmi là wrapper cấp cao; Snaps mở rộng MetaMask.&lt;/li&gt;
&lt;li&gt;Sử dụng Apidog để test endpoint JSON-RPC, mô phỏng transaction &amp;amp; debug signature trước khi production.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  MetaMask API là gì?
&lt;/h2&gt;

&lt;p&gt;MetaMask API cung cấp interface để web/app tương tác với Ethereum hoặc bất kỳ chuỗi EVM nào. Extension sẽ inject object &lt;code&gt;window.ethereum&lt;/code&gt; tuân thủ EIP-1193. Mọi dApp tuân EIP-1193 sẽ chạy với MetaMask, Coinbase Wallet, Rabby, Frame v.v mà không cần thay đổi code.&lt;/p&gt;

&lt;p&gt;Với mobile, backend, desktop, &lt;a href="https://github.com/MetaMask/metamask-sdk" rel="noopener noreferrer"&gt;MetaMask SDK&lt;/a&gt; cung cấp provider tương tự cho React Native, Node.js, Electron, script server-side. SDK xử lý deep-link và quy trình QR để ví MetaMask mobile ký các request từ desktop/backend. Tất cả vẫn nói EIP-1193 nên code không đổi.&lt;/p&gt;

&lt;p&gt;MetaMask cũng có &lt;a href="https://docs.metamask.io/snaps/" rel="noopener noreferrer"&gt;Snaps&lt;/a&gt;, hệ plugin mở rộng ví với chain mới, RPC custom, loại tài khoản mới. Snaps ngoài phạm vi bài này, nhưng rất hữu ích nếu bạn cần hỗ trợ non-EVM chain hoặc custom signing flow.&lt;/p&gt;

&lt;h2&gt;
  
  
  Xác thực và thiết lập
&lt;/h2&gt;

&lt;p&gt;Không cần API key cho provider. Xác thực dựa vào user approve từng request trên giao diện ví. Bạn cần: cách phát hiện provider và lắng nghe events.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Phát hiện provider:&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Dùng helper &lt;code&gt;@metamask/detect-provider&lt;/code&gt; hoặc kiểm tra trực tiếp.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="c1"&gt;// Phát hiện MetaMask với Vanilla JS&lt;/span&gt;
&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="nx"&gt;detectEthereumProvider&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;@metamask/detect-provider&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;provider&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nf"&gt;detectEthereumProvider&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt; &lt;span class="na"&gt;mustBeMetaMask&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="kc"&gt;true&lt;/span&gt; &lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="k"&gt;if &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="o"&gt;!&lt;/span&gt;&lt;span class="nx"&gt;provider&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="nf"&gt;alert&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Vui lòng cài đặt MetaMask&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;else&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Đã phát hiện MetaMask&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;strong&gt;Lắng nghe sự kiện:&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Luôn set listener cho &lt;code&gt;accountsChanged&lt;/code&gt; và &lt;code&gt;chainChanged&lt;/code&gt; trước bất kỳ request nào.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;on&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;accountsChanged&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;accounts&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="o"&gt;=&amp;gt;&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="k"&gt;if &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;accounts&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;length&lt;/span&gt; &lt;span class="o"&gt;===&lt;/span&gt; &lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Người dùng đã ngắt kết nối&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt;
  &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;else&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Tài khoản đang hoạt động:&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;accounts&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;]);&lt;/span&gt;
  &lt;span class="p"&gt;}&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;on&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;chainChanged&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;chainId&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="o"&gt;=&amp;gt;&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="c1"&gt;// Best practice: reload lại app khi chain đổi&lt;/span&gt;
  &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;location&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;reload&lt;/span&gt;&lt;span class="p"&gt;();&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Nếu dùng React, wagmi sẽ tự động nhận diện MetaMask qua injected connector.&lt;/p&gt;

&lt;h2&gt;
  
  
  Các điểm cuối cốt lõi
&lt;/h2&gt;

&lt;p&gt;Toàn bộ lệnh gọi qua &lt;code&gt;window.ethereum.request({ method, params })&lt;/code&gt;. Dưới đây là các call phổ biến nhất.&lt;/p&gt;

&lt;h3&gt;
  
  
  Yêu cầu tài khoản và đọc chuỗi
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="c1"&gt;// Nhắc user connect ví&lt;/span&gt;
&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;accounts&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;method&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;eth_requestAccounts&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;
&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;account&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nx"&gt;accounts&lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="mi"&gt;0&lt;/span&gt;&lt;span class="p"&gt;];&lt;/span&gt;

&lt;span class="c1"&gt;// Đọc chain hiện tại&lt;/span&gt;
&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;chainId&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;method&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;eth_chainId&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;

&lt;span class="nx"&gt;console&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;log&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;account&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;chainId&lt;/span&gt;&lt;span class="p"&gt;);&lt;/span&gt; &lt;span class="c1"&gt;// '0x...' '0x1'&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Ví dụ gọi thô qua curl:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;curl https://mainnet.infura.io/v3/YOUR_KEY &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-X&lt;/span&gt; POST &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-H&lt;/span&gt; &lt;span class="s2"&gt;"Content-Type: application/json"&lt;/span&gt; &lt;span class="se"&gt;\&lt;/span&gt;
  &lt;span class="nt"&gt;-d&lt;/span&gt; &lt;span class="s1"&gt;'{"jsonrpc":"2.0","method":"eth_chainId","params":[],"id":1}'&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Lưu ý: call chỉ-read có thể dùng node provider như Alchemy/Infura, không cần MetaMask. Xem &lt;a href="http://apidog.com/blog/how-to-use-alchemy-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn Alchemy API&lt;/a&gt; để biết thêm.&lt;/p&gt;

&lt;h3&gt;
  
  
  Ký message đơn giản
&lt;/h3&gt;

&lt;p&gt;&lt;code&gt;personal_sign&lt;/code&gt; là dạng ký phổ biến, an toàn hơn so với eth_sign.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;message&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Đăng nhập vào Apidog vào lúc &lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="o"&gt;+&lt;/span&gt; &lt;span class="k"&gt;new&lt;/span&gt; &lt;span class="nc"&gt;Date&lt;/span&gt;&lt;span class="p"&gt;().&lt;/span&gt;&lt;span class="nf"&gt;toISOString&lt;/span&gt;&lt;span class="p"&gt;();&lt;/span&gt;
&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;signature&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;method&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;personal_sign&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;params&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="nx"&gt;message&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;account&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Ký dữ liệu cấu trúc (EIP-712)
&lt;/h3&gt;

&lt;p&gt;Sử dụng &lt;code&gt;eth_signTypedData_v4&lt;/code&gt; để ký structured data.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;typedData&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="na"&gt;domain&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Apidog Demo&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;version&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;1&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;chainId&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mi"&gt;1&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
  &lt;span class="na"&gt;types&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="na"&gt;EIP712Domain&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;
      &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;name&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;type&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;string&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
      &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;version&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;type&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;string&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
      &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;chainId&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;type&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;uint256&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;],&lt;/span&gt;
    &lt;span class="na"&gt;Login&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;
      &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;wallet&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;type&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;address&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
      &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;nonce&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;type&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;uint256&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
    &lt;span class="p"&gt;],&lt;/span&gt;
  &lt;span class="p"&gt;},&lt;/span&gt;
  &lt;span class="na"&gt;primaryType&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Login&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;message&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;wallet&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;account&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;nonce&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mi"&gt;42&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
&lt;span class="p"&gt;};&lt;/span&gt;

&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;sig&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;method&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;eth_signTypedData_v4&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;params&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="nx"&gt;account&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;JSON&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;stringify&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;typedData&lt;/span&gt;&lt;span class="p"&gt;)],&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Gửi transaction
&lt;/h3&gt;

&lt;p&gt;MetaMask tự estimate gas và nonce.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="nx"&gt;txHash&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
  &lt;span class="na"&gt;method&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;eth_sendTransaction&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
  &lt;span class="na"&gt;params&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[{&lt;/span&gt;
    &lt;span class="na"&gt;from&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="nx"&gt;account&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="na"&gt;to&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;0xRecipientAddressHere&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="na"&gt;value&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;0x38d7ea4c68000&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="c1"&gt;// 0.001 ETH (wei, hex)&lt;/span&gt;
  &lt;span class="p"&gt;}],&lt;/span&gt;
&lt;span class="p"&gt;});&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Chuyển đổi/Thêm chain
&lt;/h3&gt;

&lt;p&gt;EIP-3326/EIP-3085 cho phép chuyển chain hoặc thêm chain mới.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight javascript"&gt;&lt;code&gt;&lt;span class="c1"&gt;// Chuyển sang Polygon (chainId 137 = 0x89)&lt;/span&gt;
&lt;span class="k"&gt;try&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
    &lt;span class="na"&gt;method&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;wallet_switchEthereumChain&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
    &lt;span class="na"&gt;params&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[{&lt;/span&gt; &lt;span class="na"&gt;chainId&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;0x89&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="p"&gt;}],&lt;/span&gt;
  &lt;span class="p"&gt;});&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;catch &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;err&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="k"&gt;if &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="nx"&gt;err&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;code&lt;/span&gt; &lt;span class="o"&gt;===&lt;/span&gt; &lt;span class="mi"&gt;4902&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
    &lt;span class="c1"&gt;// Chain chưa được thêm&lt;/span&gt;
    &lt;span class="k"&gt;await&lt;/span&gt; &lt;span class="nb"&gt;window&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nx"&gt;ethereum&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;request&lt;/span&gt;&lt;span class="p"&gt;({&lt;/span&gt;
      &lt;span class="na"&gt;method&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;wallet_addEthereumChain&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
      &lt;span class="na"&gt;params&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[{&lt;/span&gt;
        &lt;span class="na"&gt;chainId&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;0x89&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="na"&gt;chainName&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Polygon&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;
        &lt;span class="na"&gt;rpcUrls&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;https://polygon-rpc.com&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;
        &lt;span class="na"&gt;nativeCurrency&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;MATIC&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;symbol&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;MATIC&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="na"&gt;decimals&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="mi"&gt;18&lt;/span&gt; &lt;span class="p"&gt;},&lt;/span&gt;
      &lt;span class="p"&gt;}],&lt;/span&gt;
    &lt;span class="p"&gt;});&lt;/span&gt;
  &lt;span class="p"&gt;}&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Tích hợp React với MetaMask SDK
&lt;/h3&gt;

&lt;p&gt;SDK hoạt động tốt trên React khi bạn muốn support extension, deep link mobile, hoặc in-app browser.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight jsx"&gt;&lt;code&gt;&lt;span class="k"&gt;import&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="nx"&gt;MetaMaskProvider&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;useSDK&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="k"&gt;from&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;@metamask/sdk-react&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="p"&gt;;&lt;/span&gt;

&lt;span class="kd"&gt;function&lt;/span&gt; &lt;span class="nf"&gt;Connect&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="kd"&gt;const&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="nx"&gt;sdk&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;connected&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="nx"&gt;account&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="nf"&gt;useSDK&lt;/span&gt;&lt;span class="p"&gt;();&lt;/span&gt;
  &lt;span class="k"&gt;return &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="p"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nt"&gt;button&lt;/span&gt; &lt;span class="na"&gt;onClick&lt;/span&gt;&lt;span class="p"&gt;=&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt; &lt;span class="o"&gt;=&amp;gt;&lt;/span&gt; &lt;span class="nx"&gt;sdk&lt;/span&gt;&lt;span class="p"&gt;?.&lt;/span&gt;&lt;span class="nf"&gt;connect&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
      &lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="nx"&gt;connected&lt;/span&gt; &lt;span class="p"&gt;?&lt;/span&gt; &lt;span class="nx"&gt;account&lt;/span&gt; &lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;Kết nối MetaMask&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;
    &lt;span class="p"&gt;&amp;lt;/&lt;/span&gt;&lt;span class="nt"&gt;button&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
  &lt;span class="p"&gt;);&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;

&lt;span class="k"&gt;export&lt;/span&gt; &lt;span class="k"&gt;default&lt;/span&gt; &lt;span class="kd"&gt;function&lt;/span&gt; &lt;span class="nf"&gt;App&lt;/span&gt;&lt;span class="p"&gt;()&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt;
  &lt;span class="k"&gt;return &lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;
    &lt;span class="p"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nc"&gt;MetaMaskProvider&lt;/span&gt; &lt;span class="na"&gt;sdkOptions&lt;/span&gt;&lt;span class="p"&gt;=&lt;/span&gt;&lt;span class="si"&gt;{&lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;dappMetadata&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="p"&gt;{&lt;/span&gt; &lt;span class="na"&gt;name&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt; &lt;span class="dl"&gt;'&lt;/span&gt;&lt;span class="s1"&gt;dApp của tôi&lt;/span&gt;&lt;span class="dl"&gt;'&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt; &lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="si"&gt;}&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
      &lt;span class="p"&gt;&amp;lt;&lt;/span&gt;&lt;span class="nc"&gt;Connect&lt;/span&gt; &lt;span class="p"&gt;/&amp;gt;&lt;/span&gt;
    &lt;span class="p"&gt;&amp;lt;/&lt;/span&gt;&lt;span class="nc"&gt;MetaMaskProvider&lt;/span&gt;&lt;span class="p"&gt;&amp;gt;&lt;/span&gt;
  &lt;span class="p"&gt;);&lt;/span&gt;
&lt;span class="p"&gt;}&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Sản xuất nên wrap provider với ethers.js v6 hoặc viem để có contract type, decode ABI, thông báo lỗi tốt hơn. Nếu cần đăng nhập email/social fallback, có thể kết hợp MetaMask với embedded wallet, xem &lt;a href="http://apidog.com/blog/how-to-use-privy-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn Privy API&lt;/a&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  Lỗi phổ biến &amp;amp; giới hạn tỷ lệ
&lt;/h2&gt;

&lt;p&gt;MetaMask trả về mã lỗi JSON-RPC tiêu chuẩn:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;code&gt;4001&lt;/code&gt;: User từ chối request. Không tự động retry.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;4100&lt;/code&gt;: Chưa ủy quyền. Gọi &lt;code&gt;eth_requestAccounts&lt;/code&gt; trước.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;4200&lt;/code&gt;: Method không hỗ trợ. Xác nhận đúng ví MetaMask.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;4902&lt;/code&gt;: Chain chưa được thêm. Gọi &lt;code&gt;wallet_addEthereumChain&lt;/code&gt;.&lt;/li&gt;
&lt;li&gt;
&lt;code&gt;-32002&lt;/code&gt;: Request đang chờ xử lý. Debounce phía frontend.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Provider không giới hạn rate, nhưng RPC (Infura/Alchemy) có hạn mức tùy gói. Đổi sang fiat như ETH-USD, hãy xem &lt;a href="http://apidog.com/blog/best-fiat-on-ramp-off-ramp-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API on/off ramp fiat&lt;/a&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  Giá của MetaMask API
&lt;/h2&gt;

&lt;p&gt;MetaMask Extension + SDK đều miễn phí, không tính phí kết nối, ký hay transaction. MetaMask thu phí qua swap và thẻ MetaMask Card, không thu từ developer.&lt;/p&gt;

&lt;p&gt;Bạn chỉ cần trả phí cho node RPC (Infura/Alchemy). Gói free đủ cho app nhỏ; production dApp thường tốn 49–299 USD/tháng tùy thông lượng.&lt;/p&gt;

&lt;h2&gt;
  
  
  Kiểm tra MetaMask API với Apidog
&lt;/h2&gt;

&lt;p&gt;Ký trình duyệt rất khó debug do request đi qua extension, web, và có thể cả deep-link mobile. &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; giúp bạn test endpoint JSON-RPC thô, xác nhận &lt;code&gt;eth_chainId&lt;/code&gt; hoặc &lt;code&gt;eth_getBalance&lt;/code&gt; trả đúng, và lưu trữ toàn bộ flow thành test collection.&lt;/p&gt;

&lt;p&gt;Chỉ cần import đặc tả Ethereum JSON-RPC, set URL node thành biến môi trường là bạn có collection dùng lại cho mọi EVM chain. Apidog mô phỏng response, cho phép frontend dev build trên &lt;code&gt;eth_sendTransaction&lt;/code&gt; giả trong khi smart contract đang audit. CI có thể chạy bộ test từ CLI và fail nếu response shape đổi. Nếu bạn từng struggle với Postman collection sync, đọc &lt;a href="http://apidog.com/blog/api-testing-without-postman-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn kiểm thử API không cần Postman 2026&lt;/a&gt; để hiểu vì sao Apidog phù hợp test dApp đa giao thức.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;&lt;strong&gt;Tải xuống Apidog&lt;/strong&gt;&lt;/a&gt; để bắt đầu.&lt;/p&gt;

&lt;h2&gt;
  
  
  Câu hỏi thường gặp
&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;MetaMask API có dùng trên mobile được không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có. Dùng MetaMask SDK để deep link sang app mobile. Provider interface y hệt extension nên code không thay đổi. Đọc thêm so sánh SDK ví mobile tại &lt;a href="http://apidog.com/blog/best-crypto-wallet-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;API ví tiền điện tử tốt nhất&lt;/a&gt;.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Phân biệt &lt;code&gt;eth_sign&lt;/code&gt;, &lt;code&gt;personal_sign&lt;/code&gt; và &lt;code&gt;eth_signTypedData_v4&lt;/code&gt;?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
&lt;code&gt;eth_sign&lt;/code&gt; ký byte thô, nguy hiểm – MetaMask cảnh báo mạnh. &lt;code&gt;personal_sign&lt;/code&gt; ký message có tiền tố dễ đọc. &lt;code&gt;eth_signTypedData_v4&lt;/code&gt; ký structured data EIP-712, hiển thị field rõ ràng cho user trên UI. Dùng hai cái sau, tránh &lt;code&gt;eth_sign&lt;/code&gt;.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có cần API key riêng của MetaMask không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Không. Provider miễn phí, không cần key. Đọc dữ liệu ngoài ví thì cần RPC provider như Infura/Alchemy (có key riêng).&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;ethers.js hoặc viem dùng với MetaMask được không?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Được, cả hai đều wrap &lt;code&gt;window.ethereum&lt;/code&gt;. Ethers v6 dùng &lt;code&gt;BrowserProvider(window.ethereum)&lt;/code&gt;, viem dùng &lt;code&gt;createWalletClient({ transport: custom(window.ethereum) })&lt;/code&gt;. Production dApp nên dùng.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Nếu user cài nhiều ví thì sao?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
MetaMask hỗ trợ EIP-6963 giúp dApp phát hiện toàn bộ ví đã cài thay vì tranh chấp &lt;code&gt;window.ethereum&lt;/code&gt;. Wagmi, RainbowKit xử lý tự động.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;MetaMask Snaps đã production ready chưa?&lt;/strong&gt;&lt;br&gt;&lt;br&gt;
Có, đã phát hành rộng 2024. Phần lớn dùng cho non-EVM chain, custom transaction info, tích hợp ví phần cứng.&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Hướng Dẫn Sử Dụng Plaid API (Phiên Bản 2026 Dành Cho Nhà Phát Triển)</title>
      <dc:creator>Sebastian Petrus</dc:creator>
      <pubDate>Thu, 23 Apr 2026 07:43:27 +0000</pubDate>
      <link>https://dev.to/sebbasstian/huong-dan-su-dung-plaid-api-phien-ban-2026-danh-cho-nha-phat-trien-4ag1</link>
      <guid>https://dev.to/sebbasstian/huong-dan-su-dung-plaid-api-phien-ban-2026-danh-cho-nha-phat-trien-4ag1</guid>
      <description>&lt;p&gt;Các ứng dụng Fintech hiện đại thường tích hợp với tài khoản ngân hàng của người dùng ngay từ đầu. Plaid đóng vai trò trung gian, chuyển đổi thông tin đăng nhập ngân hàng thành dữ liệu JSON sạch mà backend của bạn có thể thao tác. API Plaid hỗ trợ liên kết tài khoản, kiểm tra số dư, truy xuất lịch sử giao dịch và xác minh danh tính cho hàng nghìn ứng dụng như Venmo, Robinhood, Chime.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://apidog.com/?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation" class="crayons-btn crayons-btn--primary"&gt;Dùng thử Apidog ngay hôm nay&lt;/a&gt;
&lt;/p&gt;

&lt;p&gt;Bài viết này hướng dẫn bạn sử dụng API Plaid dưới góc độ kỹ thuật: lấy khóa, thực hiện quy trình Link token từ đầu đến cuối, các sản phẩm cốt lõi, ý nghĩa các lỗi thường gặp, và cách kiểm thử từng bước với &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt;. Để tra cứu chi tiết, hãy mở &lt;a href="https://plaid.com/docs/" rel="noopener noreferrer"&gt;tài liệu chính thức của Plaid&lt;/a&gt; song song khi đọc.&lt;/p&gt;

&lt;p&gt;Nếu bạn còn phân vân giữa các nền tảng ngân hàng mở, hãy tham khảo bài tổng hợp &lt;a href="http://apidog.com/blog/best-open-banking-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;các API ngân hàng mở tốt nhất&lt;/a&gt;. Ở đây, ta giả định bạn đã chọn Plaid và bắt đầu triển khai.&lt;/p&gt;

&lt;h2 id="t%C3%B3m-t%E1%BA%AFt"&gt;Tóm tắt&lt;/h2&gt;

&lt;ul&gt;
  &lt;li&gt;Plaid kết nối ứng dụng với hơn 12.000 ngân hàng tại Mỹ, Canada, Châu Âu.&lt;/li&gt;
  &lt;li&gt;Ba môi trường: sandbox (miễn phí, dữ liệu giả), development (100 Item thực miễn phí), production (tính phí).&lt;/li&gt;
  &lt;li&gt;Quy trình liên kết: tạo &lt;code&gt;link_token&lt;/code&gt; (server) → mở Plaid Link (client) → đổi &lt;code&gt;public_token&lt;/code&gt; lấy &lt;code&gt;access_token&lt;/code&gt; (server) → gọi các endpoint sản phẩm.&lt;/li&gt;
  &lt;li&gt;Các sản phẩm chính: Auth, Balance, Transactions, Identity, Investments, Liabilities, Income. Kích hoạt từng Item.&lt;/li&gt;
  &lt;li&gt;Lỗi phổ biến: &lt;code&gt;ITEM_LOGIN_REQUIRED&lt;/code&gt;, &lt;code&gt;INVALID_CREDENTIALS&lt;/code&gt;. Webhook cảnh báo khi Item gặp vấn đề.&lt;/li&gt;
  &lt;li&gt;Giới hạn tần suất theo Item và client. Ưu tiên đọc hàng loạt và lắng nghe webhook thay vì polling.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="plaid-l%C3%A0-g%C3%AC"&gt;Plaid là gì?&lt;/h2&gt;

&lt;p&gt;Plaid là nền tảng hạ tầng fintech đặt giữa app của bạn và ngân hàng của người dùng. Người dùng nhập thông tin vào Plaid Link; Plaid sẽ kết nối với ngân hàng (qua API chính thức hoặc reverse engineering web), chuẩn hóa dữ liệu và trả về phản hồi JSON đồng nhất — bạn không cần xử lý sự khác biệt từng ngân hàng.&lt;/p&gt;

&lt;p&gt;Bạn không lưu trữ thông tin đăng nhập ngân hàng. Plaid giữ kết nối (gọi là &lt;strong&gt;Item&lt;/strong&gt;), cung cấp &lt;code&gt;access_token&lt;/code&gt; để truy vấn. Một Item là một thông tin đăng nhập tại một tổ chức tài chính, có thể chứa nhiều loại tài khoản.&lt;/p&gt;

&lt;p&gt;Plaid hỗ trợ tài khoản tiền gửi, tiết kiệm, thẻ tín dụng, khoản vay, đầu tư và bảng lương. Plaid không xử lý chuyển tiền trực tiếp; muốn chuyển khoản ACH, hãy kết hợp Plaid Auth với một payment processor. Tham khảo thêm ở &lt;a href="http://apidog.com/blog/best-ach-payments-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;danh sách API thanh toán ACH tốt nhất&lt;/a&gt;.&lt;/p&gt;

&lt;h2 id="x%C3%A1c-th%E1%BB%B1c-v%C3%A0-thi%E1%BA%BFt-l%E1%BA%ADp"&gt;Xác thực và thiết lập&lt;/h2&gt;

&lt;h3 id="b%C6%B0%E1%BB%9Bc-1-t%E1%BA%A1o-t%C3%A0i-kho%E1%BA%A3n-nh%C3%A0-ph%C3%A1t-tri%E1%BB%83n-plaid"&gt;Bước 1: Đăng ký tài khoản Plaid Developer&lt;/h3&gt;

&lt;p&gt;Truy cập &lt;a href="https://plaid.com" rel="noopener noreferrer"&gt;plaid.com&lt;/a&gt;, đăng ký, xác minh email. Dashboard cấp sẵn 3 môi trường:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;strong&gt;Sandbox&lt;/strong&gt;: tổ chức/người dùng giả, miễn phí. Đăng nhập dùng &lt;code&gt;user_good&lt;/code&gt; / &lt;code&gt;pass_good&lt;/code&gt;.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Development&lt;/strong&gt;: kết nối ngân hàng thực, tối đa 100 Item thực, miễn phí.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Production&lt;/strong&gt;: không giới hạn, tính phí theo usage.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="b%C6%B0%E1%BB%9Bc-2-l%E1%BA%A5y-kh%C3%B3a-c%E1%BB%A7a-b%E1%BA%A1n"&gt;Bước 2: Lấy khóa API&lt;/h3&gt;

&lt;p&gt;Vào &lt;strong&gt;Team Settings &amp;gt; Keys&lt;/strong&gt; trên Dashboard.&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;code&gt;client_id&lt;/code&gt;: dùng cho mọi môi trường&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;secret&lt;/code&gt;: riêng mỗi môi trường (sandbox, development, production)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Lưu vào biến môi trường, không commit lên git.&lt;/p&gt;

&lt;h3 id="b%C6%B0%E1%BB%9Bc-3-c%C3%A0i-%C4%91%E1%BA%B7t-sdk"&gt;Bước 3: Cài đặt SDK&lt;/h3&gt;

&lt;p&gt;SDK Node.js: &lt;a href="https://github.com/plaid/plaid-node" rel="noopener noreferrer"&gt;github.com/plaid/plaid-node&lt;/a&gt;&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;npm install plaid
&lt;/code&gt;&lt;/pre&gt;

&lt;h3 id="b%C6%B0%E1%BB%9Bc-4-kh%E1%BB%9Fi-t%E1%BA%A1o-m%C3%A1y-kh%C3%A1ch"&gt;Bước 4: Khởi tạo client Plaid&lt;/h3&gt;

&lt;pre&gt;&lt;code&gt;import { Configuration, PlaidApi, PlaidEnvironments } from 'plaid';

const config = new Configuration({
  basePath: PlaidEnvironments.sandbox,
  baseOptions: {
    headers: {
      'PLAID-CLIENT-ID': process.env.PLAID_CLIENT_ID,
      'PLAID-SECRET': process.env.PLAID_SECRET,
    },
  },
});

const client = new PlaidApi(config);
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Chuyển &lt;code&gt;PlaidEnvironments.sandbox&lt;/code&gt; thành &lt;code&gt;.development&lt;/code&gt; hoặc &lt;code&gt;.production&lt;/code&gt; khi deploy lên môi trường tương ứng.&lt;/p&gt;

&lt;h2 id="c%C3%A1c-endpoint-c%E1%BB%91t-l%C3%B5i"&gt;Các endpoint cốt lõi&lt;/h2&gt;

&lt;h3 id="quy-tr%C3%ACnh-link-token"&gt;Quy trình Link token&lt;/h3&gt;

&lt;p&gt;Tích hợp Plaid luôn tuân theo 4 bước:&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;Tạo link_token (server-side)&lt;/strong&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;pre&gt;&lt;code&gt;const response = await client.linkTokenCreate({
  user: { client_user_id: 'user_123' },
  client_name: 'Your App',
  products: ['auth', 'transactions'],
  country_codes: ['US'],
  language: 'en',
});
const linkToken = response.data.link_token;
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Hoặc bằng curl:&lt;/p&gt;

&lt;pre&gt;&lt;code&gt;curl -X POST https://sandbox.plaid.com/link/token/create \
  -H 'Content-Type: application/json' \
  -d '{
    "client_id": "YOUR_CLIENT_ID",
    "secret": "YOUR_SANDBOX_SECRET",
    "user": { "client_user_id": "user_123" },
    "client_name": "Your App",
    "products": ["auth", "transactions"],
    "country_codes": ["US"],
    "language": "en"
  }'
&lt;/code&gt;&lt;/pre&gt;

&lt;ol start="2"&gt;
  &lt;li&gt;&lt;strong&gt;Mở Plaid Link (client-side)&lt;/strong&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Gửi &lt;code&gt;link_token&lt;/code&gt; lên frontend và truyền vào Plaid Link SDK. Người dùng chọn ngân hàng, đăng nhập, SDK trả về &lt;code&gt;public_token&lt;/code&gt; trong callback &lt;code&gt;onSuccess&lt;/code&gt;.&lt;/p&gt;

&lt;ol start="3"&gt;
  &lt;li&gt;&lt;strong&gt;Đổi public_token sang access_token (server-side)&lt;/strong&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;pre&gt;&lt;code&gt;const exchange = await client.itemPublicTokenExchange({
  public_token: publicToken,
});
const accessToken = exchange.data.access_token;
const itemId = exchange.data.item_id;
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;Lưu &lt;code&gt;accessToken&lt;/code&gt; (gắn với user), sử dụng cho các request sau này.&lt;/p&gt;

&lt;ol start="4"&gt;
  &lt;li&gt;&lt;strong&gt;Gọi endpoint sản phẩm (server-side)&lt;/strong&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;pre&gt;&lt;code&gt;const accounts = await client.accountsGet({ access_token: accessToken });
const balance = await client.accountsBalanceGet({ access_token: accessToken });
&lt;/code&gt;&lt;/pre&gt;

&lt;h3 id="c%C3%A1c-endpoint-s%E1%BA%A3n-ph%E1%BA%A9m-b%E1%BA%A1n-n%C3%AAn-bi%E1%BA%BFt"&gt;Các endpoint sản phẩm cần biết&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;strong&gt;Auth&lt;/strong&gt;: Lấy số tài khoản, số routing cho ACH (&lt;code&gt;/auth/get&lt;/code&gt;).&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Balance&lt;/strong&gt;: Lấy số dư thời gian thực (&lt;code&gt;/accounts/balance/get&lt;/code&gt;).&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Transactions&lt;/strong&gt;: Lấy lịch sử giao dịch tối đa 24 tháng (&lt;code&gt;/transactions/sync&lt;/code&gt;).&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Identity&lt;/strong&gt;: Lấy tên, email, SĐT, địa chỉ (&lt;code&gt;/identity/get&lt;/code&gt;). Nếu chỉ cần KYC, tham khảo &lt;a href="http://apidog.com/blog/best-kyc-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;danh sách API KYC tốt nhất&lt;/a&gt;.&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Investments&lt;/strong&gt;: Lấy danh mục tài sản, giao dịch đầu tư (&lt;code&gt;/investments/holdings/get&lt;/code&gt;).&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Liabilities&lt;/strong&gt;: Chi tiết khoản vay, thẻ tín dụng, thế chấp (&lt;code&gt;/liabilities/get&lt;/code&gt;).&lt;/li&gt;
  &lt;li&gt;
&lt;strong&gt;Income&lt;/strong&gt;: Dữ liệu bảng lương qua Plaid Income (&lt;code&gt;/credit/payroll_income/get&lt;/code&gt;).&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id="ki%E1%BB%83m-th%E1%BB%AD-api-plaid-v%E1%BB%9Bi-apidog"&gt;Kiểm thử API Plaid với Apidog&lt;/h2&gt;

&lt;p&gt;Kiểm thử tích hợp Plaid khó vì bước Link diễn ra trên trình duyệt. Để test endpoint server-side với payload hợp lệ, xem lỗi, chia sẻ request với team – &lt;a href="https://apidog.com?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Apidog&lt;/a&gt; là lựa chọn tối ưu.&lt;/p&gt;

&lt;p&gt;Nhập OpenAPI spec của Plaid vào Apidog, bạn sẽ có sẵn mọi endpoint, mẫu dữ liệu, header xác thực. Tạo biến môi trường sandbox (&lt;code&gt;client_id&lt;/code&gt;, &lt;code&gt;secret&lt;/code&gt;, &lt;code&gt;access_token&lt;/code&gt;), chuyển sang production chỉ bằng 1 click. Có thể tạo chuỗi request: &lt;code&gt;linkTokenCreate&lt;/code&gt; → &lt;code&gt;sandboxPublicTokenCreate&lt;/code&gt; → &lt;code&gt;itemPublicTokenExchange&lt;/code&gt; → &lt;code&gt;accountsGet&lt;/code&gt; để kiểm thử cả flow không cần browser.&lt;/p&gt;

&lt;p&gt;Server mock của Apidog giúp frontend lấy phản hồi &lt;code&gt;/accounts/get&lt;/code&gt; trước khi backend hoàn thiện. Nếu chuyển từ công cụ khác, xem hướng dẫn &lt;a href="http://apidog.com/blog/api-testing-without-postman-2026?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;kiểm thử API không cần Postman&lt;/a&gt;. &lt;a href="https://apidog.com/download?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;Tải về Apidog&lt;/a&gt;, trỏ vào spec Plaid và bắt đầu.&lt;/p&gt;

&lt;h2 id="c%C3%A1c-l%E1%BB%97i-th%C6%B0%E1%BB%9Dng-g%E1%BA%B7p-v%C3%A0-gi%E1%BB%9Bi-h%E1%BA%A1n-t%E1%BB%B7-l%E1%BB%87"&gt;Các lỗi thường gặp &amp;amp; giới hạn tần suất&lt;/h2&gt;

&lt;p&gt;Plaid trả về lỗi với &lt;code&gt;error_type&lt;/code&gt;, &lt;code&gt;error_code&lt;/code&gt;, &lt;code&gt;error_message&lt;/code&gt; rõ ràng. 4 lỗi production cần xử lý:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;code&gt;INVALID_CREDENTIALS&lt;/code&gt;: Người dùng nhập sai mật khẩu. Yêu cầu đăng nhập lại qua Link update mode.&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;ITEM_LOGIN_REQUIRED&lt;/code&gt;: Phiên bị ngân hàng hủy (đổi mật khẩu, MFA). Nhận biết qua webhook, kích hoạt Link update để xác thực lại.&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;RATE_LIMIT_EXCEEDED&lt;/code&gt;: Vượt quá giới hạn trên Item hoặc endpoint. Giảm tần suất, retry với backoff ngẫu nhiên.&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;PRODUCT_NOT_READY&lt;/code&gt;: Dữ liệu đang sync. Đợi webhook &lt;code&gt;INITIAL_UPDATE&lt;/code&gt; rồi thử lại.&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id="webhooks"&gt;Webhooks&lt;/h3&gt;

&lt;p&gt;Truyền &lt;code&gt;webhook&lt;/code&gt; URL khi tạo &lt;code&gt;link_token&lt;/code&gt;, Plaid sẽ POST update vào đó. 3 loại quan trọng:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;
&lt;code&gt;SYNC_UPDATES_AVAILABLE&lt;/code&gt;: Có giao dịch mới&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;ITEM: LOGIN_REQUIRED&lt;/code&gt;: Yêu cầu xác thực lại&lt;/li&gt;
  &lt;li&gt;
&lt;code&gt;ITEM: ERROR&lt;/code&gt;: Lỗi không phục hồi&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Luôn xác minh chữ ký JWT trên webhook trước khi xử lý.&lt;/p&gt;

&lt;h3 id="gi%E1%BB%9Bi-h%E1%BA%A1n-t%E1%BB%B7-l%E1%BB%87"&gt;Giới hạn tần suất&lt;/h3&gt;

&lt;p&gt;Plaid áp dụng limit theo Item và endpoint. Ví dụ &lt;code&gt;/accounts/balance/get&lt;/code&gt;: ~5 lần/phút/Item ở production. Một số endpoint còn giới hạn tổng theo client. Thực tế: poll webhook, cache balance vài phút, không gọi Plaid từ endpoint user-facing.&lt;/p&gt;

&lt;h2 id="gi%C3%A1-c%E1%BB%A7a-plaid"&gt;Giá của Plaid&lt;/h2&gt;

&lt;ul&gt;
  &lt;li&gt;Sandbox: miễn phí, không giới hạn.&lt;/li&gt;
  &lt;li&gt;Development: miễn phí đến 100 Items thực.&lt;/li&gt;
  &lt;li&gt;Production:
    &lt;ul&gt;
      &lt;li&gt;Auth: ~$1.50/tài khoản liên kết (một lần)&lt;/li&gt;
      &lt;li&gt;Balance: tính phí theo call&lt;/li&gt;
      &lt;li&gt;Transactions: phí hàng tháng/Item (~$0.30)&lt;/li&gt;
      &lt;li&gt;Identity: tính phí theo call&lt;/li&gt;
      &lt;li&gt;Investments / Liabilities / Income: giá riêng/Item&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Giá có thể thương lượng. Tham khảo &lt;a href="https://plaid.com/products/" rel="noopener noreferrer"&gt;trang sản phẩm Plaid&lt;/a&gt; để cập nhật mới nhất.&lt;/p&gt;

&lt;h2 id="c%C3%A2u-h%E1%BB%8Fi-th%C6%B0%E1%BB%9Dng-g%E1%BA%B7p"&gt;FAQ&lt;/h2&gt;

&lt;p&gt;&lt;strong&gt;access_token tồn tại bao lâu?&lt;/strong&gt; Không hết hạn trừ khi user thu hồi hoặc ngân hàng hủy phiên. Lưu trữ mã hóa phía server.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Dùng Plaid chỉ để xác minh danh tính được không?&lt;/strong&gt; Được, qua Plaid Identity. Nhưng nếu chỉ cần KYC, nên cân nhắc sản phẩm chuyên biệt (&lt;a href="http://apidog.com/blog/how-to-use-stripe-identity-api?utm_source=dev.to&amp;amp;utm_medium=wanda&amp;amp;utm_content=n8n-post-automation"&gt;hướng dẫn Stripe Identity API&lt;/a&gt;).&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Plaid hỗ trợ quốc gia nào?&lt;/strong&gt; Mỹ, Canada, Anh, phần lớn EU. Kiểm tra &lt;code&gt;country_codes&lt;/code&gt; khi gọi &lt;code&gt;/link/token/create&lt;/code&gt;.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;User đổi mật khẩu ngân hàng thì sao?&lt;/strong&gt; Item chuyển sang &lt;code&gt;ITEM_LOGIN_REQUIRED&lt;/code&gt;, nhận webhook, kích hoạt Link update để xác thực lại (không mất access_token).&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Có test quy trình Link không cần browser không?&lt;/strong&gt; Được, dùng endpoint &lt;code&gt;/sandbox/public_token/create&lt;/code&gt; để lấy &lt;code&gt;public_token&lt;/code&gt; test tự động.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Phát triển local thì dùng Plaid thế nào?&lt;/strong&gt; Lưu &lt;code&gt;secret&lt;/code&gt; sandbox vào &lt;code&gt;.env&lt;/code&gt;, kết nối với &lt;code&gt;PlaidEnvironments.sandbox&lt;/code&gt;. Để nhận webhook local, dùng tunneling (ngrok, Cloudflare Tunnel,...).&lt;/p&gt;

</description>
    </item>
  </channel>
</rss>
