<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Midhun Sekhar</title>
    <description>The latest articles on DEV Community by Midhun Sekhar (@midhunweb).</description>
    <link>https://dev.to/midhunweb</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F3866516%2F0d4ccd83-6315-4bb6-b3c2-c9b8a79da963.jpeg</url>
      <title>DEV Community: Midhun Sekhar</title>
      <link>https://dev.to/midhunweb</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/midhunweb"/>
    <language>en</language>
    <item>
      <title>Stop Wasting Tokens: How to Cut Your LLM Costs by 97%</title>
      <dc:creator>Midhun Sekhar</dc:creator>
      <pubDate>Wed, 08 Apr 2026 10:22:31 +0000</pubDate>
      <link>https://dev.to/midhunweb/stop-wasting-tokens-how-to-cut-your-llm-costs-by-97-2ga</link>
      <guid>https://dev.to/midhunweb/stop-wasting-tokens-how-to-cut-your-llm-costs-by-97-2ga</guid>
      <description>&lt;h2&gt;
  
  
  The hidden tax in your AI pipeline
&lt;/h2&gt;

&lt;p&gt;If you're building with GPT or Claude, you’ve probably done this:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;Call an API&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Get a big JSON response&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Send the whole thing to your LLM&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Seems harmless, right?&lt;/p&gt;

&lt;p&gt;It’s not.&lt;/p&gt;

&lt;p&gt;You’re quietly burning money on something you don’t even use.&lt;/p&gt;




&lt;h2&gt;
  
  
  💸 The "metadata tax"
&lt;/h2&gt;

&lt;p&gt;Let’s say your API returns this:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"order"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"id"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;123&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"user"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Midhun"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"email"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"midhun@email.com"&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"items"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;...&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="mi"&gt;100&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;objects&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;...&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"metadata"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;...&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;tons&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;of&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;fields&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="err"&gt;...&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Now ask yourself:&lt;/p&gt;

&lt;p&gt;👉 What does your LLM actually need?&lt;/p&gt;

&lt;p&gt;Probably just this:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Midhun"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"email"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"midhun@email.com"&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  🤯 Here’s the problem
&lt;/h2&gt;

&lt;p&gt;LLMs don’t care what’s useful.&lt;/p&gt;

&lt;p&gt;They charge you for &lt;strong&gt;everything&lt;/strong&gt;.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;Full JSON → ~1500 tokens&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Useful data → ~60 tokens&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;👉 You’re paying ~25x more than necessary.&lt;/p&gt;

&lt;p&gt;And this happens on &lt;strong&gt;every request&lt;/strong&gt;.&lt;/p&gt;




&lt;h2&gt;
  
  
  🧠 “I’ll just parse it manually”
&lt;/h2&gt;

&lt;p&gt;Sure… you &lt;em&gt;can&lt;/em&gt; do this:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight python"&gt;&lt;code&gt;&lt;span class="n"&gt;user&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;data&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;order&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;{}).&lt;/span&gt;&lt;span class="nf"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;user&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt; &lt;span class="p"&gt;{})&lt;/span&gt;
&lt;span class="n"&gt;email&lt;/span&gt; &lt;span class="o"&gt;=&lt;/span&gt; &lt;span class="n"&gt;user&lt;/span&gt;&lt;span class="p"&gt;.&lt;/span&gt;&lt;span class="nf"&gt;get&lt;/span&gt;&lt;span class="p"&gt;(&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="s"&gt;email&lt;/span&gt;&lt;span class="sh"&gt;"&lt;/span&gt;&lt;span class="p"&gt;)&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Now imagine:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;10+ fields&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;deeply nested structures&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;multiple APIs&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;You end up writing:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;defensive null checks&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;brittle parsing logic&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;repeated boilerplate everywhere&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;It’s not hard… just annoying and error-prone.&lt;/p&gt;




&lt;h2&gt;
  
  
  ⚡ The smarter approach: preprocess your data
&lt;/h2&gt;

&lt;p&gt;Instead of sending raw JSON to your LLM:&lt;/p&gt;

&lt;p&gt;👉 &lt;strong&gt;clean it first&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Use a small extraction step to pull only what you need.&lt;/p&gt;

&lt;p&gt;For example:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"data"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="err"&gt;...&lt;/span&gt;&lt;span class="p"&gt;},&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"queries"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"email"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;".order.user.email"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;".order.user.name"&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Output:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"email"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"midhun@email.com"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"name"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Midhun"&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;






&lt;h2&gt;
  
  
  💰 Why this matters more than you think
&lt;/h2&gt;

&lt;p&gt;Let’s do rough math:&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Payload&lt;/th&gt;
&lt;th&gt;Tokens&lt;/th&gt;
&lt;th&gt;Cost (per 1k calls)&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Raw JSON&lt;/td&gt;
&lt;td&gt;1500&lt;/td&gt;
&lt;td&gt;~$45&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Cleaned JSON&lt;/td&gt;
&lt;td&gt;60&lt;/td&gt;
&lt;td&gt;~$1&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;👉 That’s a &lt;strong&gt;97% reduction&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Now multiply that by:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;daily requests&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;production scale&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;This is not optimization.&lt;br&gt;&lt;br&gt;
This is &lt;strong&gt;cost control&lt;/strong&gt;.&lt;/p&gt;




&lt;h2&gt;
  
  
  🔧 So how do you actually do this?
&lt;/h2&gt;

&lt;p&gt;You have 2 options:&lt;/p&gt;

&lt;h3&gt;
  
  
  Option 1: Local parsing
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;Use JSONPath libraries&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Write custom logic&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Maintain it across services&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  Option 2: Use a preprocessing layer
&lt;/h3&gt;

&lt;p&gt;I ended up building a small tool for this after getting tired of repeating the same parsing logic.&lt;/p&gt;

&lt;p&gt;It’s basically:&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;“JSON query engine as a service”&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;You send:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;raw JSON&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;a query&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;You get:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;clean, minimal payload&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;No setup, no dependencies.&lt;/p&gt;




&lt;h2&gt;
  
  
  🔗 Real-world use cases
&lt;/h2&gt;

&lt;p&gt;This pattern is surprisingly useful:&lt;/p&gt;

&lt;h3&gt;
  
  
  🤖 AI pipelines
&lt;/h3&gt;

&lt;p&gt;Reduce token usage before sending data to LLMs&lt;/p&gt;

&lt;h3&gt;
  
  
  🔔 Webhooks
&lt;/h3&gt;

&lt;p&gt;Clean payloads from:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;Stripe&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Shopify&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;GitHub&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  📊 Logs &amp;amp; analytics
&lt;/h3&gt;

&lt;p&gt;Extract only relevant fields from large datasets&lt;/p&gt;




&lt;h2&gt;
  
  
  ⚡ A small shift, big impact
&lt;/h2&gt;

&lt;p&gt;Most developers optimize:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;prompts&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;model selection&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;But ignore:&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;the data they send&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;That’s where the real waste is.&lt;/p&gt;




&lt;h2&gt;
  
  
  🚀 Final thought
&lt;/h2&gt;

&lt;p&gt;In the AI era:&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Efficiency = profit&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;Before optimizing your prompts,&lt;br&gt;&lt;br&gt;
try optimizing your input.&lt;/p&gt;

&lt;p&gt;You might be surprised how much you save.&lt;/p&gt;




&lt;h2&gt;
  
  
  👇 If you're curious
&lt;/h2&gt;

&lt;p&gt;I turned this idea into a simple API you can try:&lt;br&gt;&lt;br&gt;
&lt;a href="https://rapidapi.com/midhunweb/api/json-powerextract" rel="noopener noreferrer"&gt;&lt;strong&gt;JSON PowerExtract&lt;/strong&gt; (available on RapidAPI)&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;I included a Free Tier (500 requests/month) so you can test the token savings in your own pipeline today.&lt;/p&gt;




</description>
      <category>ai</category>
      <category>productivity</category>
      <category>api</category>
      <category>webdev</category>
    </item>
  </channel>
</rss>
