<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Rodrigo Alfaro</title>
    <description>The latest articles on DEV Community by Rodrigo Alfaro (@rodricels).</description>
    <link>https://dev.to/rodricels</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F449131%2Fae35e8e2-e938-41b1-9ace-ad9b4919b8e6.jpeg</url>
      <title>DEV Community: Rodrigo Alfaro</title>
      <link>https://dev.to/rodricels</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/rodricels"/>
    <language>en</language>
    <item>
      <title>Cacheando GraphQL con Varnish</title>
      <dc:creator>Rodrigo Alfaro</dc:creator>
      <pubDate>Sat, 08 Aug 2020 12:18:38 +0000</pubDate>
      <link>https://dev.to/rodricels/cacheando-graphql-con-varnish-50lk</link>
      <guid>https://dev.to/rodricels/cacheando-graphql-con-varnish-50lk</guid>
      <description>&lt;blockquote&gt;
&lt;p&gt;Warning: artículo escrito en 2017, puede que el contenido esté desfasado.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;El auge del lenguaje de consultas GraphQL está comiendo terreno a pasos agigantados a las APIs basadas en REST, pero todo cambio de paradigma trae consigo la ruptura de las viejas reglas a las que estamos acostumbrados.&lt;/p&gt;

&lt;p&gt;Con REST teníamos asumidas varias capas de caché al estar basado en HTTP con el que es fácil controlar su flujo, conocer la vida que tendrá una petición y cachearla en los distintos intermediarios de la red, el navegador o el cliente HTTP. Toda esta magia la perdemos utilizando GraphQL.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--OSxXhhad--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev-to-uploads.s3.amazonaws.com/i/eqv1p4pymz211qs10o49.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--OSxXhhad--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://dev-to-uploads.s3.amazonaws.com/i/eqv1p4pymz211qs10o49.png" alt="One does not simply cache graphql"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Niveles de caché en GraphQL
&lt;/h2&gt;

&lt;p&gt;GraphQL no especifica una capa de transporte en concreto, de hecho puedes usarlo con webservices, pero lo más común es utilizar HTTP como un “túnel tonto” sin disponer de la información que nos daban las cabeceras de expiración, ETaga, Max-age, etc. Esto tiene implicaciones a varios niveles, quedando así:&lt;/p&gt;

&lt;h3&gt;
  
  
  Aplicación
&lt;/h3&gt;

&lt;p&gt;Es común que el backend implemente su propia capa de cacheo sobre Memcache o Redis, pero los servidores de GraphQL no crean cabeceras con los tiempos de vida a nivel de campo, grafo o petición de forma nativa, por lo que sólo queda construir una solución ad-hoc que utilice caberas o campos personalizados con la información de los TTLs y llegar a un acuerdo con las subsiguientes capas para que puedan tenerlas en cuenta.&lt;/p&gt;

&lt;h3&gt;
  
  
  Cliente
&lt;/h3&gt;

&lt;p&gt;Los clientes HTTP no pueden verse beneficiados del control de expiración estándar por lo que deberían almacenar y controlar los TTLs de los datos para poder reutilizarlos y evitar peticiones innecesarias. Pero la forma óptima de almacenamiento es a nivel de grafo, de esa forma una petición puede añadir campos o datos de un grafo sin invalidarlo completamente. Esto hace que los clientes deban tener una lógica más compleja, que salvo el &lt;a href="https://github.com/facebook/relay/issues/1369"&gt;futuro Relay v2&lt;/a&gt;, pocos están abordando ya que tampoco hay un estándar en el lenguaje que defina qué reglas deben cumplir entre cliente y servidor.&lt;/p&gt;

&lt;h3&gt;
  
  
  Red
&lt;/h3&gt;

&lt;p&gt;La capa de cacheo de red guarda las peticiones de forma completa y “gracias” a GraphQL quedan desfasada tal cual se usan ahora. Para poder recuperar esta funcionalidad podemos utilizar Varnish como cacheo a nivel de petición dentro de nuestra infraestructura, pero para poder utilizar CDNs tradicionales tendríamos que replicar las reglas que menciono en sus diversos lenguajes, aunque con el CDN &lt;a href="https://fastly.com"&gt;Fastly&lt;/a&gt; el trabajo sería mucho más sencillo ya que está basado en Varnish.&lt;/p&gt;

&lt;h2&gt;
  
  
  GraphQL sobre HTTP
&lt;/h2&gt;

&lt;p&gt;GraphQL no especifica una capa de transporte en concreto, de hecho puedes usarlo con webservices pero la más común es HTTP que además te permite utilizar tanto GET como POST para las peticiones. Esto hace que debamos diferenciar dos peticiones al mismo endpoint añadiendo al hasing el método HTTP:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;sub vcl_hash {
  hash_data(req.method);
}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;p&gt;Además, si se utiliza POST en el endpoint, debemos añadir el cuerpo de la petición al hashing para poder cachearlas y diferenciarlas. Varnish no lo permite por defecto, pero para ello tenemos el módulo &lt;a href="https://github.com/aondio/libvmod-bodyaccess"&gt;Bodyaccess&lt;/a&gt; que nos da acceso como texto al número de bytes del body que le indiquemos:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;import bodyaccess;

sub vcl_recv {
  # grab some data from request body
  std.cache_req_body(1KB);
}
sub vcl_hash {
  hash_data(req.method);
  bodyaccess.hash_req_body();
}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;h3&gt;
  
  
  Endpoint con POST
&lt;/h3&gt;

&lt;p&gt;Si se especifica la cabecera &lt;code&gt;application/json&lt;/code&gt; todo el cuerpo de la petición debe estar codificado en JSON. Si se usa la cabecera &lt;code&gt;application/graphql&lt;/code&gt; se permite mandar el cuerpo de la petición en el formato nativo de GraphQL. En ambos casos se puede pasar el parámetro &lt;code&gt;query&lt;/code&gt; en la URL codificado como JSON, omitiéndolo así del cuerpo.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# application/json
{
  "query":
    "droidByName ($name: name) {
      droid (name: $name) {
        name,
        friends {
          name
        }
      }
    }"
  "operationName": "{...}",
  "variables": {
    "name": "R2-D2"
  }
}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;





&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# application/graphql
query
  droidByName ($name: name) {
    droid (name: $name) {
      name,
      friends {
        name
      }
    }
  }
operationName: {...}
variables: {
  "name": "R2-D2"
}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;h3&gt;
  
  
  &lt;strong&gt;Endpoint con GET&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;Usando exclusivamente peticiones GET es la forma más sencilla de actuar.&lt;/p&gt;

&lt;p&gt;La composición de la petición usa la forma nativa de GraphQL (no codificada como json) dividiendo los parámetros de la URL:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;https://example.com/graphql?query={droidByName($name:name){droid(name:$name){name,friends{name}}}}
&amp;amp;operationName={...}&amp;amp;variables={"name":"R2-D2"}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;h3&gt;
  
  
  &lt;strong&gt;Mutation y subscription&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;Los &lt;code&gt;mutation&lt;/code&gt; son peticiones de escritura, actualización o borrado definidas por el servidor de GraphQL, equivalentes a PUT, POST y DELETE en una API REST.&lt;/p&gt;

&lt;p&gt;Los &lt;code&gt;subscription&lt;/code&gt; permiten al servidor mandar actualizaciones de datos mediante push a los clientes suscritos.&lt;/p&gt;

&lt;p&gt;Si se está utilizando GET en la petición tenemos que poder diferenciarlas del resto de peticiones cacheables:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;sub vcl_rev {
  if (req.url ~ "(\?|&amp;amp;)(mutation|subscription)=") {
    return (pass);
  }
}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;p&gt;Con POST tenemos que inspeccionar el cuerpo de la petición para reconocer que es un mutation o subscription, cosa que Varnish no lo permite por defecto, pero para ello tenemos el módulo &lt;a href="https://github.com/aondio/libvmod-bodyaccess"&gt;Bodyaccess&lt;/a&gt; que nos da acceso como texto al número de bytes del body que le indiquemos.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;import bodyaccess;

sub vcl_recv {
  # grab some bytes to analyze
  std.cache_req_body(1KB);

  # simple regex, harden it to your needs
  if (bodyaccess.req_body() ~ "(\"|)(mutation|subscription)(\"|)") {
    return (pass);
  }
}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;h3&gt;
  
  
  &lt;strong&gt;Tratamiento de errores&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;GraphQL es agnóstico a la capa de transporte y no se usan los &lt;a href="https://en.wikipedia.org/wiki/List_of_HTTP_status_codes"&gt;HTTP status code&lt;/a&gt; para saber si ha sido correcta la petición a nivel de datos.&lt;/p&gt;

&lt;p&gt;Según la especificación de &lt;a href="http://facebook.github.io/graphql/#sec-Errors"&gt;GraphQL sobre errores&lt;/a&gt; las respuestas erróneas &lt;strong&gt;deben&lt;/strong&gt; contener una lista de &lt;code&gt;errors&lt;/code&gt; y &lt;strong&gt;pueden&lt;/strong&gt; contener también la devolución de los datos en &lt;code&gt;data&lt;/code&gt; si el resultado es sólo parcialmente erróneo.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;[
    'data' =&amp;gt; [
        'fieldWithException' =&amp;gt; null
    ],
    'errors' =&amp;gt; [
        [
            'message' =&amp;gt; 'Exception message thrown in field resolver',
            'locations' =&amp;gt; [
                ['line' =&amp;gt; 1, 'column' =&amp;gt; 2]
            ],
            'path': [
                'fieldWithException'
            ]
        ]
    ]
]
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;p&gt;Esta es una de las partes más fastidiosas ya que todas las peticiones responden con &lt;code&gt;status code: 200&lt;/code&gt;, incluso con errores, y hay que inspeccionar prácticamente todo el cuerpo de la petición para saber si algo ha ido mal.&lt;/p&gt;

&lt;p&gt;En nuestro caso lo más seguro es que no nos importe que estos errores se cacheen, pero en caso de no ser así, &lt;strong&gt;con Varnish no podemos inspeccionar el cuerpo de la respuesta del servidor&lt;/strong&gt;, así que sólo nos queda cachear todo lo que nos llegue y pasar la responsabilidad al cliente de la API, que sería el encargado de reintentar la petición para complementar o corregir la petición del grafo erróneo.&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;Aunque hoy en día no se pueda acceder al cuerpo de la respuesta del backend, en el Vmod livvmod-bodyaccess se está barajando añadir esta posibilidad.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;Una solución a este problema es que el servidor o un middleware inspeccione las respuestas en busca de estos errores y los indique en una cabecera HTTP personalizada que capturemos:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight"&gt;&lt;pre class="highlight plaintext"&gt;&lt;code&gt;sub vcl_backend_response {
  if ( beresp.http.X-GraphQL ~ "Not Cacheable" ) {
    set beresp.uncacheable = true;
  }
}
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;



&lt;p&gt;Gracias a la especificación de referencia, hay una función definida para tratar los errores: &lt;code&gt;[formatError](http://graphql.org/graphql-js/error/#formaterror)&lt;/code&gt; y por ejemplo se puede sobrescribir, por ejemplo con &lt;a href="http://dev.apollodata.com/tools/graphql-server/setup.html#graphqlOptions"&gt;GraphServer de Apollo&lt;/a&gt; o la implementación de &lt;a href="http://graphql.org/graphql-js/express-graphql/#graphqlhttp"&gt;express-graphql&lt;/a&gt;, y añadir una cabecera HTTP con &lt;code&gt;[response.setHeader](https://nodejs.org/api/http.html#http_response_setheader_name_value)[()](https://web.archive.org/web/20180831061406/https://nodejs.org/api/http.html#http_response_setheader_name_value)&lt;/code&gt; de Nodejs.&lt;/p&gt;

&lt;h3&gt;
  
  
  &lt;strong&gt;Invalidaciones&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;TODO&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;ban y purge se ven afectadas por tener el mismo req.url&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>graphql</category>
      <category>varnish</category>
    </item>
  </channel>
</rss>
