<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Tania Morelia Pérez Dick</title>
    <description>The latest articles on DEV Community by Tania Morelia Pérez Dick (@tania_moreliaprezdick_).</description>
    <link>https://dev.to/tania_moreliaprezdick_</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F3965142%2Fad0e91f3-e373-49b9-9f5f-9733a8d90c85.jpg</url>
      <title>DEV Community: Tania Morelia Pérez Dick</title>
      <link>https://dev.to/tania_moreliaprezdick_</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/tania_moreliaprezdick_"/>
    <language>en</language>
    <item>
      <title>Digitalizando 200 años de historia: Sacra-360, un sistema cloud para registros sacramentales</title>
      <dc:creator>Tania Morelia Pérez Dick</dc:creator>
      <pubDate>Tue, 02 Jun 2026 18:29:47 +0000</pubDate>
      <link>https://dev.to/tania_moreliaprezdick_/digitalizando-200-anos-de-historiasacra-360-un-sistema-cloud-para-registros-sacramentales-5gki</link>
      <guid>https://dev.to/tania_moreliaprezdick_/digitalizando-200-anos-de-historiasacra-360-un-sistema-cloud-para-registros-sacramentales-5gki</guid>
      <description>&lt;p&gt;Hay una caja en el sótano de casi cada parroquia de Bolivia. Dentro hay libros viejos, algunos con décadas de humedad encima, donde están escritos a mano los bautizos, matrimonios y confirmaciones de miles de personas. ¿Tu bisabuela nació en 1932 y necesitas probarlo? Alguien va a tener que buscar en esa caja.&lt;/p&gt;

&lt;h2&gt;
  
  
  Eso fue lo que nos motivó a construir &lt;strong&gt;Sacra-360&lt;/strong&gt;.
&lt;/h2&gt;

&lt;h2&gt;
  
  
  El problema real
&lt;/h2&gt;

&lt;p&gt;No estábamos buscando un problema de ingeniería interesante. El problema simplemente existe: la Iglesia Católica en Bolivia maneja una cantidad enorme de documentos históricos completamente en físico. Cuando alguien necesita un certificado de bautizo, el proceso es:&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;llamar a la parroquia → buscar el libro correcto → encontrar la página → transcribir a mano → enviar el papel&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;Y eso &lt;em&gt;si&lt;/em&gt; el libro no se humedeció, no se perdió, o si la parroquia no está cerrada ese día.&lt;/p&gt;

&lt;p&gt;Los problemas concretos que teníamos que resolver:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Más de 100,000 registros que necesitan búsqueda rápida&lt;/li&gt;
&lt;li&gt;Documentos físicos que se deterioran con el tiempo&lt;/li&gt;
&lt;li&gt;Sin integración entre parroquias distintas&lt;/li&gt;
&lt;li&gt;Parroquias con fotos y scans de libros históricos que no sirven de nada sin una forma de consultarlos&lt;/li&gt;
&lt;/ul&gt;




&lt;h2&gt;
  
  
  La solución: arquitectura híbrida en AWS
&lt;/h2&gt;

&lt;p&gt;Lo más interesante técnicamente es que &lt;strong&gt;no quisimos ir full serverless ni full tradicional&lt;/strong&gt;. Elegimos una arquitectura híbrida, y acá explicamos por qué.&lt;/p&gt;

&lt;h3&gt;
  
  
  El core vive en EC2
&lt;/h3&gt;

&lt;p&gt;El backend principal (Node.js) corre en una instancia EC2. Tenemos un backend persistente que maneja autenticación, gestión de usuarios, sacramentos, personas y parroquias. También hay un microservicio separado para generación de reportes PDF/Excel.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;¿Por qué EC2 y no Lambda para todo?&lt;/strong&gt; Porque necesitábamos conexiones constantes a base de datos, lógica de negocio centralizada, y múltiples módulos activos al mismo tiempo. Poner todo eso en funciones Lambda hubiera aumentado la complejidad de mantenimiento sin beneficio real para este caso de uso.&lt;/p&gt;

&lt;h3&gt;
  
  
  La base de datos en RDS PostgreSQL
&lt;/h3&gt;

&lt;p&gt;Nada sofisticado aquí, pero no tenía que serlo. PostgreSQL administrado en AWS nos da integridad relacional, backups automáticos, y ya teníamos experiencia con Postgres en el equipo. Corriendo en &lt;code&gt;db.t4g.micro&lt;/code&gt; para el MVP, con capacidad de escalar cuando sea necesario.&lt;/p&gt;

&lt;h3&gt;
  
  
  El OCR es donde se pone interesante
&lt;/h3&gt;

&lt;p&gt;Esta es la parte que más disfrutamos implementar. El flujo es:&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;El usuario sube una imagen escaneada de un libro sacramental&lt;/li&gt;
&lt;li&gt;El archivo va a &lt;strong&gt;S3&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;Un endpoint del backend lo envía a &lt;strong&gt;AWS Textract&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;Textract extrae el texto automáticamente&lt;/li&gt;
&lt;li&gt;El sistema parsea y retorna datos estructurados: nombre, fecha, parroquia, número de registro, etc.&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;Probamos con una partida de bautismo real y este fue el resultado:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"datosDetectados"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"fecha_sacramento"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"12/04/2020"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"foja"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"45"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"numero"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"123"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"nombre"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"Juan Diego Pérez Lopez"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"parroquia"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"SAN JUAN BAUTISTA"&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Eso fue extraído automáticamente de una imagen escaneada. Lo que antes requería transcripción manual ahora toma segundos.&lt;/p&gt;

&lt;h3&gt;
  
  
  Lambda para lo que es puntual
&lt;/h3&gt;

&lt;p&gt;La generación de certificados PDF corre en AWS Lambda. No tiene sentido mantener un servidor activo las 24 horas para generar un PDF cuando alguien lo solicita. Lambda se activa, genera el certificado, lo guarda en S3 bajo &lt;code&gt;/generated&lt;/code&gt;, y listo. Sin costos de servidor idle.&lt;/p&gt;

&lt;h3&gt;
  
  
  El frontend en S3 con CI/CD automático
&lt;/h3&gt;

&lt;p&gt;El frontend es React + Vite, y se despliega automáticamente a S3 con cada push al repositorio mediante GitHub Actions. El pipeline compila, configura credenciales AWS, y sube los archivos estáticos.&lt;/p&gt;




&lt;h2&gt;
  
  
  Stack completo
&lt;/h2&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Servicio&lt;/th&gt;
&lt;th&gt;Rol en el proyecto&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;AWS EC2&lt;/td&gt;
&lt;td&gt;Backend Node.js + microservicio de reportes&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;AWS RDS PostgreSQL&lt;/td&gt;
&lt;td&gt;Base de datos principal&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;AWS S3&lt;/td&gt;
&lt;td&gt;Frontend estático, documentos históricos, certificados&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;AWS Lambda&lt;/td&gt;
&lt;td&gt;Generación de certificados PDF bajo demanda&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;AWS Textract&lt;/td&gt;
&lt;td&gt;OCR automático sobre documentos escaneados&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;AWS CloudWatch&lt;/td&gt;
&lt;td&gt;Logs y monitoreo&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;AWS QuickSight&lt;/td&gt;
&lt;td&gt;Dashboards y reportes visuales&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;GitHub Actions&lt;/td&gt;
&lt;td&gt;CI/CD automático para el frontend&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Docker&lt;/td&gt;
&lt;td&gt;Estandarización del entorno de desarrollo&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;PM2 + systemd&lt;/td&gt;
&lt;td&gt;Backend siempre activo en EC2&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;




&lt;h2&gt;
  
  
  La decisión más debatida: serverless vs. tradicional
&lt;/h2&gt;

&lt;p&gt;Al final llegamos a un principio claro:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Serverless para lo eventual&lt;/strong&gt; — generación de PDFs, procesamiento OCR&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tradicional para lo persistente&lt;/strong&gt; — backend principal, base de datos&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;La clave fue no enamorarse de una arquitectura por convención. Lambda funciona muy bien para tareas puntuales sin estado. Pero si pones toda la lógica de negocio en funciones, terminas con un sistema difícil de depurar, con cold starts en momentos inconvenientes, y con conexiones a base de datos que se complican sin necesidad.&lt;/p&gt;




&lt;h2&gt;
  
  
  Los costos
&lt;/h2&gt;

&lt;p&gt;Para el MVP con configuraciones de bajo consumo, la estimación usando AWS Pricing Calculator fue:&lt;/p&gt;

&lt;div class="table-wrapper-paragraph"&gt;&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;&lt;/th&gt;
&lt;th&gt;&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;Costo mensual estimado&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;$78.22 USD&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;Costo anual estimado&lt;/td&gt;
&lt;td&gt;&lt;strong&gt;$938.64 USD&lt;/strong&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;&lt;/div&gt;

&lt;p&gt;Los servicios con mayor impacto:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;RDS PostgreSQL&lt;/strong&gt;: $55.59/mes — la base de datos es el componente más costoso, pero también el más crítico&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;QuickSight&lt;/strong&gt;: $18/mes — dashboards y reportes&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;EC2&lt;/strong&gt;: $3.80/mes — instancia pequeña para el MVP&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Lambda, S3 y CloudWatch tienen un costo mínimo en este volumen. A medida que el sistema procese más documentos históricos vía OCR, esa proporción va a cambiar.&lt;/p&gt;




&lt;h2&gt;
  
  
  Reflexión final
&lt;/h2&gt;

&lt;p&gt;Este proyecto nos recordó que la tecnología cloud más valiosa no es la más sofisticada, sino la que resuelve problemas reales. No construimos SACRA360 para usar los últimos servicios de AWS. Lo construimos porque hay registros históricos en cajas de sótano que podrían perderse para siempre, y eso nos pareció un problema que valía la pena atacar.&lt;/p&gt;

&lt;p&gt;Si tienen un proyecto similar o les interesa el tema de digitalización de archivos históricos con OCR, con gusto conversamos en los comentarios.&lt;/p&gt;

&lt;p&gt;El código está en GitHub:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href="https://github.com/AdrianaRochaVedia/Back_Sacramentos" rel="noopener noreferrer"&gt;Backend&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://github.com/DilanMamani/fronttaller0" rel="noopener noreferrer"&gt;Frontend&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://github.com/AdrianaRochaVedia/Reportes" rel="noopener noreferrer"&gt;Microservicio de Reportes&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;




&lt;p&gt;&lt;em&gt;Proyecto académico — SIS-331 Computación en la Nube, Universidad Católica Boliviana "San Pablo", La Paz, Bolivia.&lt;/em&gt;&lt;br&gt;&lt;br&gt;
Equipo GatoByte: &lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;a href="https://github.com/IvonneCM" rel="noopener noreferrer"&gt;Ivonne Colque&lt;/a&gt; &lt;/li&gt;
&lt;li&gt;
&lt;a href="https://github.com/DilanMamani" rel="noopener noreferrer"&gt;Dilan Mamani&lt;/a&gt; &lt;/li&gt;
&lt;li&gt;
&lt;a href="https://github.com/TaniaPerezD" rel="noopener noreferrer"&gt;Tania Pérez&lt;/a&gt; &lt;/li&gt;
&lt;li&gt;
&lt;a href="https://github.com/Alkima-hydra" rel="noopener noreferrer"&gt;Ignacio Retamozo&lt;/a&gt; &lt;/li&gt;
&lt;li&gt;&lt;a href="https://github.com/AdrianaRochaVedia" rel="noopener noreferrer"&gt;Adriana Rocha&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>cloud</category>
      <category>aws</category>
      <category>architecture</category>
      <category>spanish</category>
    </item>
  </channel>
</rss>
