090L - Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG
Job Description:
Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG
Ubicación: Argentina
Modalidad: Remoto
Proyecto: Plataforma de inteligencia legal, tributaria y regulatoria
Zona horaria: Argentina
Nivel de inglés: Técnico / lectura de documentación
Conocé Darwoft
En Darwoft creamos software que genera impacto real. Pero somos mucho más que tecnología: somos personas trabajando con propósito, colaboración y ganas de construir soluciones digitales relevantes.
Somos una compañía latinoamericana que trabaja junto a clientes de distintas partes del mundo, desarrollando productos tecnológicos con foco en calidad, escalabilidad e innovación. Muchos nos diferencia por nuestra gran naturalización de la IA.
Trabajamos de manera presencial, remota, colaborativa y con una cultura basada en aprendizaje continuo, evolución, excelencia y cercanía humana.
Sobre el rol
Estamos buscando un/a Data Engineer Ssr ( 3, 4, 5 años de experiencia) con experiencia en Neo4j, Knowledge Graphs y arquitecturas RAG para sumarse a un proyecto de alto impacto vinculado a una plataforma de inteligencia legal, tributaria, contable y regulatoria.
La posición combina responsabilidades propias de Data Engineering —modelado de datos, pipelines de ingesta, transformación, calidad, performance y escalabilidad— con un componente avanzado de modelado semántico en grafos.
El objetivo principal será transformar taxonomías, ontologías y relaciones semánticas definidas por el equipo de Data Science en un modelo de grafos productivo, mantenible y escalable, capaz de alimentar un sistema de recuperación semántica basado en RAG.
Vas a trabajar sobre un ecosistema donde conviven extracción de entidades, procesamiento documental, embeddings, búsqueda vectorial, Neo4j y modelos de recuperación semántica. Es una oportunidad ideal para una persona con base sólida en ingeniería de datos y ganas de profundizar en Knowledge Graphs, GraphRAG y AI-powered search.
Qué vas a hacer
- Diseñar, implementar y mantener modelos de datos en Neo4j para representar conceptos, entidades, relaciones semánticas, jerarquías, versiones y dependencias entre contenidos.
- Traducir ontologías y taxonomías definidas por el equipo de Data Science en un esquema de grafos eficiente, utilizando labels, relationship types, properties, índices y constraints.
- Construir y optimizar pipelines de ingesta hacia Neo4j desde fuentes documentales, extractores de entidades, procesos de NLP, Computer Vision u otros sistemas internos.
- Participar en el diseño de flujos de ETL/ELT para carga, transformación, validación y actualización de datos en el grafo.
- Implementar estrategias de chunking, generación de embeddings, indexación y recuperación semántica.
- Trabajar con Neo4j Vector Index para combinar búsqueda vectorial con recorridos de grafos.
- Diseñar soluciones de retrieval híbrido, combinando graph search, vector search, multi-hop retrieval y patrones similares a GraphRAG.
- Desarrollar y optimizar consultas avanzadas en Cypher, incluyendo subqueries, patrones complejos, APOC y, cuando aplique, Neo4j GDS.
- Optimizar performance de consultas y procesos de carga utilizando EXPLAIN, PROFILE, índices, constraints, page cache y tuning de memoria.
- Colaborar con Data Scientists, equipos de extracción de entidades y equipos de desarrollo backend para integrar el grafo con servicios en Node.js o Python.
- Definir prácticas de calidad de datos, validaciones, pruebas sobre grafos y monitoreo de consistencia.
- Documentar decisiones de modelado, supuestos, trade-offs técnicos y criterios de evolución del modelo.
- Contribuir a que la plataforma pueda escalar en volumen, complejidad semántica y necesidades futuras de búsqueda inteligente.
Lo que buscamos
- Experiencia sólida como Data Engineer, Data Platform Engineer, Graph Data Engineer o similar.
- Experiencia avanzada trabajando con Neo4j, idealmente versión 5.x o superior.
- Dominio de Cypher, incluyendo consultas complejas, optimización, subqueries, APOC y buenas prácticas de performance.
- Experiencia modelando datos en esquemas tipo property graph para dominios complejos.
- Capacidad para transformar modelos conceptuales, taxonomías u ontologías en estructuras de datos productivas.
- Experiencia construyendo pipelines de ingesta, transformación, validación y actualización de datos.
- Conocimiento práctico de procesos de ETL/ELT y manejo de cargas masivas hacia bases de datos.
- Experiencia usando Python o Node.js para integración, automatización o desarrollo de pipelines.
- Conocimiento de embeddings, búsqueda semántica, vector search o arquitecturas RAG.
- Experiencia trabajando con índices vectoriales o recuperación híbrida.
- Buen criterio para diseñar estructuras escalables, mantenibles y observables.
- Capacidad para trabajar con equipos interdisciplinarios, especialmente Data Science, Backend, NLP o Computer Vision.
- Buen nivel de documentación técnica y comunicación clara para explicar decisiones de modelado a perfiles técnicos y no técnicos.
- Autonomía para hacerse dueño/a de un componente técnico desde el diseño hasta la evolución productiva.
Será un plus
- Experiencia previa con Knowledge Graphs, GraphRAG o semantic search.
- Conocimiento de estándares o enfoques semánticos como SKOS, OWL, RDF, SHACL o modelos ontológicos custom.
- Experiencia con Neo4j GDS Library, PageRank, similarity algorithms o graph-based ranking.
- Experiencia con frameworks como LangChain, LlamaIndex o Haystack integrados con Neo4j.
- Experiencia en dominios legales, tributarios, contables, regulatorios o de compliance.
- Conocimiento sobre versionado temporal, jerarquías normativas, vigencia de documentos, relaciones entre normas o estructuras documentales complejas.
- Experiencia con herramientas de mensajería o procesamiento distribuido como Kafka o RabbitMQ.
- Experiencia con monitoreo y observabilidad usando Prometheus, Grafana, Neo4j Bloom u otras herramientas similares.
- Experiencia realizando pruebas sobre datos, queries o grafos mediante golden datasets, tests de Cypher o validaciones automatizadas.
- Experiencia desplegando Neo4j en AuraDB, Kubernetes, self-hosted environments, clustering o arquitecturas multi-tenant.
- Portfolio, repositorios, papers o casos previos relacionados con grafos, búsqueda semántica o plataformas de datos.
Qué ofrece Darwoft
- Contrato full-time en relación de dependencia con pago en ARS
- Trabajo 100% remoto
- Salario competitivo
- Licencias legales y días de vacaciones
- Días personales extra por año
- Acceso a plataformas de aprendizaje
- Tarjeta de beneficios y descuentos
- Welcome kit
- Programas de reintegro
- Clases de inglés
- Programa de referidos
- Regalo de cumpleaños
- Healthy Break
- Celebraciones estilo Darwoft: aniversarios, fiestas de fin de año, cumpleaños y actividades de team building
Explore this and other opportunities at:
www.darwoft.com/careers