090L - Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG

  • Full-Time
  • Remote

Job Description:

Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG

Ubicación: Argentina
Modalidad: Remoto
Proyecto: Plataforma de inteligencia legal, tributaria y regulatoria
Zona horaria: Argentina
Nivel de inglés: Técnico / lectura de documentación

Conocé Darwoft

En Darwoft creamos software que genera impacto real. Pero somos mucho más que tecnología: somos personas trabajando con propósito, colaboración y ganas de construir soluciones digitales relevantes.

Somos una compañía latinoamericana que trabaja junto a clientes de distintas partes del mundo, desarrollando productos tecnológicos con foco en calidad, escalabilidad e innovación. Muchos nos diferencia por nuestra gran naturalización de la IA.

Trabajamos de manera presencial, remota, colaborativa y con una cultura basada en aprendizaje continuo, evolución, excelencia y cercanía humana.

Sobre el rol

Estamos buscando un/a Data Engineer Ssr ( 3, 4, 5 años de experiencia) con experiencia en Neo4j, Knowledge Graphs y arquitecturas RAG para sumarse a un proyecto de alto impacto vinculado a una plataforma de inteligencia legal, tributaria, contable y regulatoria.

La posición combina responsabilidades propias de Data Engineering —modelado de datos, pipelines de ingesta, transformación, calidad, performance y escalabilidad— con un componente avanzado de modelado semántico en grafos.

El objetivo principal será transformar taxonomías, ontologías y relaciones semánticas definidas por el equipo de Data Science en un modelo de grafos productivo, mantenible y escalable, capaz de alimentar un sistema de recuperación semántica basado en RAG.

Vas a trabajar sobre un ecosistema donde conviven extracción de entidades, procesamiento documental, embeddings, búsqueda vectorial, Neo4j y modelos de recuperación semántica. Es una oportunidad ideal para una persona con base sólida en ingeniería de datos y ganas de profundizar en Knowledge Graphs, GraphRAG y AI-powered search.

Qué vas a hacer

  • Diseñar, implementar y mantener modelos de datos en Neo4j para representar conceptos, entidades, relaciones semánticas, jerarquías, versiones y dependencias entre contenidos.
  • Traducir ontologías y taxonomías definidas por el equipo de Data Science en un esquema de grafos eficiente, utilizando labels, relationship types, properties, índices y constraints.
  • Construir y optimizar pipelines de ingesta hacia Neo4j desde fuentes documentales, extractores de entidades, procesos de NLP, Computer Vision u otros sistemas internos.
  • Participar en el diseño de flujos de ETL/ELT para carga, transformación, validación y actualización de datos en el grafo.
  • Implementar estrategias de chunking, generación de embeddings, indexación y recuperación semántica.
  • Trabajar con Neo4j Vector Index para combinar búsqueda vectorial con recorridos de grafos.
  • Diseñar soluciones de retrieval híbrido, combinando graph search, vector search, multi-hop retrieval y patrones similares a GraphRAG.
  • Desarrollar y optimizar consultas avanzadas en Cypher, incluyendo subqueries, patrones complejos, APOC y, cuando aplique, Neo4j GDS.
  • Optimizar performance de consultas y procesos de carga utilizando EXPLAIN, PROFILE, índices, constraints, page cache y tuning de memoria.
  • Colaborar con Data Scientists, equipos de extracción de entidades y equipos de desarrollo backend para integrar el grafo con servicios en Node.js o Python.
  • Definir prácticas de calidad de datos, validaciones, pruebas sobre grafos y monitoreo de consistencia.
  • Documentar decisiones de modelado, supuestos, trade-offs técnicos y criterios de evolución del modelo.
  • Contribuir a que la plataforma pueda escalar en volumen, complejidad semántica y necesidades futuras de búsqueda inteligente.

Lo que buscamos

  • Experiencia sólida como Data Engineer, Data Platform Engineer, Graph Data Engineer o similar.
  • Experiencia avanzada trabajando con Neo4j, idealmente versión 5.x o superior.
  • Dominio de Cypher, incluyendo consultas complejas, optimización, subqueries, APOC y buenas prácticas de performance.
  • Experiencia modelando datos en esquemas tipo property graph para dominios complejos.
  • Capacidad para transformar modelos conceptuales, taxonomías u ontologías en estructuras de datos productivas.
  • Experiencia construyendo pipelines de ingesta, transformación, validación y actualización de datos.
  • Conocimiento práctico de procesos de ETL/ELT y manejo de cargas masivas hacia bases de datos.
  • Experiencia usando Python o Node.js para integración, automatización o desarrollo de pipelines.
  • Conocimiento de embeddings, búsqueda semántica, vector search o arquitecturas RAG.
  • Experiencia trabajando con índices vectoriales o recuperación híbrida.
  • Buen criterio para diseñar estructuras escalables, mantenibles y observables.
  • Capacidad para trabajar con equipos interdisciplinarios, especialmente Data Science, Backend, NLP o Computer Vision.
  • Buen nivel de documentación técnica y comunicación clara para explicar decisiones de modelado a perfiles técnicos y no técnicos.
  • Autonomía para hacerse dueño/a de un componente técnico desde el diseño hasta la evolución productiva.

Será un plus

  • Experiencia previa con Knowledge Graphs, GraphRAG o semantic search.
  • Conocimiento de estándares o enfoques semánticos como SKOS, OWL, RDF, SHACL o modelos ontológicos custom.
  • Experiencia con Neo4j GDS Library, PageRank, similarity algorithms o graph-based ranking.
  • Experiencia con frameworks como LangChain, LlamaIndex o Haystack integrados con Neo4j.
  • Experiencia en dominios legales, tributarios, contables, regulatorios o de compliance.
  • Conocimiento sobre versionado temporal, jerarquías normativas, vigencia de documentos, relaciones entre normas o estructuras documentales complejas.
  • Experiencia con herramientas de mensajería o procesamiento distribuido como Kafka o RabbitMQ.
  • Experiencia con monitoreo y observabilidad usando Prometheus, Grafana, Neo4j Bloom u otras herramientas similares.
  • Experiencia realizando pruebas sobre datos, queries o grafos mediante golden datasets, tests de Cypher o validaciones automatizadas.
  • Experiencia desplegando Neo4j en AuraDB, Kubernetes, self-hosted environments, clustering o arquitecturas multi-tenant.
  • Portfolio, repositorios, papers o casos previos relacionados con grafos, búsqueda semántica o plataformas de datos.

Qué ofrece Darwoft

  • Contrato full-time en relación de dependencia con pago en ARS
  • Trabajo 100% remoto
  • Salario competitivo
  • Licencias legales y días de vacaciones
  • Días personales extra por año
  • Acceso a plataformas de aprendizaje
  • Tarjeta de beneficios y descuentos
  • Welcome kit
  • Programas de reintegro
  • Clases de inglés
  • Programa de referidos
  • Regalo de cumpleaños
  • Healthy Break
  • Celebraciones estilo Darwoft: aniversarios, fiestas de fin de año, cumpleaños y actividades de team building

Explore this and other opportunities at:
www.darwoft.com/careers