Google acaba de simplificar el RAG (Retrieval-Augmented Generation) como nunca antes.
Hoy lanzaron el File Search Tool, una capa totalmente gestionada dentro de la Gemini API que elimina la complejidad del pipeline de recuperación. En otras palabras: podés conectar tus propios datos a Gemini sin tener que construir toda la infraestructura de embeddings, chunking o búsqueda vectorial.
Lo interesante:
- Todo está integrado en el mismo generateContent API.
- Generar embeddings al momento de la query es gratis — solo pagás por indexar los archivos (a $0.15 por millón de tokens).
- Soporta PDFs, DOCX, TXT, JSON y hasta archivos de código.
- Y las respuestas incluyen citaciones automáticas, mostrando de dónde viene cada fragmento de información.
Esto convierte el RAG en un servicio plug-and-play, ideal para quienes quieren construir experiencias con datos propios sin meterse en la arquitectura.
Desde el equipo de Solcre venimos explorando distintas estrategias de grounding para IA generativa, y este tipo de avances muestra cómo el ecosistema se está moviendo hacia soluciones más simples, accesibles y escalables para developers.
Fuente