🤖 APIs de Inteligencia Artificial Gratuitas

El acceso a modelos de IA de calidad ya no requiere pagar. Hoy existen varias opciones completamente gratuitas que te permiten integrar LLMs en tus proyectos de práctica y aprendizaje.

¿Qué es un LLM y por qué importa?

Un LLM (Large Language Model) es un modelo de inteligencia artificial capaz de:

Generar texto coherente y contextual
Responder preguntas complejas
Analizar y resumir documentos
Generar y revisar código
Traducir idiomas
Clasificar y estructurar información

Integrar un LLM en tu app te permite crear funcionalidades que antes requerían equipos especializados: chatbots, asistentes, búsqueda semántica, generación de contenido, análisis de datos, etc.

El ecosistema de IA gratuita

┌─────────────────────────────────────────────────────────────────┐
│                   OPCIONES GRATUITAS                            │
│                                                                 │
│  GROQ          → Inferencia ultra-rápida de modelos open source │
│                  (LLaMA 3, Mixtral, Gemma)                      │
│                                                                 │
│  Google Gemini → Modelos de Google, generoso free tier          │
│                  (gemini-1.5-flash, gemini-2.0-flash)           │
│                                                                 │
│  Hugging Face  → Inferencia de modelos open source              │
│                  (miles de modelos disponibles)                 │
│                                                                 │
│  OpenRouter    → Acceso unificado a múltiples modelos           │
│                  (algunos modelos son gratuitos)                │
│                                                                 │
│  Ollama        → Correr modelos LOCAL (en tu máquina)           │
│                  100% privado, sin límites, sin internet         │
└─────────────────────────────────────────────────────────────────┘

Comparativa de servicios gratuitos

Servicio	Modelos	Límite free	Velocidad	Mejor para
Groq	LLaMA 3.3 70B, Mixtral, Gemma 2	14,400 req/día	Ultra rápida	Prototipos, chatbots
Google Gemini	Gemini 1.5 Flash, 2.0 Flash	1,500 req/día	Rápida	Multimodal, largo contexto
Hugging Face	Miles de modelos	1,000 req/día	Media	Modelos especializados
OpenRouter	Claude, LLaMA, Gemini, etc.	Modelos gratis incluidos	Varía	Multi-modelo
Ollama	LLaMA 3, Mistral, Phi, Qwen	Sin límite (local)	Depende del hardware	Privacidad

Conceptos clave de los LLMs

Tokens

Los LLMs no procesan palabras sino tokens (trozos de texto):

1 token ≈ 4 caracteres en inglés / 3 en español
1,000 tokens ≈ 750 palabras
Los límites de las APIs se expresan en tokens por minuto (TPM) o por día

Context Window (ventana de contexto)

La cantidad máxima de texto que el modelo puede procesar en una llamada:

Modelo	Context Window
Gemini 1.5 Flash	1,000,000 tokens (~750,000 palabras)
Gemini 2.0 Flash	1,000,000 tokens
LLaMA 3.3 70B (Groq)	128,000 tokens
Mixtral 8x7B (Groq)	32,000 tokens

Temperature

Controla la "creatividad" de las respuestas:

Valor	Comportamiento	Uso recomendado
`0.0`	Determinista, siempre igual	Código, análisis, tareas exactas
`0.3 - 0.7`	Balance	Asistentes conversacionales
`1.0+`	Creativo y variado	Escritura creativa, brainstorming

System prompt vs User prompt

System prompt → instrucciones permanentes al modelo
  "Eres un asistente experto en TypeScript. Sé conciso y preciso."

User prompt → pregunta o tarea del usuario
  "¿Cómo filtro un array y devuelvo solo los mayores a 10?"

Assistant response → respuesta del modelo
  "const mayores = numeros.filter(n => n > 10)"

Streaming

En vez de esperar la respuesta completa, el modelo envía el texto token a token mientras lo genera. Fundamental para UIs de chat donde quieres que el texto aparezca progresivamente.

Proyectos que puedes construir gratis

Proyecto	Servicios necesarios	Dificultad
Chatbot básico	Groq o Gemini + cualquier frontend	Principiante
Asistente con contexto de DB	Groq + Neon/Supabase	Intermedio
Analizador de documentos (PDF)	Gemini (largo contexto) + Supabase Storage	Intermedio
Generador de código con tests	Groq (LLaMA 70B)	Intermedio
Buscador semántico	Hugging Face (embeddings) + Supabase pgvector	Avanzado
App de traducción	Groq o Gemini	Principiante
Clasificador de contenido	Groq	Intermedio
Resumen de artículos	Gemini + Cloudflare Workers	Intermedio

En las siguientes páginas veremos Groq y Google Gemini en detalle con ejemplos completos.

¿Qué es un LLM y por qué importa?​

El ecosistema de IA gratuita​

Comparativa de servicios gratuitos​

Conceptos clave de los LLMs​

Tokens​

Context Window (ventana de contexto)​

Temperature​

System prompt vs User prompt​

Streaming​

Proyectos que puedes construir gratis​