15 mar 2026#gcp#cloud#curiosidades

Vertex AI vs montarlo vos: el cálculo real

El precio por hora de Vertex parece carísimo al lado de una VM cruda. Pero el costo de verdad incluye las horas tuyas, y ahí el cálculo se da vuelta.

Todo el que mira la factura de Vertex AI por primera vez piensa lo mismo: "esto lo monto yo en una VM y pago la décima parte". Y en el precio por hora de cómputo, tenés razón. El problema es que la nube no se paga solo en dólares de máquina: se paga en horas de tu equipo, en madrugadas resolviendo por qué CUDA no levanta, y en el costo de oportunidad de lo que no hiciste mientras peleabas con la infra. El cálculo real tiene más columnas de las que muestra la calculadora de precios.

Consultar en Gemini

Lo que ves vs lo que pagás

El precio visible es solo la punta del iceberg. Cuando montás ML "a mano" en una VM, te hacés cargo de:

Provisionar y mantener las máquinas, los drivers de GPU, las versiones de CUDA/cuDNN, los entornos de Python que siempre se rompen.
Servir el modelo: un endpoint que escale, que tenga health checks, que no se caiga con tráfico.
Monitorear: detectar cuando el modelo se degrada en producción, versionar modelos, logs.
Seguridad y updates: parchear el SO, rotar credenciales, cerrar puertos.

Vertex te cobra más por hora porque todo eso ya viene resuelto. Estás pagando para no contratar (o no quemar) a un MLOps.

El cálculo honesto, con un ejemplo

Pongamos un proyecto chico: entrenás un modelo una vez por semana y servís predicciones todo el día.

DIY: una VM con GPU + un endpoint corriendo 24/7. El cómputo crudo es barato, digamos $300/mes. Pero sumale ~10-20 horas/mes de alguien manteniendo esto. A cualquier tarifa real de un ingeniero, esas horas valen mucho más que los $300.
Vertex: pagás más por el cómputo gestionado, quizás $600/mes. Pero las horas de mantenimiento tienden a cero.

Para un proyecto chico o un equipo sin gente dedicada a infra, Vertex gana aunque la factura de GCP sea el doble. El recurso escaso no es la plata de nube: son las personas.

Nota relacionada

Vertex AI: entrenar un modelo sin escribir el modelo

AutoML te entrena un modelo decente sin que escribas una sola línea de red neuronal. La pregunta es cuándo te conviene y cuándo te sale carísimo.

Leer nota

Cuándo el cálculo se da vuelta

DIY empieza a tener sentido cuando:

Escala mucho: a gran volumen, el sobreprecio por hora de lo gestionado se acumula hasta superar el costo de tener un equipo dedicado.
Necesitás control fino: arquitecturas raras, optimizaciones de hardware específicas, kernels custom.
Ya tenés el equipo: si tu gente de plataforma ya mantiene infra para otras cosas, el costo marginal de sumar ML baja.

Un punto intermedio elegante: para entrenamiento pesado, montar las máquinas vos pero en Spot VMs interrumpibles recorta el costo de cómputo al hueso. Y si lo tuyo es tabular, ni siquiera necesitás Vertex: entrenás con SQL en BigQuery y te ahorrás la mitad de la discusión.

El factor que nadie pone en la planilla

Hay un costo invisible en DIY: el lock-in inverso del conocimiento. Si la persona que montó esa VM artesanal se va, te quedás con una caja negra que nadie sabe mantener. Lo gestionado es aburrido y documentado; lo artesanal es brillante hasta que su autor renuncia. Es la misma lógica de montar AutoML en vez de escribir el modelo: a veces lo mejor para el negocio es lo menos heroico.

El cierre

"Lo monto yo más barato" suele ser cierto en la columna que mirás y falso en la que ignorás. Antes de elegir DIY, poné un número a tus horas y a las de tu equipo. Si después de eso sigue dando más barato y tenés quién lo sostenga, dale. Si dudás, lo gestionado casi siempre es la decisión adulta.

¿Lo necesitás en tu negocio?

Encontrar dónde tirás plata en la nube

Tu factura de la nube crece todos los meses y no sabés bien por qué.

Ver solución

Enterarte vos primero si algo se cae

Te avisan los clientes que tu sitio está caído, no tu propio sistema.

Ver solución

Seguí explorando

Más en Cloud & Deploy

18 mar 2026

Vertex AI: entrenar un modelo sin escribir el modelo

Leer

17 mar 2026

Por qué la región de tu nube cambia la latencia y la factura

Leer

16 mar 2026

Máquinas preemptibles: 80% más baratas si tolerás que se apaguen

Leer

14 mar 2026

Las cuotas de GCP: el límite que descubrís en producción

Leer

También te puede interesar

13 mar 2026

Cold starts: el medio segundo que arruina la experiencia

Leer

12 mar 2026

Escalar a cero: pagar exactamente por lo que usás

Leer

11 mar 2026

Por qué Cloud Run te obliga a ser stateless

Leer

10 mar 2026

min-instances: el truco caliente que infla la factura

Leer