La mayoría de los servicios de predicción publican sus mejores días. No los peores.
Nosotros publicamos los dos. Desde hoy, cada apuesta que hemos hecho desde el 21 de abril en los mercados de temperatura máxima de Polymarket es pública — aciertos y pérdidas juntos. Cincuenta ciudades, catorce modelos meteorológicos, tres tipos de apuestas, cada resultado diario verificado contra la observación real.
¿Por qué? Porque una previsión probabilística sin un track record verificable no es ciencia. Es comunicación.
Por qué publicamos todo
Los dos primeros posts de esta serie defendieron una idea sencilla: el clima es probabilístico. A 24 horas de horizonte, la incertidumbre natural de una previsión es de 1 a 2 °C — a menudo más amplia que un bucket de Polymarket. A 3 días, estamos en 2 a 3 °C. No es un defecto técnico: es la atmósfera misma.
Consecuencia directa: un sistema probabilístico tiene que equivocarse con regularidad. Matemáticamente. Si decimos «85% de probabilidad de que este NO se mantenga», entonces aproximadamente una vez de cada siete, en promedio, no se mantiene. Eso es exactamente lo que significa ese 85%.
Esconder los días en que no se mantiene es mentir sobre la naturaleza misma de la herramienta. Una página de track record que solo muestra barras verdes es un argumento de marketing — no una prueba.
Lo que ves exactamente
Esto es lo que encontrarás en demfi.io/track-record:
- Tres familias de apuestas, cada una seguida por separado. Long Shots (posiciones YES en los buckets extremos, abiertas solo cuando el mercado paga por debajo de 0,05 USD). Edge Bets (la zona cercana al modo, donde hay que predecir con precisión de 1 °C — aún en fase experimental). Safe Bets (posiciones NO en buckets que el modelo descarta con alta confianza).
- Cuatro niveles de confianza Markov por ciudad: HIGH, MEDIUM, LOW, NONE. Reflejan la madurez de nuestra calibración en esa ciudad concreta — no son una puntuación de opinión.
- Cada línea trazable: por día, por ciudad, por bucket. Puedes hacer clic en cualquier punto del gráfico y ver las apuestas correspondientes, su precio de entrada, su resolución.
Un punto que merece aclaración, porque mucha gente lo va a leer mal: NONE no significa «confianza baja». Significa que la ciudad aún no ha acumulado suficientes días resueltos para asignarle una puntuación real. Las ciudades nuevas permanecen en NONE hasta tener suficiente historial, y luego migran a un nivel real. Confundir ambas cosas lleva a conclusiones falsas.
Lo que funciona, lo que funciona menos
Los números hablan por sí solos — míralos. Pero este es el resumen honesto tal como lo vemos.
Las Safe Bets en confianza HIGH son nuestra señal más madura. Cuando nuestro modelo dice «la temperatura máxima caerá en este bucket con ≥ 97% de probabilidad» y el mercado sigue pagando entre 86 y 94 céntimos por el NO, el edge es real y reproducible.
Las Edge Bets son las más difíciles técnicamente. Hay que predecir al grado, tanto el bucket ganador como los dos o tres buckets perdedores justo al lado. Por eso siguen en fase experimental: las seguimos afinando.
Los Long Shots viven de unos pocos grandes aciertos. Pagan rara vez. Cuando pagan, los retornos pueden ser de veinte a cien veces la apuesta — pero el slippage de Polymarket y la liquidez limitada en esos buckets nos obligan a apostar 1 USD, ocasionalmente unos pocos dólares. No más.
Nadie gana todos los días. Ni nosotros, ni nadie. El track record lo dice claramente.
Cómo leerlo correctamente
La trampa, mirando estos números, es buscar la combinación adecuada del día. No existe.
Ganar en Polymarket no es elegir el bucket ganador. Es mantener, cada día y para cada ciudad, una combinación coherente de posiciones YES y NO a lo largo de la distribución. La diversidad — sobre decenas de mercados independientes — produce el resultado; no la apuesta aislada que destaca. Eso es lo que intentamos materializar en la matriz de rendimiento: para entender qué funciona, mira los bloques (tipo × confianza) — no las filas individuales.
Sizing constante o proporcional. Nunca todo en una sola apuesta. Es así de simple.
Lo que (todavía) no consideramos
Tres precisiones, porque la transparencia funciona en ambas direcciones:
- Las cifras mostradas no tienen en cuenta el slippage ni la liquidez limitada de ciertos buckets de Polymarket — es particularmente cierto en los Long Shots. Un edge teórico que no se materializa en la ejecución es lo que llamamos un edge muerto.
- El rendimiento pasado no garantiza el rendimiento futuro. Tres meses de track record no garantizan nada. Seis meses tampoco.
- Nada de lo que lees aquí es asesoramiento financiero. Son herramientas de apoyo a la decisión para personas que asumen sus propios riesgos.
El track record está en demfi.io/track-record. Conecta cualquier wallet — una prueba Premium de 7 días se concede automáticamente en la primera conexión.
Buen análisis,
— JP
