Siguiendo con la serie de artículos que empecé en su día introduciendo la varianza y la distribución normal, he pensado que no estaría de más dejar un poco de lado la pereza crónica que padezco y seguir ampliando un poco el tema.
Bien, ahora que ya conocemos algunos conceptos como pueden ser, la varianza, su relación con la desviación estándar y con el número de intentos, la distribución normal, etc, ya podemos ponernos a marranear un poco con los datos que nos dan el PT (u otros programas que nos faciliten los datos necesarios) y ver que conclusiones podemos sacar.
Concretamente, en este artículo veremos como calcular la probabilidad de ganar “x” bb tras “n” manos a la vez que nos familiarizamos con el uso de tablas de distribución normal acumulada.
Bien, ahora que ya conocemos algunos conceptos como pueden ser, la varianza, su relación con la desviación estándar y con el número de intentos, la distribución normal, etc, ya podemos ponernos a marranear un poco con los datos que nos dan el PT (u otros programas que nos faciliten los datos necesarios) y ver que conclusiones podemos sacar.
Concretamente, en este artículo veremos como calcular la probabilidad de ganar “x” bb tras “n” manos a la vez que nos familiarizamos con el uso de tablas de distribución normal acumulada.
Para empezar, tendríamos que conocer nuestro win rate y nuestra desviación estándar. Ambos datos, los podemos encontrar fácilmente en el Poker Tracker. Sólo hay un pequeño inconveniente, la fiabilidad de los datos. La desviación estándar de nuestras sesiones es un dato que converge de forma relativamente rápida con lo que podemos confiar en el dato que nos de el PT tras unos miles de manos. En cambio el win rate no converge tan rápido y necesitaríamos una muestra bastante grande de manos para que fuese un dato fiable. Todo esto se podría cuantificar utilizando intervalos de confianza y otras historias pero eso daría para otro artículo entero (que no descarto hacer escribir un día de estos).
Lo que quiero decir con esto es que a la práctica no conocemos nuestro win rate real, no obstante, si tratamos con muestras grandes, estaremos minimizando el error. Así que para hacer los cálculos, sería conveniente usar el WR de la muestra más grande que tengamos.
La base de datos más grande que he encontrado de un mismo nivel son cerca de 35000 manos en NL50 SH a 13bb/100 con una desviación estándar de 83bb/100. La muestra es pequeña pero como ejemplo ya servirá.
Al win rate le llamaremos “µ” y a la desviación estándar “σ” por pura convención estadística. Tenemos pues µ=13 y σ=83.
La base de datos más grande que he encontrado de un mismo nivel son cerca de 35000 manos en NL50 SH a 13bb/100 con una desviación estándar de 83bb/100. La muestra es pequeña pero como ejemplo ya servirá.
Al win rate le llamaremos “µ” y a la desviación estándar “σ” por pura convención estadística. Tenemos pues µ=13 y σ=83.
En base a estos datos y a los conceptos que vimos en los artículos anteriores, vamos a calcular por ejemplo, cual será la probabilidad de estar en positivo tras 10.000 manos.
Lo primero que hemos de calcular es cual será la media tras 10.000 manos (lo que esperaríamos ganar según nuestro win rate) y la desviación estándar que tendremos en 10000 manos.
Para hacer estos cálculos, tenemos que recordar que tanto el WR como la SD que nos da el PT, están en BB/100 con lo que para hacer los cálculos no consideraremos 10.000 manos sino el número de grupos de 100 manos que hay dentro de estas 10000, es decir 10000/100=100.
Lo primero que hemos de calcular es cual será la media tras 10.000 manos (lo que esperaríamos ganar según nuestro win rate) y la desviación estándar que tendremos en 10000 manos.
Para hacer estos cálculos, tenemos que recordar que tanto el WR como la SD que nos da el PT, están en BB/100 con lo que para hacer los cálculos no consideraremos 10.000 manos sino el número de grupos de 100 manos que hay dentro de estas 10000, es decir 10000/100=100.
µ tras 10000 manos = 100 * 13=1300 bb
Calculamos la varianza ya que como vimos, la desviación estándar de varios intentos no se podía sumar pero la varianza sí.
V= σ^2= (83)^2= 6889
La varianza tras 10000 manos será:
V tras 10000 manos= 100 * 6889=688900
Hacemos la raíz cuadrada para obtener de nuevo la desviación estándar:
σ tras 10000 manos= 830 bb
Calculamos la varianza ya que como vimos, la desviación estándar de varios intentos no se podía sumar pero la varianza sí.
V= σ^2= (83)^2= 6889
La varianza tras 10000 manos será:
V tras 10000 manos= 100 * 6889=688900
Hacemos la raíz cuadrada para obtener de nuevo la desviación estándar:
σ tras 10000 manos= 830 bb
Ya tenemos la media y la desviación estándar de 10000 manos. Para hacer más entendible el texto, llamaremos µ’ y σ’ a estos valores. Por tanto : µ’=1300 y σ’= 830.
Como dijimos en su día, en el artículo que hablaba de la distribución normal, podemos considerar que nuestros datos siguen dicha distribución. También dijimos que las tablas que encontraríamos por ahí, estaban calculadas para un caso particular de esta distribución conocida como distribución normal estandarizada ( media 0 y desviación estándar 1). Dado que nuestros datos no tienen ni media 0 ni desviación estándar 1, tendremos que realizar un pequeño cambio de variable para hacer uso de dichas tablas. El cambio es siempre el mismo: Z = (X - µ’)/ σ’. Esta nueva variable, es conocida como variable tipificada de X (en inglés Z-Score). Haciendo este pequeño cambio conseguimos que nuestra distribución tenga ahora media 0 y desviación estándar 1.
Como dijimos en su día, en el artículo que hablaba de la distribución normal, podemos considerar que nuestros datos siguen dicha distribución. También dijimos que las tablas que encontraríamos por ahí, estaban calculadas para un caso particular de esta distribución conocida como distribución normal estandarizada ( media 0 y desviación estándar 1). Dado que nuestros datos no tienen ni media 0 ni desviación estándar 1, tendremos que realizar un pequeño cambio de variable para hacer uso de dichas tablas. El cambio es siempre el mismo: Z = (X - µ’)/ σ’. Esta nueva variable, es conocida como variable tipificada de X (en inglés Z-Score). Haciendo este pequeño cambio conseguimos que nuestra distribución tenga ahora media 0 y desviación estándar 1.
Volviendo al caso que nos ocupa que es calcular la probabilidad de estar en positivo tras 10000 manos, dónde pone “X” deberemos poner 0 (si fuese la probabilidad de estar por encima de 100bb pondríamos 100). Tendremos pues que Z= (0-1300)/830 = -1,5662.
Ahora con este número ya podemos calcular la probabilidad usando una tabla de distribución normal acumulada .
Buscamos dónde pone Z=-1,5662 y miramos el numerito que pone al lado, en este caso 0.05938. El número que nos ha dado la tabla (normalmente se expresa como ϕ(-1,5662)), refleja la probabilidad de estar por debajo de 0 ya que es una tabla de probabilidad acumulada. Gráficamente para un punto “a” cualquiera, lo que nos da la tabla es el área (probabilidad) por debajo de "a" (sombreada en verde):
No obstante, nosotros queremos saber cual será la probabilidad de estar por encima de 0 y no por debajo. Vimos que el área total de la campana era 1 con lo que para calcular el área que nos interesa, simplemente tendremos que hacer 1- ϕ(-1,5662)= 1- 0,05938 = 0,9406. Esta es la probabilidad de estar en positivo en tanto por uno. Para expresarla en tanto por cien, simplemente multiplicamos por 100. Por tanto, la probabilidad que buscábamos P( benficio > 0 en 10000 manos) = 94,06%.
Quería añadir unas cuantas cosas más y algunas gráficas con algunas pruebas que he hecho en excel, pero me parece que me he extendido demasiado, así que mejor dejarlo para una segunda parte.
No hay comentarios:
Publicar un comentario