viernes, 25 de noviembre de 2016

Presentación


Presentación

Este blog se ha creado con el fin de explicar con detalle el método SGQL (Sistema de Generación de Quinielas Lógicas), que tiene de particular que en el proceso de generación no interviene en ningún caso la subjetividad. La propuesta semanal la realiza el ordenador, sin ninguna interferencia personal. No es un estudio terminado, por varias razones:

En primer lugar, como se explica en capítulos sucesivos, es imposible analizar todas las familias de soluciones para la mecanización de una quiniela lógica, pués son infinitas, y siempre será posible incorporar nuevos supuestos, crear nuevos algoritmos de cálculo o modelos de predicción, o probar datos distintos para los modelos ya estudiados para la simulación de la práctica real, etc., En segundo lugar hay capítulos que deben actualizarse a menudo, como se actualiza la regulación y práctica del futbol, por ejemplo en estos últimos años se ha incorporado la apuesta al 15, se ha modificado la forma de apostar al 15, el porcentaje de signos 2 ha crecido a costa del porcentaje de signos X ( actualmente, le supera ampliamente), se han modificado los porcentajes de recaudación dedicados a premiar los 15, 14, 13, 12, 11, y 10 aciertos, etc. En en tercer lugar, y en este caso particular, porque para alguna operación concreta no he encontrado aún la herramienta matemática, o informática, que lo resuelva a mi entera satisfacción, como por ejemplo el "adelgazamiento" o reducción de la quiniela múltiple, en la que sigo trabajando.

No obstante, el método ofrece soluciones rentables.

Para hacer esta presentación más amena he intercalado, al final de cada capítulo, la fotografía o la descripción de un artilugio, o publicación, relacionado con el mundo de las quinielas.

Por último añadir que estoy abierto a sugerencias, colaboraciones, intercambios, etc., pués para mi esto es un hobby, y estoy disfrutando más del camino, que de la posible llegada a la meta que me he propuesto. Con gusto responderé a quien esté interesado si me hace llegar su consulta al correo:
     epujolribo@gmail.com

A continuación siguen los siguientes capítulos:

Qué es SGQL
Los coeficientes Q(i)
Determinación de la Q(i) de un partido
El generador de C(i)
Evaluar familias de quinielas
El generador de quinielas
Optimización de la inversión
La operativa semanal
Resultados obtenidos y consideraciones


martes, 25 de octubre de 2016

Dado 1 X 2






Dado publicitario.
Promotor :  Terramicina grageas
Dispositivo:  un dado de seis caras, con  dos unos, dos equis, y dos doses, con las mismas probabilidades para cada una de ellas.

Probabilidades para cada signo

                                             Nº          %             % real (*)
         Casillas con   1            2           33,3                 49,4
         Casillas con   X           2           33,3                 22,6
         Casillas con   2            2           33,3                 28,0


(*)  Se refiere a los porcentajes de signos que se han dado EN LOS PARTIDOS REALES, de las jornadas anteriores a la publicación de este escrito.

Valoración : este dispositivo es muy poco eficiente ya que es el que menos se acerca en cuanto a probabilidades de cada signo, al número de 1, X, 2 obtenidos en las quinielas reales de la última temporada, con diferencias de hasta el 50% en los signos 1 (por defecto) y X (por exceso).


domingo, 25 de septiembre de 2016

¿Qué es SGQL?

¿Qué es SGQL?

Desde la aparición de los primeros ordenadores domésticos, he tenido la convicción de que valía la pena invertir tiempo en la preparación de un programa que fuera capaz de proponer quinielas para las futuras jornadas futbolísticas, de un modo totalmente objetivo, sin incorporar las subjetividad que todo aficionado al fútbol, incluso sin querer, vuelca en sus propuestas. Es decir un SISTEMA DE GENERACIÓN DE QUINIELAS LÓGICAS (SGQL) totalmente automático.

Los primeros pasos los di con un COMMODORE, sería a principios de los 1980, pero este equipo tenía una muy escasa potencia (algo así como 20Kb. de ROM y 64Kb. de RAM). Había que programar las propias aplicaciones (FORTRAN, PL1, COBOL), y por su escasa capacidad de trabajo no permitía operar con series históricas. No fui el único, otros amigos lo intentaron con el SPECTRUM de SINCLAIR, un engendro similar.

Pasados unos años, fui de los primeros en tener un Pc IBM en casa para uso doméstico. Con los sucesivos equipos pude mejorar mis programas, y de la programación artesana pasé a usar la Hoja de Cálculo, suficiente para mis necesidades. El método ha ido mejorando desde entonces, puliendo los conceptos, incorporando series cada vez más largas y fiables, utilizando a medida que la tecnología lo permitía herramientas mas complejas.

En los últimos años este trabajo lo realizamos en equipo Manolo L. y yo, con el problema añadido de que Manolo reside desde 2003 en Inglaterra, con lo que el intercambio de ideas, colaboraciones, y resultados fué perdiendo fluidez. Finalmente Manolo dejó de colaborar, lo cual supuso un gran problema pues él aportaba no solo una gran capacidad matemática e informática, sino un programa de inteligencia artificial que nos ayudaba a solucionar el problema de cálculo de los valores que se asimilan a las probabilidades de ganar, empatar o perder cada partido.

Creo que por la vía que yo he recorrido es posible generar quinielas con suficiente margen de acierto como para ganar dinero, y en cantidades importantes, pero la cifra a invertir semanalmente es tan grande, que no se puede acometer su utilización si no es con un gran respaldo económico, y eso exigiría un socio, o una Peña. En ambos casos el know how adquirido con tanta dedicación pasaría a terceros, y además en el segundo caso sería necesario un soporte burocrático, para manejar su administración.

Por eso últimamente mis esfuerzos se han encaminado por un lado a ir optimizando lo conseguido hasta ahora, y por otro a buscar un camino que permita reducir la inversión necesaria, sin que ello reduzca en mayor proporción los aciertos. Por eso SGQL tiene dos partes claramente diferenciadas. La primera pretende generar una quiniela múltiple ganadora, normalmente cara, pero que resista la prueba de haber sido rentable durante las cuatro últimas temporadas. La segunda trata de, a partir de la quiniela múltiple obtenida previamente, eliminar una parte de las apuestas simples que la conforman, de modo que la inversión final se reduzca manteniendo, e incluso aumentando, la rentabilidad de esa inversión. Esta última parte está resultando muy difícil por el momento, no porque no se consigan buenos resultados, sino por la dificultad de generalizar los resultados obtenidos, de una forma previamente establecida, objetivamente. 

La cantidad de información que se maneja es tan grande, que he tenido que desarrollar herramientas de cálculo, así como una terminología propia, para simplificar los procesos.  Lo iremos viendo en los capítulos o módulos que siguen.


jueves, 25 de agosto de 2016

Artilugio de EACESA Inmobiliaria







Llavero publicitario
Promotor :  EACESA Inmobiliaria
Dispositivo: Una parrilla de cuatro columnas (dos 1, un X, un 2), y dieciséis filas (catorce partidos y dos mas como reservas), sobre la que se desplazan dieciséis bolitas, hasta quedar fijas en una posición.

Probabilidades para cada signo

                                                     Nº             %                  % real(*)
         Casillas con  1                     32           50,0                    49,4
         Casillas con  X                    16           25,0                    22,6
         Casillas con  2                     16           25,0                    28,0

(*)  Se refiere a los porcentajes de signos que se han dado EN LOS PARTIDOS REALES, de las jornadas anteriores a la publicación de este escrito.

Valoración: se trata de un diseño simple pero muy ingenioso, aunque poco útil. La cantidad de 1, X, y 2 no se ajusta estadisticamente a la experiencia práctica. Por otra parte debido a su diseño es muy dificil que las bolitas se repartan homogeneamente por el dispositivo. El movimiento de la mano al agitarlo para redistribuir las bolas puede hacer que aumente desproporcionadamente el nº de 1 (a la izquierda) o el nº 2 (a la derecha).


lunes, 25 de julio de 2016

Los coeficientes Q(i)


Definición para cada equipo de unos coeficientes Q(i) objetivos, que nos permitan definir su potencial, en cada momento.

Los únicos datos objetivos, disponibles, de los equipos que aparecen en las quinielas  (Ligas de 1ª y 2ª División A, ya que excluimos expresamente las quinielas con partidos de otras categorías, o de otras competiciones), son los relativos a los resultados obtenidos, y su clasificación o puntuación, ya que todo lo demás es subjetivo y no se puede tener en cuenta en un sistema automático. En este trabajo se utiliza sólo información oficial y pública recogida en:
    L.A.E., Loterías y apuestas del Estado  (lae.es/)
    L.F.P., Liga de Futbol Profesional  (lfp.es/)
   
En principio se puede suponer que cada equipo tiene un determinado potencial gracias al cual, y en función también del potencial de sus adversarios, obtiene sus resultados. Por lo tanto la historia reciente de un equipo, sus resultados, nos ha de decir mucho de sus posibilidades en los siguientes partidos. Pero los equipos tienen sus altibajos, sus “rachas”, por lo tanto hay que valorar qué periodo se tomará como periodo histórico útil, para medir el potencial de un equipo en una determinada fecha. Nosotros creemos que, una vez decidido el periodo de tiempo ( T ) que se considere útil, los datos a utilizar son :

EEEE =  Equipo 
Q(1 EEEE) GFC   =  Goles a favor en casa (en T)/ Nº de partidos en casa (en T)
Q(2 EEEE) GCC   =  Goles en contra en casa (en T)/ Nº de partidos en casa (en T)
Q(3 EEEE) PGC   =  Puntos ganados en casa (en T)/ Nº de partidos en casa (en T)
Q(4 EEEE) PCC   =  Puntos cedidos en casa (en T)/ Nº de partidos en casa (en T)
Q(5 EEEE) GCF   =  Goles en contra fuera (en T)/ Nº de partidos fuera de casa (en T)
Q(6 EEEE) GFF   =  Goles a favor fuera (en T)/ Nº de partidos fuera de casa (en T)
Q(7 EEEE) PCF   =  Puntos cedidos fuera (en T)/ Nº de partidos fuera de casa (en T)
Q(8 EEEE) PGF   =  Puntos ganados fuera (en T)/ Nº de partidos fuera de casa (en T)

Estos son los 8 coeficientes Q(i), asociados al equipo EEEE, por los resultados obtenidos en el periodo  de tiempo (T), previo al partido.

Si en el próximo partido el equipo EEEE se enfrenta al equipo FFFF, en el campo del primero, los coeficientes a tener en cuenta para la elaboración de la predicción serán los cuatro primeros de EEEE y los cuatro finales de FFFF, es decir, se compara el potencial de EEEE cuando juega en casa, con el de FFFF cuando juega fuera de casa.

También podemos pensar que en el cálculo de estos coeficientes debe intervenir el factor memoria, de modo que los resultados más cercanos tengan más peso que los más lejanos, dentro del periodo (T). Así pues antes del cálculo de los 8 Q(i) asociados al partido EEE X FFFE hay que definir el periodo de historia (resultados obtenidos) que queremos considerar, y el tipo de ponderación que queremos hacer para dar mas peso a los partidos mas recientes y menor peso a los mas antiguos, dentro del periodo (T).
Desde el punto de vista futbolístico esto tiene su lógica porque salvo excepciones las diferencias entre los equipos son menores de lo que se supone, y el factor motivación tiene mucha importancia. Una victoria reciente, y mas si son varias, pueden elevar mucho la moral de un equipo, y lo contrario pasa con las derrotas. Son las rachas del futbol.

En nuestra aplicación base hemos probado diferentes algoritmos (ej. multiplicado por 1,5 el resultado mas cercano, y por 0,5 el mas lejano, dentro de (T), y por los valores lineales correspondientes a los valores intermedios). Evidentemente no se utiliza la información anterior ni posterior a (T)

Después de hacer algunos tanteos hemos considerado que el periodo histórico que más puede influir en un equipo, está entre los 41 y los últimos  60 días, y hemos hecho diferentes pruebas dentro de este intervalo.
Una vez terminado y pulido todo el procedimiento SGQL volveremos a estas premisas para comprobar con datos reales cual es el periodo (T) y el tipo de ponderación que dan mejores resultados.

Disponemos de la serie completa de Q(i) desde la temporada 1997-1998.  El hecho de utilizar los últimos 40 a 60 días de historia para el cálculo de las Q(i) nos obliga a empezar los pronósticos de cada temporada después de la sexta, séptima, u octava jornada, ya que los Q(i) de las anteriores estarían incompletos. 

lunes, 20 de enero de 2014

Ruedas. Llaveros publicitarios



  Ruedas. Llaveros publicitarios







Signos en negro : San Cristóbal
Signos en rojo   : Bobito

Dispositivo  :  una bolita que puede alojarse en cualquiera de las 11 cavidades del dispositivo. 10 de ellas están dispuestas de forma simétrica, alrededor de la circunferencia interior de la rueda, y la 11ava. está situada en el centro, no siendo posible decir a priori, que la ocupación de esta cavidad tenga las mismas probabilidades, que la ocupación de las otras diez.

Suponiendo que fuera la misma (hipótesis no evidente, y no demostrada) las probabilidades de los distintos signos sería:

                                                                   nº            %               %real(*)
         Casillas con   1                                   6           54,54             49,40
         Casillas con   X                                  3           27,27             22,60
         Casillas con   2                                   2           18,18             28,00

(*) Se refiere a los porcentajes de los distintos signos, que se han dado en LOS PARTIDOS REALES de la temporada anterior.

Valoración:  Es el peor de los artilugios estudiados. No solamente porque no ajusta los porcentajes de cada signo a los que se dan en la realidad, sino porque una de las cavidades (situada en el centro de la rueda) marcada con un signo 1, tiene posiblemente una probabilidad de ser ocupada por la bolita, distinta a la de las otras cavidades, lo que impide la asignación de probabilidades a priori, con certeza.


domingo, 19 de enero de 2014

Determinación de la Q(i) de un partido


Determinación de la Q(i) de un partido.

Hemos definido en el capítulo anterior que a cada partido (eeeexffff) se asocia una Q(i),  sea

Q(i) de EEEE = (GFCeeee, GCCeeee, PGCeeee, PCCeeee, GCFeeee, GFFeeee, PCFeeee, PGFeeee) 
          X
Q(i) de FFFF = (GFCffff, GCCffff, PGCffff, PCCffff, GCFffff, GFFffff, PCFffff, PGFffff )
          =
Q(EEEExFFFF) = (GFCeeee, GCCeeee, PGCeeee, PCCeeee, GCFffff, GFFffff, PCFffff, PGFffff )

Así pues el primer paso es convertir las Q(i) de cada dos equipos que se enfrentan, en una nueva Q(i), también de ocho valores, para cada partido jugado. Este proceso de cálculo se repite semana a semana, a lo largo de la Liga, y para que la correspondiente HC no sea demasiado grande, se hace una HC distinta para cada temporada futbolística. A partir de aquí se trata de relacionar la Q(i) de este partido, de ocho componentes, con las probabilidades P(i) de tres componentes, de que EEEE gane, empate, o pierda el partido. En definitiva, de que el signo de la quiniela sea  1, X, ó 2

Desde este momento  ya no hablaremos de  1, X, ó 2, sino de a, b, ó c, ya que en el tratamiento posterior de esta información por el ordenador la mezcla de números y letras nos ha dado algún problema. Es más eficaz utilizar a cuando gana el equipo de casa, b cuando empata, o c cuando pierde.

Disponemos de una serie muy grande de Q(i), de todos los partidos de primera y segunda división A, desde 1997, de los que conocemos también, a toro pasado, qué resultado se produjo, y qué signo en la quiniela.  Por lo tanto si con nuestra evaluación de probabilidades P(i) somos capaces de hacer una predicción, también podemos medir nuestro error, comparando la predicción con el resultado real. Y puesto que asimilamos P(i) a las probabilidades de  (a, b, c), también sabemos que en cada uno de esos partidos se ha de cumplir que:
P(a) + P(b) + P(c) =1 , no pudiendo ser  P(a), P(b), P(c),  negativos, ni mayor que 1.