domingo, 10 de mayo de 2020

SGQL - Presentación


SGQL - PRESENTACIÓN

Después de 40 años siguiendo las quinielas he ido evolucionando en mi búsqueda de LA QUINIELA, he modificado las hipótesis y los procedimientos pero, sobretodo, han cambiado y mucho, las herramientas de trabajo utilizadas. Pasar del COMODORE o el SPECTRUM, con una capacidad de 64 Kb RAM y teniendo que programar uno mismo sus aplicaciones (FORTRAN, PL4, COBOL,..) a los actuales PC´s, con una capacidad practicamente ilimitada de tratamiento y almacenamiento de datos, es como pasar del petardo de berbena a la  explosión de un artefacto nuclear, y además ahora tenemos la capacidad de acceder a equipos más potentes aún (servicio de hosting) y a la gestión a control remoto,  que facilitan los actuales lenguajes de programación.

Siempre creí, y este ha sido el motor de mi afición por este tema, que mediante la informática se podían crear quinielas obviando la carga subjetiva que todo apostante transmite a su juego, y por otra parte cubrir, con criterios estadísticos elaborados, las probabilidades de obtener un 1, una X, o un 2, en cada partido.

Mi objetivo, ya lo era entonces, no es enriquecerme con la quiniela, sino llegar a determinar un procedimiento que, aunque en la práctica quizás no pueda llegar a utilizarse, desde el punto de vista estadístico garantice, con un % de acierto suficientemente elevado, un resultado económico positivo. Para mi ha sido un reto matemático-informático, y no económico. Yo no gasto el dinero nunca en quinielas.

Vaya por delante también que muy pronto comprendí que cubrir con la apuesta un % elevado de posibilidades del 1, X, o 2, en cada partido de la quiniela, supone trabajar con quinielas múltiples, con muchos dobles y triples, es decir con inversiones muy altas. Y efectivamente llegué a formular modelos con los que obtener resultados muy interesantes, pero a costa de inversiones imposibles.

¿Alguien puede asumir una inversión semanal que puede oscilar entre los 25.000€ y los 750.000€, cuando nadie garantiza que el primer reembolso importante se produzca antes de la Jornada 15, 20, ó 30.?  Por mucho que la estadística diga que acabaremos ganando dinero, nadie!!

Es cierto que llegué a formular y desarrollar soluciones ganadoras, pero en 2014 el Organismo responsable de las quinielas decidió modificar la apuesta al 15 (la última línea del boleto de apuestas), que desde entonces no se apuesta con los signos clásicos 1, X, 2, sino por el número de goles marcados por uno y otro equipo, con un formato que admite 16 signos diferentes. Es decir, la probabilidad de acertar el último partido del boleto pasó de ser 1/3 a ser 1/16. El acierto al 15, que era el resultado buscado por el quinielista y las Peñas, se volvió muy esquivo y, ahora sí, mas fruto de la suerte que de la estadística y el método. No solamente destrozó mi sistema, desde entonces la recaudación de la quiniela  ha caído un 50%, y los premios en proporción.

En los capítulos siguientes voy a tratar de ser concreto, dar pistas, ideas, soluciones, pero sin entrar en desarrollos. No quiero que si alguien se interesa por el tema le pase lo mismo que a mi esposa, que dice que cuando ve la pantalla de mi Mac atiborrada de cifras que saltan enloquecidas de un lado para otro, le entra dolor de cabeza. Si alguien, después de leer esto quiere más, estaré encantado de ayudarle. Estoy a disposición de quién sintonice con estas ideas en:    epujolribo@gmail.com



domingo, 3 de mayo de 2020

¿Qué es SGQL?

¿Qué es SGQL? 

Es un Sistema de Generación de Quinielas Lógicas, mediante aplicaciones informáticas, y por tanto exento de subjetividad. Consta de tres partes:

1º Análisis histórico para determinar, a partir de una serie de resultados (yo utilizo los últimos 1.000 partidos), mediante un ajuste de los valores que representan el potencial teórico de los equipos que se enfrentan, el potencial o probabilidad de cada equipo, lo que en adelante llamaremos el vector de cada equipo. Este análisis debe servir también para seleccionar los coeficientes óptimos, de este ajuste, y escoger de entre los distintos algoritmos posibles para construir la quiniela, el que mas nos guste.

2º La propuesta (quiniela) semanal que, mediante un algoritmo preestablecido puede facilitarnos el PC, sin criterios subjetivos, con los coeficientes óptimos hallados en la fase anterior, correspondientes a los enfrentamientos habidos en los D días anteriores a esa quiniela.

3º El adelgazamiento de la propuesta anterior, o quiniela múltiple QM semanal, para situarlo dentro de un nivel de coste previamente aceptado. Se trata de que la reducción del coste sea mayor que la reducción de premios que comportará el hecho de prescindir de algunas apuestas, y siempre sin intervención de criterios subjetivos.

Tanto el análisis histórico como la propuesta semanal se realizan sobre HOJA DE CÁLCULO, y además con aplicaciones muy semejantes que pueden intercambiar datos y resultados entre ellas.

La propuesta semanal facilita una quiniela múltiple, QM, generalmente de coste elevado ya que debe cubrir muchos resultados posibles. La propuesta, en un formato HC EXCEL debe poder volcarse a una aplicación en lenguaje PHP para poder ser enviado a un equipo exterior, para ser ejecutado y devuelto a nuestro ordenador, ya que el PC se bloquea en los trabajos de filtrado de la QM, y se requiere un equipo con una capacidad de cálculo y manejo de información bastante mayor.

El resultado, que esta aplicación obtiene sobre un equipo exterior es devuelto al PC, y solo falta darle el formato de archivo plano que establece normativamente el PAMDB para su sellado en una Oficina autorizada.





domingo, 26 de abril de 2020

RESUMEN. 1ª PARTE - Análisis Histórico


RESUMEN.  1ª PARTE

Análisis Histórico

Del análisis histórico de los últimos 1.000 partidos, de las últimas temporadas, aprenderemos a conocer el comportamiento de los equipos en función de sus vectores, y aplicaremos estos conocimientos para realizar la apuesta semanal. Tendremos que repartir los 1, X, y 2 entre los partidos da cada quiniela, precisamente en función de esos vectores, o potencial de cada equipo. 

Potencial de marcar goles y/o ganar puntos cuando se juega como local, o  cuando se juega como visitante. Son los únicos datos objetivos, disponibles, de los equipos que aparecen en las quinielas  (Ligas de 1ª y 2ª División A, ya que excluimos expresamente las quinielas con partidos de otras categorías, o de otras competiciones), ya que todo lo demás, y en el entorno del futbol hay mucho más, es subjetivo y no se puede tener en cuenta en un sistema informático. Cuando se enfrentan dos equipos estos vectores se miden para un periodo de tiempo corto, inmediato al partido. Tendremos en cuenta solo los resultados de los partidos jugados por estos dos equipos en los 58 días previos a la fecha de la quiniela.

En este trabajo se utiliza sólo información oficial y pública recogida en:
    L.A.E., Loterías y apuestas del Estado, y S.E.L.A.E. 
    L.F.P., Liga de Futbol Profesional  (lfp.es/)
o de webs especializadas y serias como la de D. Eduardo Losilla   
En principio se puede suponer que cada equipo tiene un determinado potencial gracias al cual, y en función también del potencial de sus adversarios, obtiene sus resultados. Por lo tanto la historia reciente de un equipo, sus resultados, nos ha de decir mucho de sus posibilidades en los siguientes partidos. Pero los equipos tienen sus altibajos, sus “rachas”, por lo tanto hay que valorar qué periodo se tomará como periodo histórico útil, para medir el potencial de un equipo en una determinada fecha. Nosotros creemos que, una vez decidido el periodo de tiempo ( D ) que se considere útil, los datos a utilizar son :

de AAA =  Equipo local, su potencial cuando juega en casa
Q(1 AAA) GFC   =  Goles a favor en casa (en D)/ Nº de partidos en casa (en D)
Q(2 AAA) GCC   =  Goles en contra en casa (en D)/ Nº de partidos en casa (en D)
Q(3 AAA) PGC   =  Puntos ganados en casa (en D)/ Nº de partidos en casa (en D)
Q(4 AAA) PCC   =  Puntos cedidos en casa (en D)/ Nº de partidos en casa (en D)

de BBB = Equipo visitante , su potencial cuando juega fuera
Q(5 BBB) GCF   =  Goles en contra fuera (en D)/ Nº de partidos fuera de casa (en D)
Q(6 BBB) GFF   =  Goles a favor fuera (en D)/ Nº de partidos fuera de casa (en D)
Q(7 BBB) PCF   =  Puntos cedidos fuera (en D)/ Nº de partidos fuera de casa (en D)
Q(8 BBB) PGF   =  Puntos ganados fuera (en D)/ Nº de partidos fuera de casa (en D)

Estos 8 coeficientes Q(i), los 4 primeros de AAA y los 4 segundos de BBB, forman lo que llamamos vector asociado al partido AAAXBBB, por los resultados obtenidos en el periodo  de tiempo (D), previo al partido por los dos contendientes.

También podemos pensar que en el cálculo de estos coeficientes debe intervenir el factor memoria, de modo que los resultados más cercanos tengan más peso que los más lejanos, dentro del periodo (D). 
Desde el punto de vista futbolístico esto tiene su lógica porque salvo excepciones las diferencias entre los equipos son menores de lo que se supone, y el factor motivación tiene mucha importancia. Una victoria reciente, y mas si son varias, pueden elevar mucho la moral de un equipo, y lo contrario pasa con las derrotas. Son las rachas del futbol. Pero la experiencia nos ha demostrado que la ponderación no mejoraba los resultados.

Después de hacer algunos tanteos hemos considerado que el periodo inmediato que más puede influir en un equipo, está entre los 41 y los últimos  60 días, tomando finalmente los 58 días como mejor opción. Este hecho nos obliga a empezar los pronósticos de cada temporada después de la octava jornada, ya que los Q(i) de las anteriores estarían incompletos. 

Tenemos una aplicación que, una vez definido el intervalo D, calcula para cada equipo sus 8Q(i), forma el vector de cada partido de la quiniela y, a este, le asigna un signo o conjunto de signos 1, X, 2 según el conocimiento adquirido de los 1.000 partidos anteriores. 

Ahora ya estamos en condiciones de preguntarnos que hubiéramos obtenido en las temporadas anteriores si hubiésemos hecho nuestro pronóstico con este mismo algoritmo, dando a los vectores de aquellos partidos, el mismo sentido. Hemos creado el instrumento para tener la respuesta a esta pregunta, a un solo "clic". Se trata ya solo de de ir probando distintos ajustes lineales, y distintos algoritmos para los vectores de los 15 partidos, y seleccionar los resultados que mas nos convengan. Si la serie histórica es consistente, y los resultados se mantienen, y no ha habido cambios en el futbol o las quinielas que lo justifiquen, podemos presumir, que no garantizar, que los resultados en la temporada siguiente deberían estar en una línea parecida.

domingo, 19 de abril de 2020

RESUMEN. 2ª PARTE - La propuesta semanal


RESUMEN.  2ª PARTE

La propuesta semanal

Hemos jugado con la aplicación todo lo que hemos querido. Hemos explorado diferentes hipótesis, algoritmos, ajustes lineales y no lineales, diferentes formas de asignar pronósticos a los partidos de la jornada, hemos invertido horas y mas horas en ejercicios de simulación, en modelos, y finalmente siendo conscientes de que este camino es infinito, hemos tenido que volver a lo concreto.

Si tenemos un modelo que se comporta muy favorablemente con los vectores de las últimas temporadas, qué nos impide pensar que también puede comportarse bien con los vectores de la temporada actual? Desde luego no podemos asegurar que vaya a funcionar, pero si tomamos precauciones si que podemos esperarlo.

Se requiere que el modelo sea lo mas estable posible, que no haya habido cambios de normativas, de formatos en las apuestas, o de transformaciones del mercado del futbol, del mercado de juego de apuestas, de su incidencia fiscal, etc., y por lo tanto hay que evaluar previamente todos los cambios habidos.

Hacer un ajuste con hasta 20 coeficientes nos traslada a un espacio de 20 dimensiones. No todas son igual de sensibles, ni tienen la misma incidencia en el resultado final, por lo tanto va a ser muy importante que la solución que adoptemos para la próxima temporada no sea un punto caliente, o singular, de ese espacio de 20 dimensiones. No nos interesa una "mejor" solución única sino una zona homogénea de soluciones aceptables, aunque no sean la mejor. La solución puntual óptima no tiene porque repetirse en la temporada siguiente en cambio es mucho más posible que un sub-espacio confortable de soluciones más modestas albergue también buenas soluciones para la próxima temporada. 

El modelo escogido, el que sea, deberá estar especialmente bien diseñado en la apuesta al 15. La apuesta al 15 solo computa en el caso de tener un pleno en la apuesta de 14, si no hay acierto en Q14 no sirve para nada acertar la apuesta al 15, por lo tanto y con lo que cuesta hacer un pleno en la Q14 hay que asegurar al máximo la apuesta al 15 ya que en caso de acertar es la que nos resolverá el problema económico

Como inversión, actualmente, la quiniela solo es interesante si se tienen posibilidades reales de acertar algún Q15, de vez en cuando, y eso solo ocurrirá si a priori la aplicación nos propone entre 5 y 10 jornadas ganadoras del 15 (ya he dicho que para que esto sea real habrá que acertar también las correspondientes Q14) por temporada.

Todos sabemos que la apuesta al 15 no admite múltiples. Cierto. Pero eso no quiere decir que solo podamos jugar una opción en el 15. Dicho de otra forma, si tuviéramos la certeza sobre los otros 14 signos podríamos hacer 16 apuestas con un signo distinto en cada Q15 y nos aseguraríamos el acierto al 15. No es una propuesta, es una reflexión.

Pues bien, con el algoritmo escogido para la Q14, el algoritmo escogido para la Q15, y los coeficientes de ajuste seleccionados para Q14 y Q15, y los vectores de cada uno de los 15 partidos de la quiniela, ya podemos confeccionar la QM, de la propuesta semanal.



domingo, 12 de abril de 2020

RESUMEN. 3ª PARTE - Adelgazamiento de la QM semanal


RESUMEN.   3ª PARTE

Adelgazamiento de la QM semanal

Esta tercera parte trata de acomodar lo hecho hasta ahora, a una escala económica accesible. 

Es evidente que una quiniela que cubra muchas posibilidades es una quiniela múltiple con muchos signos triples y dobles, es decir es una quiniela muy cara. Pero es igualmente evidente que una  QM cara, al descomponerse en sus Qs (en las quinielas simples que la forman), nos da la posibilidad de eliminar alguna de esas Qs, por improbable, o por demasiado fácil con lo que tampoco tendrían un premio interesante. Esto es lo que hacemos en la fase de adelgazamiento. 

La aplicación, desarrollada en PHP hace lo siguiente: envía la QM a un Host remoto donde es descompuesta en sus QS correspondientes. Después se someten las QS a uno o varios filtros consecutivos para eliminar aquellas apuestas que consideramos poco probables, o no rentables. Ejemplo: una apuesta con 10 o más signos 1 es posible, en realidad se ha dado muchas veces, pero con un premio mínimo ya que habría muchos acertantes, por lo tanto pondríamos un filtro que elimine las Qs con 10 o más signos 1. Del mismo modo cabe suponer que no se dará una quiniela con 10 o más signos X, o 2, o con más de 10 variantes seguidas,....

En mi aplicación he usado más de 500 filtros distintos y creo que con imaginación se pueden crear diez veces más. Al trabajar con ellos, y sufrir muchas sorpresas, se comprueba aquello de que la avaricia el saco. Si se es muy severo con los filtros ocurre que disminuyen mucho los costes, pero también los aciertos, y especialmente aquellos aciertos "raros" que comportan premios importantes. Es igualmente cierto lo contrario, a Dios rogando y con el mazo dando, es decir si somos demasiado prudentes reduciremos muy poco la inversión inicial, y la apuesta final será inviable. A todo eso conviene recordar que en ningún caso estamos hablando de aplicar una receta distinta a cada QM, sino de marcar unas reglas que deberá cumplir el programa, en todos los casos.

Para los no avezados recordemos que una QM con t Triples y d Dobles nos dará al descomponerla 3 elevado a t por 2 elevado a d, QS. Ejemplo, una QM con 4 Triples y 5 Dobles contiene  3X3X3X3X2X2X2X2X2 = 2.592 apuestas. Con 2 dobles más ya estaríamos por encima de las 10.000 apuestas,...

Nosotros trabajamos normalmente con un método. Sometemos toda la temporada a ese método (por método me refiero a un algoritmo que genera las apuestas, y variando los coeficientes del ajuste toda la familia de soluciones) y estudiamos los resultados, seleccionando los mejores de esa familia. Pues bien, la experiencia nos enseña que las soluciones buenas están en la franja de inversiones que va de 2,5M€ a 6M€ por temporada. Las inversiones menores pueden dar con soluciones singulares fantásticas pero no consistentes, y las soluciones con inversiones superiores a los 6M€ por temporada son mucho más estables, pero la densidad de aciertos al 15 es demasiado pequeña para cubrir los costes. Entre los 3 y los 5M€ es donde se encuentran soluciones en las que el premio se obtiene a partes iguales ente los aciertos al 15, y el resto de premios, con rentabilidades medias superiores al 120%. Un método sería aceptable si cumpliendo las condiciones anteriormente citadas diera una rentabilidad total superior al 120% en esos tres años, cubriendo gastos en todos ellos. Claro, estamos hablando de unas inversiones inasumibles. De todas formas con esa horquilla hay semanas de 2.000€ y semanas de "NO JUGAR", si la inversión fuera a superar 1M€.

Esa estabilidad en los resultados es lo que nos anima a creer que se mantendrían en la temporada siguiente, y es lo que nos hace proponer el mismo algoritmo utilizado, con los coeficientes de ajuste que mejores resultado han dado en las temporadas anteriores, para realizar la QM de la temporada siguiente, y una vez obtenida, semanalmente, la sometemos al conjunto de filtros que las temporadas anteriores han demostrado ser capaces de eliminar hasta un 90% de la inversión inicialmente necesaria, en función del tamaño de la QM, con una reducción menor de los premios

Terminada la presentación de SGQL vamos a empezar con el detalle. Las explicaciones que siguen serán pesadísimas para los que hayan olido dividendos, y totalmente insuficientes para quienes se vean utilizando las aplicaciones, pero estoy jubilado y tengo tempo suficiente para compartirlo con quién esté realmente interesado.

El cofre del tesoro, aquí, no es un cofre sino un armario, y su aspecto al abrir la puerta se puede ver precisamente en la pantalla reproducida al final de esta página. Es la pantalla de mi Mac en la que, al abrir la carpeta de Google Drive aparecen varios archivos, el primero de los cuales es la carpeta SGQL. Está abierta y nos permite ver su interior y,  entre otras, una serie de temporadas futbolísticas como T11-12,...., y la serie Z nº GLOBAL, en la que cada carpeta contiene una propuesta concreta con los resultados que SGQL habría obtenido en los cuatro últimos años, con diferentes algoritmos.

A la derecha de esta columna está el detalle del archivo abierto, justamente T18-19 donde aparecen, entre otras, dos Hojas EXCEL muy importantes N QM y R Gen Completo, y también una carpeta abierta, cuyo contenido aparece mas a la derecha, que son las Jornadas de la T18-19, en formato .csv, listas para ser tratada por la aplicación de adelgazamiento, en la 3ª PARTE.

Si pretendiera vender algo, sería el momento de abrir esta carpetas y empezar el regateo, pero ya he dicho que mi objetivo ha sido otro. Yo he disfrutado de estos 40 años de camino, y como soy tenaz, por no decir testarudo, pienso seguir disfrutando con ello, pero los años van templando las fuerzas, y ahora ya me interesa más dejar el camino bien balizado por si alguien quiere seguirlo, que seguir haciendo kilómetros. La quiniela española ha perdido en estos últimos cinco años la mitad de su recaudación, y por tanto una buena parte de su interés. Creo que es el momento de poner en valor el trabajo de investigación hecho y los resultados estadísticos alcanzados, más que los resultados económicos, que siguen perteneciendo al mundo de las probabilidades.

   
                                              




domingo, 5 de abril de 2020

1ª PARTE. ANÁLISIS HISTÓRICO


1ª PARTE.  ANÁLISIS HISTÓRICO

Aplicaciones

La PRIMERA parte utiliza de un modo constante la potencia de la HOJA DE CÁLCULO, tanto de las funciones matemáticas, lógicas, estadísticas, y de cálculo en general, como las utilidades más avanzadas de MACROS. Es la parte en la que me siento más cómodo y el tiempo que le he dedicado, en mis horas de asueto, me reportó beneficios en la faceta profesional, al ayudarme a dominar esa herramienta.

Siguiendo el orden marcado, para la 1ª PARTE dispongo de un libro EXCEL con una serie de HOJAS interconectadas. Es N QM (podemos ver el correspondiente a T18-19: N QM T18-19.xlsx en el armario) cuya función principal es calcular los 8 vectores y la predicción para cada partido de la Quiniela. Las Hojas más importantes de este libro son:

Hoja AAAXBBB   Incorpora el calendarios de las ligas de 1D y 2D, con Nº Jor,
equipos y fechas. Se actualiza semanalmente con los goles que se hayan marcado.
Recoge los  cambios de fechas, si se hubiese producido alguno. 
Hoja JORQU     Incorpora cada semana los signos de la quiniela que se ha 
jugado, con especial atención a las substituciones, aplazamientos,.. que se 
puedan producir
Hoja BOLETIN    Reproduce el cuerpo del boleto semanal de la quiniela. 
Puesto que en JORQU se ha  dado nombre a cada jornada: JOR01, JOR02,.. se
puede actualizar BOLETO mediante un copiar y pegar desde NOMBRE. 
Si la Jornada ya se ha jugado, junto con los equipos y los resultados también se 
copiará el signo de la quiniela. Desde AV hasta CQ esta hoja tiene una parrilla de
datos que hay que alimentar cada semana, sobre el nº de acertantes y premios, 
de cada categoría.
Hoja COEFIC.     Esta hoja calcula los vectores que representan a cada uno de los
equipos que intervienen en las quinielas
Hoja Resultados  Es un acumulador de datos. Mediante una MACRO que guarda
los resultados de BOLETIN de cada semana
Hoja Acumulado   Es una plantilla sobre la que se vuelcan los datos de la H.
Resultados (no las fórmulas) para totalizar la Temporada
Hoja CUADRO 1D  facilita la información para calcular el vector de cada equipo
 de 1D
Hoja CUADRO 2D  lo mismo para los equipos de 2D.

En el detalle  (.... para los que quieran saber más),  que aparecerá al final del blog (para no cansar demasiado pronto a los curiosos y porque prefiero explicar todo el sistema SGQL antes de entrar en los pormenores), se pueden ver partes de esta Hoja de cálculo, y de las que iremos presentando. 

Esta Hoja es especialmente importante porque una vez terminada la temporada se vacía y se vuelve a utilizar, actualizando la información convenientemente, la temporada siguiente, y es fácil, con este manejo y su gran volumen, que se machaque alguna parte, o fórmula,  que hay que ir revisando

Si seguimos con la imagen del armario abierto, dos estantes por debajo de N QM está el otro libro más importante de SGQL, se trata de R Generador Completo de 20 Coeficientes T18-19.xlsx, que en adelante llamaremos de forma genérica R GEN Completo.

R Gen Completo tiene una doble función, por un lado es capaz de recalcular el número de aciertos y los premios por categorías de toda una temporada de quinielas, al cambiar alguno o todos los coeficientes del ajuste lineal, o el algoritmo de fabricación de apuestas, actualizando además el nº de aciertos y el valor de los premios, añadiendo los que habría producido SGQL. Y todo ello en un solo proceso de calculo. 

En segundo lugar, como el proceso de cálculo que utiliza es algo distinto al que usa la Hoja N QM (aunque la información de base, los vectores, y los datos económicos son los mismos) es fácil detectar cuando de producen diferencias en el resultado de los dos métodos, y con el análisis de esas diferencias hallar los fallos o errores en una Hoja, o en ambas, que los han provocado. Solo si los resultados coinciden al 100% podemos estar seguros de no haber incorporado algún error, o no haber sufrido algún machaque o deterioro indeseado, en alguna de esas hojas Excel.

La diferencia más importante entre las dos Hojas es que N QM calcula el resultado de la quiniela semana a semana, y lo acumula en una parrilla anual. Este resultado depende de nuestro algoritmo, no lo podemos guardar como un dato fijo de la temporada. Está vinculado a nuestro desarrollo. Lo mismo ocurre con la cifra de inversión semanal.  En cambio R Gen Completo está pensado para calcular temporadas completas, sin cambios. Aquí sí, tanto la inversión como los aciertos y premios son fijos durante toda la temporada, por que no cambiamos ni el algoritmo ni los coeficientes, durante la misma.

El libro R Gen Completo tiene varias hojas:

Hoja de Datos   Es la más importante, y monstruosamente grande, lo que
la hace muy vulnerable. No precisa las rutinas que generan los vectores de
 cada equipo, que hereda   directamente de N QM, pero a cambio repro-
-duce el BOLETIN, boleto de cada semana, desde la JOR09 a la JOR38, 
de la Temporada, calculando el coste, el nº de aciertos, los premios ganados,
.. de cada jornada, y por acumulación de toda la Temporada.
Resultados  Puede generar los 20 coeficientes para el ajuste lineal, y guarar 
el resultado que se obtendría con ellos. Para afinar estos coeficientes utiliza 
la "cola aleatoria".

También en el detalle  (.... para los que quieran saber más), está el detalle funcional de esta hoja de cálculo, con sus fórmulas. Estos dos libros EXCEL constituyen, han supuesto, el 80% del esfuerzo dedicado a este proyecto. Con el uso combinado de los dos, más alguna ayuda en la que no me he entretenido para no hacer más tediosa la explicación, conseguimos responder a una cuestión básica: ¿Que habría ocurrido si en los 3, 4, 5,.. años anteriores hubiésemos utilizado tal o cual sistema? Ahora somos capaces de responder al momento: Habríamos invertido tanto,  habríamos conseguido tantos 15, tantos 14,..., , habríamos jugado tantos triples, tantos dobles,... finalmente habríamos cobrado tanto, pagado tantos impuestos, y habríamos ganado o perdido tanto. Ahora gracias al doble sistema de cálculo sabemos que esos datos son ciertos.. Y lo sabemos en el tiempo que tarda un "clic". Todo esto no nos hace más ricos ni más pobres, solo más sabios.



domingo, 29 de marzo de 2020

2ª PARTE. LA PRPUESTA SEMANAL


2ª PARTE.  LA PROPUESTA SEMANAL

Procedimiento

En la 1ª PARTE lo decisivo han sido las aplicaciones, pero en esta segunda lo importante es el procedimiento, porque las herramientas ya quedaron listas allí.

Durante el fin de semana, y hasta el lunes, se han jugado normalmente todos los partidos de la Jornada. Los partidos elegidos para formar parte de la quiniela son los que se juegan en sábado o domingo por lo que en cualquier caso hay que esperar al lunes para conocer los resultados, tanto de los partidos como del escrutinio, y han de proceder de fuentes solventes: La Federación Española de Futbol, La Liga Nacional, o la propia LAE o SELAE. En ocasiones también a fuentes privadas siempre que sean solventes, como la web El Quinielista de Eduardo Losilla. 

La relación de encuentros que forman la quiniela de cada semana no se publica hasta unos pocos días antes de jugarse los partidos, una o dos semanas antes.

Anteriormente hemos dicho que utilizamos los datos de un periodo previo a los partidos de la quiniela, para calcular los vectores. Después de distintas pruebas llegamos a la conclusión de que el óptimo para este periodo era de 58 días. Llegamos a esta conclusión tras un análisis estadístico serio pero es más entendible explicarlo en términos futbolísticos. Los que hemos seguido el futbol creemos que salvo algún jugador genial, fenómeno que se puede disfrutar cada 20 o 30 años, todos los demás jugadores de primera y segunda división son solo un poco mejores o un poco peores  que los demás, y lo mismo ocurre con los equipos, y con los técnicos. Al final la diferencia está en otras causas.

El estado de ánimo personal, las ganas que le tengas al contrario, querer dedicarle un gol a la novia, o al hijo recién nacido, un dolor de muelas que no te ha dejado dormir la noche anterior, la presencia en el campo de un ojeador de un equipo importante, que el partido se transmita en directo por una cadena importante, o internacional, volver a la titularidad después de haber chupado banquillo, y sobretodo venir de una racha de victorias o de derrotas,...  son razones que influyen en el rendimiento de los jugadores y pueden ser más importantes que su capacidad cara al resultado final del partido. Por eso el periodo de cálculo no puede ser demasiado largo, porque el factor motivador o desmotivador ya se ha desvanecido, pero tampoco demasiado corto, porque no pasan cosas tan
motivadoras o desmotivadoras cada día.
Con este método necesitamos que se hayan jugado los partidos de los últimos 58 días, y se hayan incorporado los resultados a la Hoja de cálculo para poder calcular los vectores, por lo tanto dispondremos normalmente de martes a viernes para ejecutar todo el procedimiento.

Con todos los datos recientes incorporados a N QM vamos a BOLETIN, y copiamos por su nombre, la jornada próxima sobre la parrilla. De forma inmediata aparecerá la propuesta  en la columna correspondiente, con los triples y dobles que le haya asignado el algoritmo y los coeficientes elegidos en la 1ª PARTE. Una propuesta que supere el M€ hay que desestimarla de entrada. Yo le tengo puesto un condicional a la última fórmula de modo que si la apuesta supera este importe la quiniela que me imprime directamente es "NO JUGAR". Adelgazar tanto este importe para hacerla viable desvirtuaría demasiado la propuesta, pero es que claro, hay semanas que no nos sobra 1M€.

Tenemos el Boleto con la propuesta, hay que transformarlo en un archivo  .csv y pasar a la 3ª PARTE de SGQL. Es una tarea simple pero delicada. Cuando recreamos una temporada ya terminada, nos situamos en la N QM y vamos editando sobre la Hoja BOLETIN, llamándolas por su nombre, las sucesivas jornadas. Una vez tenemos la pantalla actualizada con los datos correspondientes a la QM de la Jornada que nos interesa hacemos una copia de BOLETIN, a una hoja nueva, copiamos el contenido del recuadro de BOLETIN con un pegado sobre si mismo, para convertir las fórmulas en datos,  y evitar que se estropeen al cambiar formatos, aligeramos la Hoja, suprimiendo todo lo demás hasta que solo quede el "Boleto" de la quiniela, y guardamos ese archivo con el nombre de la Jornada y la extensión  .csv   Vamos guardando cada una de las jornadas en una carpeta que llamamos "Datos Jornada"

En la séptima página de este informe está la imagen de la pantalla de mi Mac. En la tercera columna-estantería del armario está abierta la carpeta T18-19, cuyo contenido se muestra en la columna de la derecha. Es precisamente la carpeta "Datos Jornada" de aquella temporada. Si la próxima jornada a jugar fuera la Jor38 de aquel año, cogeríamos el último archivo de la lista, que se llama Jor38 T18-19 con coef.26. csv, para llevarlo a la tercera fase, para adelgazar.

Los archivos han de seguir el mismo patrón para que la aplicación de adelgazamiento (recordemos que no es una de cálculo sino una aplicación desarrollada en PHP-5, y que no se ejecutará sobre nuestro PC, sino sobre un Host remoto) las encuentre, las remita al ordenador externo, ejecute sus rutinas, las empaquete, y nos devuelva dos archivos. El de las Qs que han superado los filtros y el de las Qs que no han superado los filtros. Pero no nos anticipemos.