top of page

INTRODUÇÃO

 

O futebol é um dos deportos mais populares do mundo. Sendo assim, a previsão dos resultados dos seus jogos é interessante para vários grupos de pessoas, incluindo fãs, treinadores, jornalistas. A previsão de resultados é interessante também porque, é uma tarefa difícil, uma vez que depende de muitos fatores, como a moral de uma equipa(ou jogador), aptidões, fadiga etc. Por isso, mesmo para os especialistas é muito difícil prever um resultado de um jogo. O interesse pela previsão de resultados no futebol vai muito mais além do que o simples fã ou jornalista. Hoje em dia, as apostas desportivas são uma nova realidade está a ganhar força no mundo do desporto. Estas duas realidades juntas levam a que um pouco por todo o mundo milhões e milhões de fãs de desporto e jogadores colocam as suas apostas nos seus desportos favoritos. A possibilidade real de ganhar dinheiro com o futebol aumenta ainda mais o interesse na previsão dos seus resultados.

 

Data mining é uma abordagem para problemas de apoio à decisão que involve técnicas, ferramentas matemáticas e estatísticas para extração de conhecimento em grandes quantidades de dados. Essas informações podem ser extraídas através de padrões, associações, anomalias relevantes etc. Atualmente existe a aquisição de grandes quantidades de dados sobre cada jogador, equipa, treinos etc. No entanto, há pouca informação acerca do uso desses dados por parte das equipas, embora não haja dúvidas de que já perceberam a potencialidade da exploração desses dados para seu beneficio e o seu interesse nas técnicas de exploração dos dados aumentou.

O objectivo principal desta dissertação é desenvolver um estudo empirico de uma abordagem de data mining no ambito do problema que é a previsão do resultado em jogos de futebol numa perspectiva 1X2. Durante a dissertação serão abordadas diversas variantes de algoritmos, variaveis e métodos de preparação diferentes e serão escolhidas as caracteristicas que obtiverem melhores resultados. Os dados utilizados serão de várias épocas de diferentes ligas que serão disponibilizados pelo Laboratório SAPO/ U.Porto.

 

Nesta dissertação está a ser utilizada a metodologia CRISP-DM que, basicamente tem 6 fases: Entendimento do negocio, compreensão dos dados, preparação dos dados, modelação, avaliação e implementação. A sequencia destas fases não é rigida, por isso, algumas das fases serão executadas mais que uma vez com o intuito de melhorar o processo (com novas variáveis, outros algoritmos etc).
 

 

bottom of page