StatsBomb
Empresa fornecedora de dados para análises de futebol
Funcionalidades
Funcionalidade | Suportado | Notas |
---|---|---|
Definir frequência da pipeline | Sim | Para mais detalhes, acesse. |
Sincronização Full load | Sim | |
Conexão via Credenciais | Sim |
Este conector coleta as seguintes objetos do StatsBombs:
- competitions;
- player_season_stats;
- team_season_stats;
- matches;
- lineup;
- player_match;
- events.
Guia rápido
Para iniciar a criação de uma Pipeline, basta ir no módulo Coletar, "Pipelines" aperte em "Nova Pipeline".
Escolha a fonte de dados
Utilize uma fonte já cadastrada ou cadastre uma nova
Parâmetros para conexão (cadastro da fonte)
Nome do campo | Exemplo |
---|---|
Nome | username |
Senha | password |
Informações da pipeline
Atribua o nome e uma breve descrição para sua Pipeline.
Selecione as competições
Ao coletar dados do StatsBomb, trabalhar com um subconjunto de competições tem muitas vantagens. O StatsBomb possui uma grande quantidade de dados, com um número incrivelmente grande de eventos registrados em muitas competições diferentes. Essa quantidade massiva de informação pode tornar o processo de coleta e análise de dados bastante desafiador e demorado.
Ao nos concentrarmos em um subconjunto específico de competições, podemos simplificar esse processo e torná-lo mais gerenciável. Em vez de lidar com a enorme quantidade de eventos de todas as competições, podemos filtrar e trabalhar apenas com os dados que são mais relevantes para nossas necessidades específicas. Isso pode melhorar a eficiência, reduzir o tempo de processamento e tornar a análise dos dados uma tarefa mais fácil.
Além disso, isso permite um foco mais claro em competições específicas, permitindo uma análise mais profunda e detalhada. Portanto, ao lidar com a coleta de dados do StatsBomb, trabalhar com um subconjunto de competições pode ser uma abordagem muito eficaz e eficiente.
Competições Disponíveis
As seguintes competições estão disponíveis e os nomes devem ser adicionados manualmente. É necessário que os nomes sejam exatamente iguais aos que estão na documentação.
Copa do Brasil-Brazil
Série A-Brazil
Serie B-Brazil
State Championship-Brazil
Super Cup-Brazil
Libertadores-South America
Libertadores Qualifiers: Mineiro-South America
Liga MX-Mexico
Ligue 1-France
Play-offs 1/2-France
Play-offs 2/3-France
Major League Soccer-United States of America
Play-offs 1/2-Japan
J1 League-Japan
Play-offs 1/2-Portugal
Play-offs 2/3-Portugal
Segunda Liga-Portugal
Liga NOS-Portugal
Bundesliga-Austria
Eredivisie-Netherlands
Play-offs 1/2-Netherlands
Premier League-Ukraine
Pro League-Saudi Arabia
Süper Lig-Turkey
Play-offs 1/2-Russia
Premier League-Russia
Play-Offs 1/2-Qatar
Stars League-Qatar
Primera A-Colombia
Superliga-Denmark
Liga Pro-Ecuador
Primera Divisisão-Uruguay
Primera Divisão-Peru
Play-offs 1/2-Peru
Super League Relegation Play-offs 1/2-Switzerland
Super League-Switzerland
Super League-Greece
Super League Relegation Play-offs 1/2-Greece
Primera Divisão-Chile
Play-Offs 1/2-Chile
Serie A-Italy
Trofeo de Campeones-Argentina
Liga Profesional-Argentina
CSL-China
Play-offs 1/2-China
Division Profesional-Paraguay
Play-Offs 1/2-Paraguay
Jupiler Pro League-Belgium
Play-offs 1/2-Belgium
La Liga-Spain
La Liga 2-Spain
Libertadores-South America
Libertadores Qualifiers: Mineiro-South America
1. Bundesliga-Germany
Bundesliga 1/2 Play-offs-Germany
Championship-England
Premier League-England
CBF Brasileiro U20: Atlético Mineiro-Brazil
Mineiro U20: Atlético Mineiro-Brazil
Italy Serie B-Italy
J2 League-Japan
K League 1-Korea (South)
Especificar os objetos
Após inserir as credenciais você estará apto a selecionar quais tabelas da fonte conectada serão importados na coleta de dados.
Ao selecionar mais de uma entidade, para cada tabela ou view importada será criado um dataset diferente no catálogo.
Frequência
- Por último, configure a frequência desejada para que sua pipeline rode. É possível escolher dentre as opções apresentadas ou inserir uma frequência customizada através de uma expressão cron. Para saber mais, acesse.
O fuso horário padrão utilizado na frequência é o UTC.
Todos os métodos de frequência definem quando as extrações serão iniciadas. Eles não controlam por quanto tempo o trabalho de replicação será executado ou quando os dados estarão efetivamente no destino.
Pronto! Agora basta aguardar a coleta ser feita no horário e dia agendado.
Caso queira executar a pipeline imediatamente, é possível executá-la manualmente em até 30 segundos após a criação da pipeline. Vá em "Pipelines", "Lista" e "Sincronizar Pipeline".
Após alguns minutos, sua pipeline estará catalogada na aba de exploração como um Data Asset.
É possível também consultar na lista de pipelines os detalhes da pipeline, como: resumo, lista de entidades e colunas coletadas, histórico de execução e de micro-transformação, em "Ver pipeline".
Adição de novas competições ao conector
Para adicionar novas competições ao conector, siga os passos abaixo:
- Verifique a disponibilidade dos dados das novas competições na API.
- Acesso às Competições: Certifique-se de que você tem acesso às competições desejadas, o que pode ser feito por meio do console/admin do StatsBomb StatsBomb Data .
- Contate o Suporte ao cliente Dadosfera para adicionar novas competições ou esclarecer dúvidas sobre as atualizações dos conectores.
Assim, garantimos que as novas competições sejam integradas corretamente e qualquer dúvida seja prontamente resolvida.
Updated 4 months ago