StatsBomb
Empresa fornecedora de dados para análises de futebol
Funcionalidades
Funcionalidade | Suportado | Notas |
---|---|---|
Definir frequência da pipeline | Sim | Para mais detalhes, acesse. |
Sincronização Full load | Sim | |
Conexão via Credenciais | Sim |
Este conector coleta as seguintes objetos do StatsBombs:
- Player Season;
- Competitions.
Guia rápido
Para iniciar a criação de uma Pipeline, basta ir no módulo Coletar, "Pipelines" aperte em "Nova Pipeline".
Escolha a fonte de dados
Utilize uma fonte já cadastrada ou cadastre uma nova
Parâmetros para conexão (cadastro da fonte)
Nome do campo | Exemplo |
---|---|
Nome | username |
Senha | password |
Informações da pipeline
Atribua o nome e uma breve descrição para sua Pipeline.
Selecione as competições
Ao coletar dados do StatsBomb, trabalhar com um subconjunto de competições tem muitas vantagens. O StatsBomb possui uma grande quantidade de dados, com um número incrivelmente grande de eventos registrados em muitas competições diferentes. Essa quantidade massiva de informação pode tornar o processo de coleta e análise de dados bastante desafiador e demorado.
Ao nos concentrarmos em um subconjunto específico de competições, podemos simplificar esse processo e torná-lo mais gerenciável. Em vez de lidar com a enorme quantidade de eventos de todas as competições, podemos filtrar e trabalhar apenas com os dados que são mais relevantes para nossas necessidades específicas. Isso pode melhorar a eficiência, reduzir o tempo de processamento e tornar a análise dos dados uma tarefa mais fácil.
Além disso, isso permite um foco mais claro em competições específicas, permitindo uma análise mais profunda e detalhada. Portanto, ao lidar com a coleta de dados do StatsBomb, trabalhar com um subconjunto de competições pode ser uma abordagem muito eficaz e eficiente.
Competições Disponíveis
As seguintes competições estão disponíveis e os nomes devem ser adicionados manualmente. É necessário que os nomes sejam exatamente iguais aos que estão na documentação.
- Bundesliga-Germany
- Arabian Gulf League-United Arab Emirates
- Bundesliga 1/2 Play-offs-Germany
- Championship-England
- Copa do Brasil-Brazil
- CSL-China
- Division Profesional-Paraguay
- Jupiler Pro League-Belgium
- La Liga-Spain
- La Liga 2-Spain
- Libertadores-South America
- Liga MX-Mexico
- Ligue 1-France
- MLS Next Pro-United States of America
- Play-offs 1/2-Japan
- Play-offs 1/2-Portugal
- Play-offs 1/2-France
- Play-offs 1/2-Belgium
- Play-Offs 1/2-Paraguay
- Play-offs 2/3-Portugal
- Primera División-Chile
- Segunda Liga-Portugal
- Serie A-Italy
- Série A-Brazil
- Serie B-Brazil
- Trofeo de Campeones-Argentina
- Liga NOS-Portugal
- Liga Profesional-Argentina
- Play-offs 1/2-China
- Play-Offs 1/2-Chile
- Primera División-Uruguay
- Primera División-Peru
- Super League Relegation Play-offs 1/2-Switzerland
- Super League-Greece
- Eredivisie-Netherlands
- J1 League-Japan
- Libertadores Qualifiers: Mineiro-South America
- Liga Pro-Ecuador
- Major League Soccer-United States of America
- Play-offs 1/2-Peru
- Play-offs 1/2-Netherlands
- Premier League-Ukraine
- Pro League-Saudi Arabia
- Super League-Switzerland
- Super League Relegation Play-offs 1/2-Greece
- Süper Lig-Turkey
- Play-offs 1/2-Russia
- Play-Offs 1/2-Qatar
- Premier League-Russia
- Primera A-Colombia
- State Championship-Brazil
- Stars League-Qatar
- Super Cup-Brazil
- Premier League-England
- Superliga-Denmark
Selecione as competições a serem coletadas
Ao coletar dados do StatsBomb, trabalhar com um subconjunto de competições tem muitas vantagens. O StatsBomb possui uma grande quantidade de dados, com um número incrivelmente grande de eventos registrados em muitas competições diferentes. Essa quantidade massiva de informação pode tornar o processo de coleta e análise de dados bastante desafiador e demorado.
Ao nos concentrarmos em um subconjunto específico de competições, podemos simplificar esse processo e torná-lo mais gerenciável. Em vez de lidar com a enorme quantidade de eventos de todas as competições, podemos filtrar e trabalhar apenas com os dados que são mais relevantes para nossas necessidades específicas. Isso pode melhorar a eficiência, reduzir o tempo de processamento e tornar a análise dos dados uma tarefa mais fácil.
Além disso, isso permite um foco mais claro em competições específicas, permitindo uma análise mais profunda e detalhada. Portanto, ao lidar com a coleta de dados do StatsBomb, trabalhar com um subconjunto de competições pode ser uma abordagem muito eficaz e eficiente.
Competições Disponíveis
As seguintes competições estão disponíveis e os nomes devem ser adicionados manualmente. É necessário que os nomes sejam exatamente iguais aos que estão na documentação.
1. Bundesliga-Germany
Arabian Gulf League-United Arab Emirates
Bundesliga 1/2 Play-offs-Germany
Championship-England
Copa do Brasil-Brazil
CSL-China
Division Profesional-Paraguay
Jupiler Pro League-Belgium
La Liga-Spain
La Liga 2-Spain
Libertadores-South America
Liga MX-Mexico
Ligue 1-France
MLS Next Pro-United States of America
Play-offs 1/2-Japan
Play-offs 1/2-Portugal
Play-offs 1/2-France
Play-offs 1/2-Belgium
Play-Offs 1/2-Paraguay
Play-offs 2/3-Portugal
Primera División-Chile
Segunda Liga-Portugal
Serie A-Italy
Série A-Brazil
Serie B-Brazil
Trofeo de Campeones-Argentina
Liga NOS-Portugal
Liga Profesional-Argentina
Play-offs 1/2-China
Play-Offs 1/2-Chile
Primera División-Uruguay
Primera División-Peru
Super League Relegation Play-offs 1/2-Switzerland
Super League-Greece
Eredivisie-Netherlands
J1 League-Japan
Libertadores Qualifiers: Mineiro-South America
Liga Pro-Ecuador
Major League Soccer-United States of America
Play-offs 1/2-Peru
Play-offs 1/2-Netherlands
Premier League-Ukraine
Pro League-Saudi Arabia
Super League-Switzerland
Super League Relegation Play-offs 1/2-Greece
Süper Lig-Turkey
Play-offs 1/2-Russia
Play-Offs 1/2-Qatar
Premier League-Russia
Primera A-Colombia
State Championship-Brazil
Stars League-Qatar
Super Cup-Brazil
Premier League-England
Superliga-Denmark
Especificar os objetos
Após inserir as credenciais você estará apto a selecionar quais tabelas da fonte conectada serão importados na coleta de dados.
Ao selecionar mais de uma entidade, para cada tabela ou view importada será criado um dataset diferente no catálogo.
Frequência
- Por último, configure a frequência desejada para que sua pipeline rode. É possível escolher dentre as opções apresentadas ou inserir uma frequência customizada através de uma expressão cron. Para saber mais, acesse.
O fuso horário padrão utilizado na frequência é o UTC.
Todos os métodos de frequência definem quando as extrações serão iniciadas. Eles não controlam por quanto tempo o trabalho de replicação será executado ou quando os dados estarão efetivamente no destino.
Pronto! Agora basta aguardar a coleta ser feita no horário e dia agendado.
Caso queira executar a pipeline imediatamente, é possível executá-la manualmente em até 30 segundos após a criação da pipeline. Vá em "Pipelines", "Lista" e "Sincronizar Pipeline".
Após alguns minutos, sua pipeline estará catalogada na aba de exploração como um Data Asset.
É possível também consultar na lista de pipelines os detalhes da pipeline, como: resumo, lista de entidades e colunas coletadas, histórico de execução e de micro-transformação, em "Ver pipeline".
Updated 5 months ago