Agendamento
Sobre
Configure a frequência desejada para que sua pipeline rode. É possível escolher dentre as opções apresentadas ou inserir uma frequência customizada através de uma expressão cron.
É possível aprofundar-se nas possibilidades e limitações do agendamento através da documentação oficial do Airflow.
- O fuso horário padrão utilizado na frequência é o UTC.* Todos os métodos de frequência definem quando as extrações serão iniciadas. Eles não controlam por quanto tempo o trabalho de replicação será executado ou quando os dados estarão efetivamente no destino.
Como configurar o agendamento
Na última etapa da criação da pipeline, possível escolher dentre as opções intuitivas disponíveis ou utilizar a opção 'Customizado', na qual é inserido uma expressão cron manualmente.
Única extração
Opte por realizar uma única extração inicial dos dados, não configurando o agendamento. A carga fria é realizada para coletar os dados estáticos, ao não definir o agendamento. Após a criação, a coleta será realizada uma única vez. No entanto, é possível ainda o sync manual para rodar a coleta novamente.
Agendamento customizado
É possível especificar horários de início granulares para sua extração dos dados. Utilizando a expressão cron você pode especificar os horários, dias da semana e até os dias do mês exatos em que a extração de dados deverá começar. A Dadosfera usa o padrão Quartz para agendamento cron.
Sintaxe
Uma expressão cron é composta por seis campos que descrevem, separados por espaços. Os campos na expressão devem estar na seguinte ordem e uma expressão deve ter todos os seis campos para ser considerada válida:
[minutos] [horas] [dia do mês] [mês] [dia da semana]
Caracteres permitidos
Campo | Valores permitidos | Caracteres especiais permitidos na Dadosfera |
---|---|---|
Minutos | 0-59 | n/a |
Horas | 0-23 | - |
Dia do mês | 1-31 | , - * / |
Mês | 1-12 | , - * / |
Dia da semana | 0 - 6 | , - * / |
- Hoje a Dadosfera atualiza os dados, no mínimo, Hourly. * Caso seu pelo contratado for o Basic, o mínimo de frequência é Daily. Caso deseje realizar sua coleta em uma frequência maior, entre em contato através do time de vendas.
Caractere especial | Descrição e exemplos |
---|---|
| Seleciona todos os valores dentro de um campo.
|
, VÍRGULA | Especifica uma lista de dois ou mais valores. |
| Especifica um intervalo de valores. |
/ BARRA | Especifica incrementos. Formatado como: |
Exemplos
Executar à meia-noite UTC todos os dias
Minutos | Horas | Dia do mês | Mês | Dia da semana |
---|---|---|---|---|
0 | 0 | - | - | - |
Executar às seis horas UTC todos os dias
Minutos | Horas | Dia do mês | Mês | Dia da semana |
---|---|---|---|---|
0 | 6 | - | - | - |
Executar toda segunda-feira às seis horas UTC
Minutos | Horas | Dia do mês | Mês | Dia da semana |
---|---|---|---|---|
0 | 6 | - | - | 1 |
Executar às seis horas UTC no dia 1 de cada mês
Minutos | Horas | Dia do mês | Mês | Dia da semana |
---|---|---|---|---|
0 | 6 | 1 | - | - |
Executar às vinte e duas horas UTC, de segunda-feira a sexta-feira
Minutos | Horas | Dia do mês | Mês | Dia da semana |
---|---|---|---|---|
0 | 22 | - | - | 1-5 |
Executar meia noite e às doze horas UTC, no dia 1 do mês, a cada 2 meses
Minutos | Horas | Dia do mês | Mês | Dia da semana |
---|---|---|---|---|
0 | 0,12 | 1 | */2 | - |
Referências
-
Tradutor de Expressões Cron - Um tradutor gratuito de expressões cron.
-
Ferramenta para aprender, construir e testar Regular Expressions - Ferramenta para aprender, construir e testar Regular Expressions.
Pronto! Agora basta aguardar a coleta ser feita no horário e dia agendado.
Caso queira executar a pipeline imediatamente, é possível executá-la manualmente. Vá em "Pipelines", "Lista" e "Sincronizar Pipeline".
Após alguns minutos, seu catálogo estará atualizado na aba de exploração como um Data Asset.
Updated 18 days ago