Google Analytics

Ferramenta de monitoramento e análise de sites oferecida pela Alphabet Inc. A Dadosfera replica dados estatísticos de tráfego software e carrega na Dadosfera.

Funcionalidades

FuncionalidadeSuportadoNotas
Definir frequência da pipelineSimPara mais detalhes, acesse.
Sincronização Full loadSim
Sincronização IncrementalNão
Conexão via Service AccountSimPasso a passo para gerar o arquivo com os segredos da sua conta aqui.

Guia rápido

Para iniciar a criação de uma Pipeline, basta ir no módulo Coletar, "Pipelines" aperte em "Nova Pipeline".

Escolha a fonte de dados

Utilize uma fonte já cadastrada ou cadastre uma nova

Parâmetros para conexão (cadastro da fonte)

Requisitos

Crie uma Conte de Serviço no Google Cloud.

A conta deve ser criada neste endereço.

Crie uma chave.

Vá na aba chaves, selecione JSON como Tipo de chave e guarde o arquivo gerado. Ele só poderá ser baixado nesta ocasião.

Associar as credenciais ao Google Analytics.

Para conceder a esta conta de serviço acesso aos seus dados do Google Analytics, adicione o endereço de e-mail como um novo usuário à sua conta do Google Analytics:

  • Vá até a página "Administrador > Gerenciamento de usuários".
  • Atribua permissões de leitor.
Ativar as APIs.

Visite o painel da API de relatórios do Google Analytics e verifique se o projeto que você usou na etapa anterior está selecionado. Agora ative a API usando o botão na parte superior, para que o botão diga "Desativar API".

Em seguida, visite o painel da API do Google Analytics, verifique se o projeto que você usou na etapa anterior está selecionado e habilite essa API também.

Insira o JSON na interface da Dadosfera.
Nome do campoDescriçãoFormato
Chave secretaJSON que possui a chaves secretas da sua conta. Passo a passo para gerá-lo aqui.{
"type": "",
"project_id": "",
"private_key_id": "",
"private_key": "",
"client_email": "",
"client_id": "",
"auth_uri": "",
"token_uri": "",
"auth_provider_x509_cert_url": "",
"client_x509_cert_url": ""
}

Informações da pipeline

Atribua o nome e uma breve descrição para sua Pipeline.

Parâmetros para configurações da pipeline

Nome do campoDescriçãoExemplo
View IDPasso a passo para gerar sua view ID aqui.188274549
Data de inícioDetermina quantos dados históricos serão extraídos.dd/mm/aaaa
Data final (opcional)Determina quantos dados históricos serão extraídos.dd/mm/aaaa

Para mais informações, acesse.

Clique em "Salvar e Continuar".

Especificar entidades

Após inserir as credenciais você estará apto a visualizar e selecionar quais entidades da fonte conectada serão importados na coleta de dados e as colunas que serão importadas.

Além disso, pode definir o modo de sincronização por entidade. Para saber mais, acesse.

📘

Ao selecionar mais de uma entidade, para cada tabela ou view importada será criado um dataset diferente no catálogo.

Frequência

  • Por último, configure a frequência desejada para que sua pipeline rode. É possível escolher dentre as opções apresentadas ou inserir uma frequência customizada através de uma expressão cron. Para saber mais, acesse.

📘

  • O fuso horário padrão utilizado na frequência é o UTC.

  • Todos os métodos de frequência definem quando as extrações serão iniciadas. Eles não controlam por quanto tempo o trabalho de replicação será executado ou quando os dados estarão efetivamente no destino.

Pronto! Agora basta aguardar a coleta ser feita no horário e dia agendado.

Caso queira executar a pipeline imediatamente, é possível executá-la manualmente em até 30 segundos após a criação da pipeline. Vá em "Pipelines", "Lista" e "Sincronizar Pipeline".

Após alguns minutos, sua pipeline estará catalogada na aba de exploração como um Data Asset.

É possível também consultar na lista de pipelines os detalhes da pipeline, como: resumo, lista de entidades e colunas coletadas, histórico de execução e de micro-transformação, em "Ver pipeline".