MongoDB

MongoDB é um software de banco de dados orientado a documentos livre, de código aberto e multiplataforma, escrito na linguagem C++ fornecido pela MongoDB Inc. A Dadosfera replica dados do seu banco de origem Mongo e carrega no destino.

Funcionalidades

FuncionalidadeSuportadoNotas
Definir frequência da pipelineSimPara mais detalhes, acesse.
Sincronização Full loadSim
Sincronização Incremental - AppendNão
Definição das tabelas coletadasSim
Conexão via VPNSimÉ possível conectar apenas utilizando uma VPN.

Guia rápido

Para iniciar a criação de uma Pipeline, basta ir no módulo Coletar, "Pipelines" aperte em "Nova Pipeline".

Escolha a fonte de dados

Utilize uma fonte já cadastrada ou cadastre uma nova

Parâmetros para conexão (cadastro da fonte)

Nome do campoDescriçãoExemplo
EndpointEndereço público de conexão do seu banco de dados. Nos formatos válidos de IPv4 ou DNS32.142.63.4
Número da portaPorta do banco27017
Tipo de conexãoÉ possível apenas realizar conexão utilizando VPN, para acessar bancos privados
UsuárioUsuário do bancoadmin
SenhaSenha do banco do usuário
Banco de dados de autenticaçãoBanco de dados onde o usuário está definidomy-db

Informações da pipeline

Atribua o nome e uma breve descrição para sua Pipeline.

Parâmetros para configurações da pipeline

Nome do campoDescriçãoExemplo
DatabaseBanco de dados onde os bancos serão sincronizadosmy-db
Habilitar SSL (opcional)Habilite o SSL para realizar a coleta encriptografada

Especificar tabelas

Digite o nome das tabelas do banco que devem ser coletadas.

📘

Para cada tabela importada será criado um dataset diferente no catálogo.

Agendamento

  • Por último, configure a frequência desejada para que sua pipeline rode. É possível escolher dentre as opções apresentadas ou inserir uma frequência customizada através de uma expressão cron. Para saber mais, acesse.

📘

  • O fuso horário padrão utilizado na frequência é o UTC.

  • Todos os métodos de frequência definem quando as extrações serão iniciadas. Eles não controlam por quanto tempo o trabalho de replicação será executado ou quando os dados estarão efetivamente no destino.

Pronto! Agora basta aguardar a coleta ser feita no horário e dia agendado.

Caso queira executar a pipeline imediatamente, é possível executá-la manualmente em até 30 segundos após a criação da pipeline. Vá em "Pipelines", "Lista" e "Sincronizar Pipeline".

Após alguns minutos, sua pipeline estará catalogada na aba de exploração como um Data Asset.

É possível também consultar na lista de pipelines os detalhes da pipeline, como: resumo, lista de entidades e colunas coletadas, histórico de execução e de micro-transformação, em "Ver pipeline".