Versão 0.1.0 (Beta) | Dezembro de 2021

Estamos muito animados em lançar a primeira versão da Dadosfera! 🤩🥳 Acompanhe abaixo as principais funcionalidades lançadas na nossa versão beta da Plataforma de Dados Dadosfera. 🚀

✨ Novas funcionalidades

- Módulo de Coleta

Fonte AWS S3

Colete os arquivos do tipo: CSV, JSON e Parquet que estão armazenados no seu bucket no AWS S3, serviço de armazenamento de objetos oferecido pela Amazon Web Services.

Fonte MySQL

O MySQL é um sistema de gerenciamento de banco de dados fornecido atualmente pela Oracle Corporation. A Dadosfera replica dados do seu banco de origem MySQL e carrega na Dadosfera, para Exploração e Análise. Nessa versão do conector foram entregues as seguintes funcionalidades: Teste de conexão, Especificação de entidades, Sincronização Full-load, Micro-transformação (criptografar) e Agendamento.

Fonte PostgreSQL

O PostgreSQL é um sistema gerenciador de banco de dados objeto relacional, desenvolvido como projeto de código aberto. A Dadosfera replica dados do seu banco de origem PostgreSQL e carrega na Dadosfera, para Exploração e Análise. Nessa versão do conector foram entregues as seguintes funcionalidades: Teste de conexão, Especificação de entidades, Sincronização Full-load, Micro-transformação (criptografar) e Agendamento.

Fonte SQLServer

O Microsoft SQL Server é um sistema gerenciador de Banco de dados relacional desenvolvido pela Sybase em parceria com a Microsoft. A Dadosfera replica dados do seu banco de origem SQL Server e carrega na Dadosfera, para Exploração e Análise. Nessa versão do conector foram entregues as seguintes funcionalidades: Teste de conexão, Especificação de entidades, Sincronização Full-load, Micro-transformação (criptografar) e Agendamento.

Fonte Oracle DB

O Banco de dados Oracle (Oracle DB) é um sistema de gerenciamento de banco de dados relacional fornecido pela Oracle Corporation. A Dadosfera replica dados do seu banco de origem Oracle e carrega na Dadosfera, para Exploração e Análise. Nessa versão do conector foram entregues as seguintes funcionalidades: Teste de conexão, Especificação de entidades, Sincronização Full-load, Micro-transformação (criptografar) e Agendamento.

Lista de Pipelines

Lista das Pipelines já criadas, em uma visão de cards, no qual é possível:

  • Pesquisar e filtrar pipelines
  • Ver detalhes da pipeline
  • Executar pipeline manualmente
  • Excluir pipeline
  • Verificar o histórico das execuções

.

- Módulo de Exploração

Catálogação de Data Assets: Datasets

Após a criação de uma pipeline ou de uma view, seu dataset será catalogado e poderá receber atributos, como:

  • Comentários
  • Tags
  • Documentação
  • Prévia dos dados

Além disso, é possível visualizar os seguintes metadados, calculados automaticamente:

  • Número de linhas analisadas
  • Número de colunas analisadas
  • Metadados das colunas:
    • Nulos
    • Distintos
    • Maior Valor
    • Menor Valor
    • Média
    • Mediana
    • Desvio padrão
Catálogação de Data Assets: Dashboards

Os dashboads criados no módulo de análise, são automaticamente embedados e catalogados, para fácil acesso e compartilhamento dentro do seu time.

Consolidação

Consolide os seus dados utilizando o Snowflake, e crie views, que serão automaticamente catalogadas para consulta posterior e por outros usuários, que terão também aos metadados, prévia, tags, comentários e documentação.

- Módulo de Análise

Visualização
  • Construção de dashboards de Business Intelligence.
  • Integração com Banco de Dados do Snowflake.
  • Integração com dados em nuvem.
  • Análise Exploratória de Dados.
  • Catalogação automática do Dashboard.
Inteligência (versão alpha)
  • Análise Exploratória de Dados.
  • Estruturação e orquestração de pipelines de dados.
  • Jobs (trabalho agendado/scheduled).
  • Modelos de AI.
  • Dataviz.
  • Jupyter Notebook.
  • Configuração de ambientes (environments).
  • Comparação de resultados e estimativas de modelos de ML.

Obrigado por fazer parte da comunidade Dadosfera, pessoal.