Infraestrutura da Dadosfera

Aqui estão descritos as combinações de Infraestrutura e Add-ons da Dadosfera. Para saber preços e condições, entre em contato

Módulos

MóduloDescriçãoBasic Pro.StandardAdvancedEnterprise*
ColetaColeta de Dados usando conectores prontos para uso.Compartilhado (Small)Compartilhado (Medium)Compartilhado (Medium)Dedicado (Large +)
ProcessamentoCrie fluxos de Transformação de Dados, em Python, R ou Julia dentro da Dadosfera.Não DisponívelOpcional (Medium)Dedicado (Large)Dedicado (Large +)
ConsultaMódulo de Consulta (Query) e materialização e criação de visões (views) de dados usando SQL. Também usado para Transformação Massiva de dados.Compartilhado (Small)Compartilhado (Small)Dedicado (Small)Dedicado com Auto-Scalling **(Small +)
VisualizaçãoConstrução de Análises Descritivas como Relatórios, Dashboards e Gráficos.Dedicado (Small)Dedicado (Medium)Dedicado (Large)Dedicado (Large +)
InteligênciaCriação de notebooks e modelos de ML/AI e disponibilização de Data Apps em R Shiny ou StreamlitNão DisponívelOpcional (Medium)Dedicado (Large)Dedicado (Large +)

[*] O plano Enterprise oferece flexibilidade para escalar verticalmente (em número de nós) e horizontalmente (em tamanho dos nós) todos os recursos acima. Para propostas customizadas, entre em contato com nosso time Comercial.

[**] No plano Enterprise, há a possibilidade de configurar Auto-Scalling automatizado. Dessa forma, o cliente pode ter acesso a um cluster com vários nós, que escalam conforme a necessidade de processamento. Mais infos aqui

🚧

Importante

A Dadosfera garante o isolamento de todos os dados dos clientes, independentemente do uso de recursos de nuvem compartilhados ou não.

👍
  • Definição de Clusters

  • Cluster Dedicado: Os recursos são exclusivos por cliente.
  • Cluster Compartilhado: Os recursos são compartilhados com outros clientes.

Especificação de Infraestrutura por Módulo

Abaixo, especificamos a quantidade de recursos em CPU e RAM disponível para cada módulo, seja em cluster ou não.

MóduloSmallMediumLarge
Coleta2 vCPU/4.00 GB2 vCPU/8.00 GB4 vCPU/16.00 GB
Processamento-4 vCPU/16.00 GB8 vCPU/32.00 GB
Consulta*8 vCPU/16.00 GB16 vCPU/32.00 GB32 vCPU/64.00 GB
Catálogo2x (2 vCPU/1.00 GB)2x (2 vCPU/2.00 GB)2x2 vCPU/4.00 GB
Visualização2x (2 vCPU/2.00 GB)2x (2 vCPU/4.00 GB)2x2 vCPU/8.00 GB
Inteligência-4 vCPU/16.00 GB8 vCPU/32.00 GB

[*] Por padrão a Dadosfera disponibiliza somente 1 nó para o módulo de Consulta. Para Autoscalling ou Cluster Multi-Nós, entre em contato.

🚧

Disponibilidade de serviços

Para consultar a Disponibilidade do serviço de DW utilizado, consulte a documentação referida abaixo

📘

Módulo de Transformação Massiva

O módulo de Transformação Massiva permite o uso do poder computacional do módulo de Consulta (MPP/DW) para fazer transformações de grandes volumes de dados, em segundos, usando Python e/ou R.

Implementação Enterprise

Para a criação do ambiente 100% dedicado da Dadosfera, é necessária uma fase de Implementação, executada pelo time de Serviços Profissionais da Dadosfera. Esta implementação dura entre 30 e 90 dias, dependendo da complexidade do projeto, consistindo no seguinte escopo:

  • Criação da Conta de Nuvem exclusiva para o cliente
  • Checklist de Governança de nova conta
  • Configuração de Identidade e Acesso
  • Provisionamento da Infraestrutura (via IaC)
  • Implantação do Software da Dadosfera nos módulos
  • Configuração do MPP
  • Configuração dos Módulos
  • Implementação Padrão (Setup Standard)

Funcionalidades e Componentes Adicionais

Abaixo são definidos os componentes adicionais de infraestrutura ou funcionalidades que possibilitam diferentes formas de integrações seguras entre Dadosfera e o ambiente de seus clientes.

Definição:

Funcionalidade/RecursoDescriçãoMódulo
VPNUma Rede Privada Virtual permite o acesso seguro a uma rede privada a partir de uma rede pública ou não segura, garantindo que os dados enviados e recebidos pela Dadosfera sejam criptografados e seguros.Conexões
VPC Peering (AWS)VPC Peering é uma conexão de rede entre dois VPCs que permite o roteamento de tráfego entre eles usando endereços privados IPv4 ou IPv6. Essa conexão é mais performática e garante custo zero para redes na mesma região.Conexões
IP FixoUm IP fixo é um endereço de internet permanente que permanece o mesmo ao longo do tempo, ao contrário dos IPs dinâmicos que mudam. A Dadosfera disponibiliza estes IPs para liberações de Firewall, garantindo uma abertura segura das fontes de dados dos clientes.Conexões
SSH TunnelingO SSH Tunneling, ou encaminhamento de porta SSH, é um método de transporte de dados de rede arbitrários sobre uma conexão SSH criptografada. Ele pode fornecer um caminho seguro para a transmissão de dados.Conexões
Row Level Security (RLS)O RLS é um recurso em bancos de dados que restringe o acesso às linhas de dados com base em funções ou permissões do usuário. Alguns usuários têm visibilidade restrita de dados com base nessas funções.Visualização
Cluster Spark DedicadoA Dadosfera pode provisionar um cluster Dedicado de Spark para portar códigos de transformação de dados do cliente utilizando essa tecnologia.Transformação
Cluster Snowpark OtimizadoUm Cluster Snowpark Otimizado refere-se a um cluster especialmente configurado para o Snowpark, um serviço no Snowflake Data Cloud que permite aos usuários processar grandes volumes de dados facilmente, utilizando Python, R ou Scala.Transformação
Backup / Disaster Recovery ExtendidoRefere-se a estratégias e procedimentos colocados em prática para recuperar e proteger a infraestrutura de TI de uma empresa em caso de desastre. Incluso para até 90 dias no Tier Enterprise.Consulta
Multi-cluster warehouseEm plataformas de dados na nuvem como o Snowflake, um armazém de multi-cluster permite o processamento simultâneo e o aumento de desempenho ao utilizar vários clusters de computação.Consulta
Até 90 dias de Time-TravelEm sistemas de dados como o Snowflake, Time-Travel refere-se à capacidade de acessar dados históricos dentro de um determinado período, neste caso, até 90 dias.Consulta
Rotacionamento Anual da chave de dados criptografadosUm rekey anual refere-se à prática de mudar as chaves de criptografia em uma base anual. É uma prática recomendada de segurança para proteger dados sensíveis.Consulta
Materialized ViewsEm bancos de dados, uma View Materializada é um objeto de banco de dados que contém os resultados de uma consulta e pode ser atualizada à medida que os dados mudam. Eles são frequentemente usados para melhorar o desempenho das consultas.Consulta
Otimização de BuscaCaracterística que possibilita o uso performático do MPP como um banco full-text search.Consulta
Dynamic Data Masking (Mascaramento de Dados Dinâmico)É um recurso de Segurança em Nível de Coluna (CLS) que utiliza políticas de máscara para mascarar seletivamente dados em texto simples em colunas de tabelas e visualizações durante a execução de consultas.Consulta
External Data TokenizationPermite que contas realizem a tokenização de dados antes de carregá-los no Snowflake e descriptografem os dados durante a execução das consultas. A tokenização é o processo de remoção de dados sensíveis, substituindo-os por um token indecifrável. A Tokenização Externa utiliza políticas de máscara com funções externas.Consulta
GPUPossibilidade de uso de GPU na infra-estrutura para Treinamento e Inferência de modelos de ML/AIInteligência

Disponibilidade

Funcionalidade/RecursoMóduloBasic Pro.StandardAdvancedEnterprise
VPNConexõesOpcionalInclusoInclusoIncluso
VPC PeeringConexõesNão DisponívelOpcionalInclusoIncluso
IP FixoConexõesOpcionalInclusoInclusoIncluso
Row Level Security (RLS)VisualizaçãoNão DisponívelOpcionalInclusoIncluso
SSH TunnelingConexõesOpcionalOpcionalInclusoIncluso
Backup / Disaster Recovery**ConsultaNão DisponívelOpcionalInclusoIncluso
Cluster Spark DedicadoTransformaçãoNão DisponívelOpcionalOpcionalIncluso
Cluster Snowpark Otimizado*TransformaçãoNão DisponívelNão DisponívelOpcionalOpcional
Multi-cluster warehouseConsultaNão DisponívelNão DisponívelOpcionalIncluso
Até 90 dias de Time-TravelConsultaNão DisponívelNão DisponívelOpcionalIncluso
Rotacionamento Anual da chave de dados criptografadosConsultaNão DisponívelNão DisponívelOpcionalIncluso
Materialized ViewsConsultaNão DisponívelNão DisponívelOpcionalIncluso
Search Optimization (Otimização de Busca)ConsultaNão DisponívelNão DisponívelOpcionalIncluso
Dynamic Data Masking (Mascaramento de Dados Dinâmico)ConsultaNão DisponívelNão DisponívelOpcionalIncluso
External Data TokenizationConsultaNão DisponívelNão DisponívelOpcionalIncluso
GPUInteligênciaNão DisponívelNão DisponívelOpcionalOpcional

[*] Só disponível para Cluster com nós maiores que Medium.

[**] Fail-Safe de até 7 dias - disponibilidade imediata. Glacier histórico - via chamado, disponibilidade em até 7 dias

Cloud e Regiões de Disponibilidade

  • A Dadosfera SaaS (Tiers Basic Professional, Standard e Advanced) está disponível na AWS - Amazon Web Services, região US - North Virginia us-east-1

Para Tier Enterprise, temos a seguinte disponibilidade:

Provedor de NuvemMódulos disponíveisRegião
Amazon Web Services (AWS)Todosus-east-1
Google Cloud Platform (GCP)Inteligência, Transformação, Consulta (DW)us-east-1
Azure Cloud Platform (Azure)Consulta (DW/Transformação Massiva)us-east-1

Para disponibilidade em outras regiões e provedores de nuvens, entre em contato.