PostgreSQL

PostgreSQL Criar Histograma Usando Dados

PostgreSQL Criar Histograma Usando Dados

Ao longo do processamento e análise de dados, os histogramas ajudam você a representar a distribuição de frequência e obter insights facilmente. Veremos alguns métodos para obter distribuição de frequência no PostgreSQL. Para construir um histograma no PostgreSQL, você pode usar uma variedade de comandos do histograma do PostgreSQL. Vamos explicar cada um separadamente.

Inicialmente, certifique-se de ter o shell de linha de comando PostgreSQL e o pgAdmin4 instalados em seu sistema de computador. Agora, abra o shell da linha de comando do PostgreSQL para começar a trabalhar nos histogramas. Irá imediatamente pedir-lhe para introduzir o nome do servidor com o qual deseja trabalhar. Por padrão, o servidor 'localhost' foi selecionado. Se você não inserir um ao pular para a próxima opção, ele continuará com o padrão. Depois disso, ele solicitará que você insira o nome do banco de dados, número da porta e nome de usuário para trabalhar. Se você não fornecer um, ele continuará com o padrão. Como você pode ver na imagem anexada abaixo, estaremos trabalhando no banco de dados de 'teste'. Por fim, digite sua senha para o usuário em particular e prepare-se.

Exemplo 01:

Devemos ter algumas tabelas e dados em nosso banco de dados para trabalhar. Portanto, estamos criando uma tabela 'produto' no banco de dados 'teste' para salvar os registros de vendas de diferentes produtos. Esta tabela ocupa duas colunas. Um é 'data_de_pedido' para salvar a data em que o pedido foi feito, e o outro é 'p_sold' para salvar o número total de vendas em uma data específica. Tente a consulta abaixo em seu shell de comando para criar esta tabela.

>> CREATE TABLE product (order_date DATE, p_sold INT);

No momento, a tabela está vazia, então temos que adicionar alguns registros a ela. Então, tente o comando INSERT abaixo no shell para fazer isso.

>> INSERIR NOS VALORES DO produto ('2021-03-01', 1250), ('2021-04-02', 555), ('2021-06-03', 500), ('2021-05-04' , 1000), ('2021-10-05', 890), ('2021-12-10', 1000), ('2021-01-06', 345), ('2021-11-07', 467 ), ('2021-02-08', 1250), ('2021-07-09', 789);

Agora você pode verificar se a tabela contém dados usando o comando SELECT conforme citado abaixo.

>> SELECIONE * DO produto;

Uso de piso e caixa:

Se você quiser que os bins do Histograma do PostgreSQL forneçam períodos semelhantes (10-20, 20-30, 30-40, etc.), execute o comando SQL abaixo. Estimamos o número da caixa a partir da declaração abaixo, dividindo o valor de venda por um tamanho de caixa do histograma, 10.

Esta abordagem tem a vantagem de alterar dinamicamente os bins conforme os dados são adicionados, excluídos ou modificados. Ele também adiciona bins adicionais para novos dados e / ou exclui bins se sua contagem chegar a zero. Como resultado, você pode gerar histogramas de forma eficiente no PostgreSQL.

Piso de troca (p_sold / 10) * 10 com piso (p_sold / 100) * 100 para aumentar o tamanho do compartimento em até 100.

Usando a cláusula WHERE:

Você construirá uma distribuição de frequência utilizando a declaração CASE enquanto entende os bins do histograma a serem gerados ou como os tamanhos dos contêineres do histograma variam. Para PostgreSQL, abaixo está outra declaração de histograma:

>> SELECIONE '100-300' COMO preço_bentre, CONTAGEM (p_sold) COMO CONTAGEM DO produto ONDE p_sold ENTRE 100 E 300 UNIÃO (SELECIONE '300-600' COMO preço_bentre, CONTAGEM (p_sold) COMO CONTAGEM DO produto ONDE p_sold ENTRE 300 E 600 ) UNIÃO (SELECIONE '600-900' COMO preço_entre, CONTAGEM (p_sold) COMO CONTAGEM DO produto ONDE p_sold ENTRE 600 E 900) UNIÃO (SELECIONE '900-1300' como preço_entre, CONTAGEM (p_sold) COMO CONTAGEM DO produto ONDE p_sold ENTRE 900 AND 1300);

E a saída mostra a distribuição de frequência do histograma para os valores do intervalo total da coluna 'p_sold' e o número de contagem. Os preços variam de 300-600 e 900-1300 tem uma contagem total de 4 separadamente. A faixa de venda de 600-900 teve 2 contagens, enquanto a faixa 100-300 teve 0 contagens de vendas.

Exemplo 02:

Vamos considerar outro exemplo para ilustrar histogramas em PostgreSQL. Criamos uma tabela 'aluno' usando o comando citado abaixo no shell. Esta tabela irá armazenar as informações sobre os alunos e a contagem de números de reprovação que eles têm.

>> CRIAR TABELA aluno (std_id INT, fail_count INT);

A tabela deve conter alguns dados. Portanto, executamos o comando INSERT INTO para adicionar dados na tabela 'aluno' como:

>> INSERIR NOS VALORES DOS ALUNOS (111, 30), (112, 60), (113, 90), (114, 3), (115, 120), (116, 150), (117, 180), (118 , 210), (119, 5), (120, 300), (121, 380), (122, 470), (123, 530), (124, 9), (125, 550), (126, 50 ), (127, 40), (128, 8);

Agora, a tabela foi preenchida com uma enorme quantidade de dados de acordo com a saída exibida. Tem valores aleatórios para std_id e fail_count de alunos.

>> SELECIONE * DO aluno;

Ao tentar executar uma consulta simples para coletar a contagem total de falhas de um aluno, você terá o resultado abaixo indicado. A saída mostra apenas o número separado de contagens de reprovação de cada aluno uma vez a partir do método de 'contagem' usado na coluna 'std_id'. Isso não parece muito satisfatório.

>> SELECT fail_count, COUNT (std_id) FROM aluno GROUP BY 1 ORDER BY 1;

Estaremos usando o método de piso novamente neste caso para períodos ou intervalos semelhantes. Portanto, execute a consulta abaixo indicada no shell de comando. A consulta divide os alunos 'fail_count' por 100.00 e, em seguida, aplica a função de piso para criar uma caixa de tamanho 100. Em seguida, ele soma o número total de alunos que residem neste intervalo específico.

Conclusão:

Podemos gerar um histograma com PostgreSQL usando qualquer uma das técnicas mencionadas anteriormente, dependendo dos requisitos. Você pode alterar os intervalos do histograma para cada intervalo que desejar; intervalos uniformes não são necessários. Ao longo deste tutorial, tentamos explicar os melhores exemplos para esclarecer seu conceito sobre a criação de histogramas no PostgreSQL. Espero que, seguindo qualquer um desses exemplos, você possa criar convenientemente um histograma para seus dados no PostgreSQL.

Ferramentas úteis para jogadores de Linux
Se você gosta de jogar no Linux, é provável que tenha usado aplicativos e utilitários como Wine, Lutris e OBS Studio para melhorar a experiência de jo...
Jogos HD Remasterizados para Linux que nunca tiveram uma versão Linux anterior
Muitos desenvolvedores e editores de jogos estão apresentando remasterização em HD de jogos antigos para estender a vida da franquia, por favor, os fã...
Como usar o AutoKey para automatizar jogos Linux
AutoKey é um utilitário de automação de desktop para Linux e X11, programado em Python 3, GTK e Qt. Usando sua funcionalidade de script e MACRO, você ...