Funções agregadoras e agrupamento de dados

Quando se trata de analise de dados, pensa-se sempre em operações como média, soma, mediana, desvio padrão, variância e correlação. Essas operações retornam, a partir de um conjunto de dados, um único valor, o que as classifica como funções agregadoras.

Como descrito acima, as funções agregadoras são funções que agregam os dados de m determinado conjunto para retornar um valor. Elas podem ser aplicadas na tabela inteira ou em pequenos grupos determinados por um outro dado. Nesse tutorial, explicaremos como se faz esse agrupamento e como aplicar as funções agregadoras nos grupos pelo Zoho Analytics.

Agrupamento de dados por consulta

Uma operação muito comum na análise de dados é o agrupamento. Esse agrupamento pode ser visto como uma maneira de responder perguntas com “para cada”, isto é, problemas em que se deseja resumir um conjunto de dados de acordo com uma caracteristica daqueles dados. Alguns exemplos de probelmas resolvidos com agrupamento:

  • Quantos os clientes consomem em média para cada loja?
  • Quantos médicos existem no total para cada estado?
  • Quantas ligações foram feitas para cada fornecedor esse mês?

Pelo Zoho Analytics, os agrupamentos são feitos de três formas: por visualização de pivô, por visualização de resumo e através de uma tabela de consulta. Para fazer o agrupamento por tabela de consulta, basta seguir os passos abaixo:

1. Da página inicial do seu espaço de trabalho, clique em “Criar” e em “Tabela de consultas”. Isso fará com com que o Zoho Analytics crie uma nova tabela de consulta e a exiba na tela. O Zoho Analytics cria uma consulta genérica como modelo, que pode ser apagada.

2. As três palavras chaves essenciais para um agrupamento de consulta são SELECT, FROM e GROUP BY. Comece a consulta colocando essas 3 expressões separadas por algumas linhas.

SELECT 

FROM 

GROUP BY

3. Logo apos o SELECT, escreva a coluna por onde será agrupado os dados. Isso pode ser feito clicando em “Inserir coluna” e clicando duas vezes rapidamente no nome da coluna.

SELECT "Produto"."Cor"

FROM 

GROUP BY

4. Ainda no SELECT, insira as funções agregadoras desejadas, seguindo a sintaxe FUNÇÃO(COLUNA). O Zoho Analytics tem uma lista das funções clicando em “Inserir funções SQL”, logo abaixo de “Aggregate Functions”. É muito importante que os objetos dentro do SELECT estejam separados por vírgula.

SELECT "Produto"."Cor",
           AVG("Produto"."Valor"),
           COUNT("Produto")
FROM  
GROUP BY 

5. Após o FROM, coloque o nome das tabelas de onde são extraídos os dados dessa consulta. Nessa parte é possível utilizar uma junção, como descrito aqui.

SELECT "Produto"."Cor",
           AVG("Produto"."Valor"),
           COUNT("Produto")
FROM  "Produto"
GROUP BY 

6. Após o GROUP BY, escreva o nome da coluna por onde será agrupado os dados.

SELECT "Produto"."Cor",
           AVG("Produto"."Valor"),
           COUNT("Produto")
FROM  "Produto"
GROUP BY "Produto"."Cor"

E assim, clicando em Executar consulta, o Zoho Analytics gera o agrupamento dos dados de acordo com a consulta. É importante clicar em “salvar” para utilizar esses dados nos relatórios. É possível renomear as colunas desse agrupamento, ao adicionar, depois do nome de cada coluna, o novo nome entre aspas.

Fórmulas agregadoras

Uma outra maneira de fazer cálculos agregadores é pelas próprias fórmula agregadoras do Zoho Analytics. Essas fórmulas geram um dado que pode ser utilizado em relatórios e outros componentes do Zoho Analytics, mas não é visível na tabela. Para criar uma formula agregadora, siga os passos abaixo:

  1. Da página da tabela em que se deseja criar uma coluna de fórmula, clique em “Adicionar” e em seguida em “Agregar fórmula”
  2. Uma página se abrirá com as possibilidades de edição da fórmula. No campo “Nome da fórmula” digite o nome de como essa nova coluna aparecerá na tabela. É possível colocar uma descrição da fórmula também, clicando em “Adicionar descrição/sinônimos”. É importante definir o tipo de dado também, logo abaixo de “Tipo de dados”
  3. Abaixo do campo Fórmula, escreva a fórmula desejada. O Zoho Analytics tem ma cola das fórmulas no campo do lado direito, bem como o nome das colunas. Mantendo o mouse em cima do “i” ao lado de uma fórmula o Zoho Analytics provem uma descrição de como funciona a fórmula, os argumentos necessários e exemplos de uso. Nessa barra a direita também tem a possibilidade de pesquisar as fórmulas ou classifica-las conforme o uso.
  4. Após inserir a fórmula, clique em “Salvar”.

Listamos abaixo as funções agregadoras presentes no Zoho Analytics. Essas fórmulas também podem ser usadas na consulta em SQL.

Nome da funçãoSintaxeDetalhes
Somasum(coluna_numérica)Retorna a soma todos os valores da coluna_numérica.
Médiaavg(coluna_numérica) ou mean(coluna_numérica)Retorna a média dos valores da coluna_numérica.
Medianamedian(coluna_numérica)Retorna a mediana dos valores da coluna_numérica.
Porcentagempercentile(coluna_numérica, intervalo)Retorna no valor da coluna_numérica que corta o percetual de intervalo.
Modamode(coluna_numérica)Retorna a moda dos valores da coluna_numérica.
Mínimomin(coluna_numérica)Retorna o valor mínimo da coluna_numérica.
Máximomax(coluna_numérica)Retorna o valor máximo da coluna_numérica.
Contagemcount(coluna)Retorna a quantidade de linhas não-vazios da coluna.
Contagem de distintoscount_distinct(coluna)Retorna a quantidade de valores diferentes presentes na coluna.
Contagem com vazioscount_wb(coluna)Retorna a quantidade de linhas da coluna, incluindo as linhas com valores vazios.
Desvio padrãostddev(coluna_numérica)Retorna o desvio padrão dos valores da coluna_numérica.
Desvio padrão da amostrastddev_sample(coluna_numérica)Retorna o desvio padrão da amostra dos valores da coluna_numérica.
Variânciavariance(coluna_numérica)Retorna a variância dos valores presentes na coluna_numérica.
Variância da amostravariance_sample(coluna_numérica)Retorna a variância da amostra dos valores presentes na coluna_numérica.
Correlaçãocorr(coluna_numérica_1, coluna_numérica_2)Retorna o coeficiente de Pearson entre as coluna_numérica_1 e coluna_numérica_2. Esse fator indica o quão linear é a relação entre os dois conjuntos, variando de -1 a 1, onde quanto mais próximo de 1 ou -1 mais linear é a relação entre as colunas
Covariânciacovar_pop(coluna_numérica_1, coluna_numérica_2)Retorna a covariância da população entre as coluna_numérica_1 e coluna_numérica_2. Esse valor indica o quanto as duas variaveis crescem entre si.
Soma condicionalsum_if(condição, coluna_numérica_afirmativa, coluna_numérica_negativa [opcional])De acordo com a condição, soma os valores da coluna_numérica_afirmativa caso a condição seja satisfeita, caso contrario soma o valor da coluna_numérica_negativa.
Média condicionalavg_if(condição, coluna_numérica_afirmativa, coluna_numérica_negativa [opcional])De acordo com a condição, faz a media dos valores da coluna_numérica_afirmativa caso a condição seja satisfeita, caso contrario adiciona a media o valor da coluna_numérica_negativa.
Contagem condicionalcount_if(condição)Conta a quantidade de valores que satisfazem a condição.
Concatenação do grupo group_concat(colunas)Concatena em cadeia todos os valores das colunas.
Primeiro do grupogroup_first(colunas)Retorna o primeiro valor das colunas do grupo.
Ultimo do grupogroup_last(colunas)Retorna o último valor das colunas do grupo.
Acumulado do anoytd(função_agregadora, coluna_de_data, mes_de_inicio_do_ano_fiscal(opcional))Retorna o valor da função_agregadora acumulada no ultimo ano, de acordo com a coluna_de_data, podendo especificar qual o mes_de_inicio_do_ano_fiscal(1= janeiro, 2 = fevereiro, …)
Acumulado do trimestreqtd(função_agregadora, coluna_de_data, mes_de_inicio_do_ano_fiscal(opcional))Retorna o valor da função_agregadora acumulada no ultimo trimestre, de acordo com a coluna_de_data, podendo especificar qual o mes_de_inicio_do_ano_fiscal(1= janeiro, 2 = fevereiro, …)
Acumulado do mêsmtd(função_agregadora, coluna_de_data)Retorna o valor da função_agregadora acumulada no ultimo mês, de acordo com a coluna_de_data.
Ignorar Filtrosignore_filters(função_agregadora, coluna)Realiza o calculo da função_agregadora aplicada na coluna, ignorando os filtros do usuário.
Mapeamento por grupomap_groupby(função_agregadora,coluna_1, coluna_2)Retorna o agrupamento dos dados com base na coluna_1, com a função_agregadora aplicada na coluna_2.

Deixe uma resposta