{"id":4774,"date":"2022-01-05T11:54:14","date_gmt":"2022-01-05T14:54:14","guid":{"rendered":"http:\/\/outsmart.com.br?p=4774"},"modified":"2022-01-17T11:48:51","modified_gmt":"2022-01-17T14:48:51","slug":"funcoes-agregadoras-e-agrupamento-de-dados","status":"publish","type":"post","link":"https:\/\/outsmart.com.br\/funcoes-agregadoras-e-agrupamento-de-dados\/","title":{"rendered":"Fun\u00e7\u00f5es agregadoras e agrupamento de dados"},"content":{"rendered":"\n
Quando se trata de analise de dados, pensa-se sempre em opera\u00e7\u00f5es como m\u00e9dia, soma, mediana, desvio padr\u00e3o, vari\u00e2ncia e correla\u00e7\u00e3o. Essas opera\u00e7\u00f5es retornam, a partir de um conjunto de dados, um \u00fanico valor, o que as classifica como fun\u00e7\u00f5es agregadoras<\/strong>.<\/p>\n\n\n\n Como descrito acima, as fun\u00e7\u00f5es agregadoras s\u00e3o fun\u00e7\u00f5es que agregam os dados de m determinado conjunto para retornar um valor. Elas podem ser aplicadas na tabela inteira ou em pequenos grupos determinados por um outro dado. Nesse tutorial, explicaremos como se faz esse agrupamento e como aplicar as fun\u00e7\u00f5es agregadoras nos grupos pelo Zoho Analytics.<\/p>\n\n\n\n Uma opera\u00e7\u00e3o muito comum na an\u00e1lise de dados \u00e9 o agrupamento. Esse agrupamento pode ser visto como uma maneira de responder perguntas com “para cada”, isto \u00e9, problemas em que se deseja resumir um conjunto de dados de acordo com uma caracteristica daqueles dados. Alguns exemplos de probelmas resolvidos com agrupamento:<\/p>\n\n\n\n Pelo Zoho Analytics, os agrupamentos s\u00e3o feitos de tr\u00eas formas: por visualiza\u00e7\u00e3o de piv\u00f4, por visualiza\u00e7\u00e3o de resumo e atrav\u00e9s de uma tabela de consulta. Para fazer o agrupamento por tabela de consulta, basta seguir os passos abaixo:<\/p>\n\n\n\n 1. Da p\u00e1gina inicial do seu espa\u00e7o de trabalho, clique em “Criar” e em “Tabela de consultas”. Isso far\u00e1 com com que o Zoho Analytics crie uma nova tabela de consulta e a exiba na tela. O Zoho Analytics cria uma consulta gen\u00e9rica como modelo, que pode ser apagada.<\/p>\n\n\n\n 2. As tr\u00eas palavras chaves essenciais para um agrupamento de consulta s\u00e3o SELECT, FROM e GROUP BY. Comece a consulta colocando essas 3 express\u00f5es separadas por algumas linhas. <\/p>\n\n\n\n 3. Logo apos o SELECT, escreva a coluna por onde ser\u00e1 agrupado os dados. Isso pode ser feito clicando em “Inserir coluna” e clicando duas vezes rapidamente no nome da coluna. <\/p>\n\n\n\n 4. Ainda no SELECT, insira as fun\u00e7\u00f5es agregadoras desejadas, seguindo a sintaxe FUN\u00c7\u00c3O(COLUNA). O Zoho Analytics tem uma lista das fun\u00e7\u00f5es clicando em “Inserir fun\u00e7\u00f5es SQL”, logo abaixo de “Aggregate Functions”. \u00c9 muito importante que os objetos dentro do SELECT estejam separados por v\u00edrgula.<\/p>\n\n\n\n 5. Ap\u00f3s o FROM, coloque o nome das tabelas de onde s\u00e3o extra\u00eddos os dados dessa consulta. Nessa parte \u00e9 poss\u00edvel utilizar uma jun\u00e7\u00e3o, como descrito aqui.<\/p>\n\n\n\n 6. Ap\u00f3s o GROUP BY, escreva o nome da coluna por onde ser\u00e1 agrupado os dados.<\/p>\n\n\n\n E assim, clicando em Executar consulta, o Zoho Analytics gera o agrupamento dos dados de acordo com a consulta. \u00c9 importante clicar em “salvar” para utilizar esses dados nos relat\u00f3rios. \u00c9 poss\u00edvel renomear as colunas desse agrupamento, ao adicionar, depois do nome de cada coluna, o novo nome entre aspas. <\/p>\n\n\n\n Uma outra maneira de fazer c\u00e1lculos agregadores \u00e9 pelas pr\u00f3prias f\u00f3rmula agregadoras do Zoho Analytics. Essas f\u00f3rmulas geram um dado que pode ser utilizado em relat\u00f3rios e outros componentes do Zoho Analytics, mas n\u00e3o \u00e9 vis\u00edvel na tabela. Para criar uma formula agregadora, siga os passos abaixo:<\/p>\n\n\n\n Listamos abaixo as fun\u00e7\u00f5es agregadoras presentes no Zoho Analytics. Essas f\u00f3rmulas tamb\u00e9m podem ser usadas na consulta em SQL.<\/p>\n\n\n\n <\/p>\n","protected":false},"excerpt":{"rendered":" Quando se trata de analise de dados, pensa-se sempre em opera\u00e7\u00f5es como m\u00e9dia, soma, mediana, desvio padr\u00e3o, vari\u00e2ncia e correla\u00e7\u00e3o. Essas opera\u00e7\u00f5es retornam, a partir de um conjunto de dados, um \u00fanico valor, o que as classifica como fun\u00e7\u00f5es agregadoras. Como descrito acima, as fun\u00e7\u00f5es agregadoras s\u00e3o fun\u00e7\u00f5es que agregam os dados de m determinado […]<\/p>\n","protected":false},"author":13,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[23],"tags":[],"class_list":["post-4774","post","type-post","status-publish","format-standard","hentry","category-zoho-analytics","entry"],"_links":{"self":[{"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/posts\/4774","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/users\/13"}],"replies":[{"embeddable":true,"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/comments?post=4774"}],"version-history":[{"count":5,"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/posts\/4774\/revisions"}],"predecessor-version":[{"id":4836,"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/posts\/4774\/revisions\/4836"}],"wp:attachment":[{"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/media?parent=4774"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/categories?post=4774"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/outsmart.com.br\/wp-json\/wp\/v2\/tags?post=4774"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}Agrupamento de dados por consulta<\/h2>\n\n\n\n
SELECT \r\n\r\nFROM \r\n\r\nGROUP BY<\/code><\/pre>\n\n\n\n
SELECT \"Produto\".\"Cor\"\r\n\r\nFROM \r\n\r\nGROUP BY<\/code><\/pre>\n\n\n\n
SELECT \"Produto\".\"Cor\",\r\n AVG(\"Produto\".\"Valor\"),\r\n COUNT(\"Produto\")\r\nFROM \r\nGROUP BY <\/code><\/pre>\n\n\n\n
SELECT \"Produto\".\"Cor\",\r\n AVG(\"Produto\".\"Valor\"),\r\n COUNT(\"Produto\")\r\nFROM \"Produto\"\r\nGROUP BY <\/code><\/pre>\n\n\n\n
SELECT \"Produto\".\"Cor\",\r\n AVG(\"Produto\".\"Valor\"),\r\n COUNT(\"Produto\")\r\nFROM \"Produto\"\r\nGROUP BY \"Produto\".\"Cor\"<\/code><\/pre>\n\n\n\n
F\u00f3rmulas agregadoras<\/h2>\n\n\n\n
<\/figure>\n<\/div>\n\n\n\n
<\/figure>\n<\/div>\n\n\n\n
<\/figure>\n<\/div>\n<\/div>\n\n\n\n
Nome da fun\u00e7\u00e3o<\/strong><\/td> Sintaxe<\/strong><\/td> Detalhes<\/strong><\/td><\/tr> Soma<\/td> sum(coluna_num\u00e9rica<\/strong>)<\/td> Retorna a soma todos os valores da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> M\u00e9dia<\/td> avg(coluna_num\u00e9rica<\/strong>) ou mean(coluna_num\u00e9rica<\/strong>)<\/td> Retorna a m\u00e9dia dos valores da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> Mediana<\/td> median(coluna_num\u00e9rica<\/strong>)<\/td> Retorna a mediana dos valores da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> Porcentagem<\/td> percentile(coluna_num\u00e9rica, intervalo<\/strong>)<\/strong><\/td> Retorna no valor da coluna_num\u00e9rica<\/strong><\/strong> que corta o percetual de intervalo<\/strong>.<\/td><\/tr> Moda<\/td> mode(coluna_num\u00e9rica<\/strong>)<\/td> Retorna a moda dos valores da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> M\u00ednimo<\/td> min(coluna_num\u00e9rica<\/strong>)<\/td> Retorna o valor m\u00ednimo da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> M\u00e1ximo<\/td> max(coluna_num\u00e9rica<\/strong>)<\/td> Retorna o valor m\u00e1ximo da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> Contagem<\/td> count(coluna<\/strong>)<\/td> Retorna a quantidade de linhas n\u00e3o-vazios da coluna<\/strong>. <\/td><\/tr> Contagem de distintos<\/td> count_distinct(coluna<\/strong>)<\/td> Retorna a quantidade de valores diferentes presentes na coluna<\/strong>.<\/td><\/tr> Contagem com vazios<\/td> count_wb(coluna<\/strong>)<\/td> Retorna a quantidade de linhas da coluna<\/strong>, incluindo as linhas com valores vazios.<\/td><\/tr> Desvio padr\u00e3o<\/td> stddev(coluna_num\u00e9rica<\/strong>)<\/td> Retorna o desvio padr\u00e3o dos valores da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> Desvio padr\u00e3o da amostra<\/td> stddev_sample(coluna_num\u00e9rica<\/strong>)<\/td> Retorna o desvio padr\u00e3o da amostra dos valores da coluna_num\u00e9rica<\/strong>.<\/td><\/tr> Vari\u00e2ncia<\/td> variance(coluna_num\u00e9rica<\/strong>)<\/td> Retorna a vari\u00e2ncia dos valores presentes na coluna_num\u00e9rica<\/strong>.<\/td><\/tr> Vari\u00e2ncia da amostra<\/td> variance_sample(coluna_num\u00e9rica<\/strong>)<\/td> Retorna a vari\u00e2ncia da amostra dos valores presentes na coluna_num\u00e9rica<\/strong>.<\/td><\/tr> Correla\u00e7\u00e3o<\/td> corr(coluna_num\u00e9rica_1<\/strong>, coluna_num\u00e9rica_2<\/strong>)<\/td> Retorna o coeficiente de Pearson entre as coluna_num\u00e9rica_1<\/strong> e coluna_num\u00e9rica_2<\/strong>. Esse fator indica o qu\u00e3o linear \u00e9 a rela\u00e7\u00e3o entre os dois conjuntos, variando de -1 a 1, onde quanto mais pr\u00f3ximo de 1 ou -1 mais linear \u00e9 a rela\u00e7\u00e3o entre as colunas<\/td><\/tr> Covari\u00e2ncia<\/td> covar_pop(coluna_num\u00e9rica_1<\/strong>, coluna_num\u00e9rica_2<\/strong>)<\/td> Retorna a covari\u00e2ncia da popula\u00e7\u00e3o entre as coluna_num\u00e9rica_1<\/strong> e coluna_num\u00e9rica_2<\/strong>. Esse valor indica o quanto as duas variaveis crescem entre si.<\/td><\/tr> Soma condicional<\/td> sum_if(condi\u00e7\u00e3o<\/strong>, coluna_num\u00e9rica_afirmativa<\/strong>, coluna_num\u00e9rica_negativa<\/strong> [opcional])<\/td> De acordo com a condi\u00e7\u00e3o<\/strong>, soma os valores da coluna_num\u00e9rica_afirmativa<\/strong> caso a condi\u00e7\u00e3o<\/strong> seja satisfeita, caso contrario soma o valor da coluna_num\u00e9rica_negativa<\/strong>. <\/td><\/tr> M\u00e9dia condicional<\/td> avg_if(condi\u00e7\u00e3o<\/strong>, coluna_num\u00e9rica_afirmativa<\/strong>, coluna_num\u00e9rica_negativa<\/strong> [opcional])<\/td> De acordo com a condi\u00e7\u00e3o<\/strong>, faz a media dos valores da coluna_num\u00e9rica_afirmativa<\/strong> caso a condi\u00e7\u00e3o<\/strong> seja satisfeita, caso contrario adiciona a media o valor da coluna_num\u00e9rica_negativa<\/strong>.<\/td><\/tr> Contagem condicional<\/td> count_if(condi\u00e7\u00e3o<\/strong>)<\/td> Conta a quantidade de valores que satisfazem a condi\u00e7\u00e3o.<\/strong><\/td><\/tr> Concatena\u00e7\u00e3o do grupo <\/td> group_concat(colunas<\/strong>)<\/td> Concatena em cadeia todos os valores das colunas<\/strong>.<\/td><\/tr> Primeiro do grupo<\/td> group_first(colunas<\/strong>)<\/td> Retorna o primeiro valor das colunas<\/strong> do grupo.<\/td><\/tr> Ultimo do grupo<\/td> group_last(colunas<\/strong>)<\/td> Retorna o \u00faltimo valor das colunas<\/strong> do grupo.<\/td><\/tr> Acumulado do ano<\/td> ytd(fun\u00e7\u00e3o_agregadora, coluna_de_data, mes_de_inicio_do_ano_fiscal<\/strong>(opcional))<\/td> Retorna o valor da fun\u00e7\u00e3o_agregadora<\/strong> acumulada no ultimo ano, de acordo com a coluna_de_data,<\/strong> podendo especificar qual o mes_de_inicio_do_ano_fiscal<\/strong>(1= janeiro, 2 = fevereiro, …)<\/td><\/tr> Acumulado do trimestre<\/td> qtd(fun\u00e7\u00e3o_agregadora, coluna_de_data, mes_de_inicio_do_ano_fiscal<\/strong>(opcional))<\/td> Retorna o valor da fun\u00e7\u00e3o_agregadora<\/strong> acumulada no ultimo trimestre, de acordo com a coluna_de_data,<\/strong> podendo especificar qual o mes_de_inicio_do_ano_fiscal<\/strong>(1= janeiro, 2 = fevereiro, …)<\/td><\/tr> Acumulado do m\u00eas<\/td> mtd(fun\u00e7\u00e3o_agregadora, coluna_de_data<\/strong>)<\/td> Retorna o valor da fun\u00e7\u00e3o_agregadora<\/strong> acumulada no ultimo m\u00eas, de acordo com a coluna_de_data.<\/strong><\/td><\/tr> Ignorar Filtros<\/td> ignore_filters(fun\u00e7\u00e3o_agregadora, coluna<\/strong>)<\/td> Realiza o calculo da fun\u00e7\u00e3o_agregadora<\/strong><\/strong> aplicada na coluna<\/strong>, ignorando os filtros do usu\u00e1rio. <\/td><\/tr> Mapeamento por grupo<\/td> map_groupby(fun\u00e7\u00e3o_agregadora,coluna_1, coluna_2<\/strong>)<\/td> Retorna o agrupamento dos dados com base na coluna_1, <\/strong>com a fun\u00e7\u00e3o_agregadora<\/strong><\/strong> aplicada na coluna_2<\/strong>.<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n