9.21. Funções de agregação

9.21. Funções de agregação
Anterior	Acima	Capítulo 9. Funções e operadores	Principal	Próxima

9.21. Funções de agregação #

As funções de agregação calculam um único resultado a partir do conjunto de valores da entrada. ^[88] As funções integradas de agregação de uso geral estão listadas na Tabela 9.62, enquanto as funções de agregação para estatísticas estão listadas na Tabela 9.63. As funções de agregação para conjunto ordenado estão listadas na Tabela 9.64, enquanto as funções de agregação para conjunto hipotético estão listadas na Tabela 9.65. As operações de agrupamento, que são intimamente ligadas às funções de agregação, estão listadas na Tabela 9.66. As considerações especiais de sintaxe para funções de agregação são explicadas em Expressões de agregação. Veja Funções de agregação para obter informações introdutórias adicionais.

As funções de agregação que oferecem suporte ao Modo Parcial estão qualificadas para participar de várias otimizações, como agregação paralela.

Embora todas os agregações abaixo aceitem a cláusula opcional ORDER BY (conforme delineado em Expressões de agregação), esta cláusula foi adicionada apenas às agregações cuja saída é afetada pela ordenação.

Tabela 9.62. Funções de agregação de propósito geral

Função Descrição	Modo parcial
`any_value` ( `anyelement` ) → `o mesmo tipo de dados da entrada` Retorna um valor arbitrário dentre os valores de entrada não nulos.	Sim
`array_agg` ( `anynonarray` `ORDER BY` `input_sort_columns` ) → `anyarray` Coleta todos os valores de entrada, incluindo valores nulos, em uma matriz.	Sim
`array_agg` ( `anyarray` `ORDER BY` `input_sort_columns` ) → `anyarray` Concatena todas as matrizes da entrada em uma matriz de dimensão superior. (Todas as entradas devem ter o mesmo número de dimensões, e não podem ser vazias ou nulas.)	Sim
`avg` ( `smallint` ) → `numeric` `avg` ( `integer` ) → `numeric` `avg` ( `bigint` ) → `numeric` `avg` ( `numeric` ) → `numeric` `avg` ( `real` ) → `double precision` `avg` ( `double precision` ) → `double precision` `avg` ( `interval` ) → `interval` Calcula a média (média aritmética) de todos os valores não nulos da entrada.	Sim
`bit_and` ( `smallint` ) → `smallint` `bit_and` ( `integer` ) → `integer` `bit_and` ( `bigint` ) → `bigint` `bit_and` ( `bit` ) → `bit` Calcula o `AND` bit a bit de todos os valores não nulos da entrada.	Sim
`bit_or` ( `smallint` ) → `smallint` `bit_or` ( `integer` ) → `integer` `bit_or` ( `bigint` ) → `bigint` `bit_or` ( `bit` ) → `bit` Calcula o `OR` bit a bit de todos os valores não nulos da entrada.	Sim
`bit_xor` ( `smallint` ) → `smallint` `bit_xor` ( `integer` ) → `integer` `bit_xor` ( `bigint` ) → `bigint` `bit_xor` ( `bit` ) → `bit` Calcula o `OR` exclusivo bit a bit de todos os valores não nulos da entrada. Pode ser útil como uma soma de verificação (checksum) para um conjunto não ordenado de valores.	Sim
`bool_and` ( `boolean` ) → `boolean` Retorna verdade se todos os valores de entrada não nulos forem verdade, caso contrário, retorna falso.	Sim
`bool_or` ( `boolean` ) → `boolean` Retorna verdade se qualquer valor não nulo da entrada for verdade, caso contrário retorna falso.	Sim
`count` ( `*` ) → `bigint` Calcula o número de linhas da entrada.	Sim
`count` ( `"any"` ) → `bigint` Calcula o número de linhas da entrada nas quais o valor da entrada não é nulo.	Sim
`every` ( `boolean` ) → `boolean` O equivalente do padrão SQL para a função `bool_and`.	Sim
`json_agg` ( `anyelement` `ORDER BY` `input_sort_columns` ) → `json` `jsonb_agg` ( `anyelement` `ORDER BY` `input_sort_columns` ) → `jsonb` Coleta todos os valores de entrada, incluindo valores nulos, em uma matriz JSON. Os valores são convertidos para JSON segundo as funções `to_json` ou `to_jsonb`.	Não
`json_agg_strict` ( `anyelement` ) → `json` `jsonb_agg_strict` ( `anyelement` ) → `jsonb` Coleta todos os valores de entrada, ignorando os valores nulos, em uma matriz JSON. Os valores são convertidos para JSON segundo as funções `to_json` ou `to_jsonb`.	Não
`json_arrayagg` ( [ `value_expression` ] [ `ORDER BY` `sort_expression` ] [ { `NULL` \| `ABSENT` } `ON NULL` ] [ `RETURNING` `data_type` [ `FORMAT JSON` [ `ENCODING UTF8` ] ] ]) Se comporta da mesma maneira que a função `json_array`, mas sendo uma função de agregação aceita apenas o parâmetro `value_expression`. Se for especificado `ABSENT ON NULL`, quaisquer valores `NULL` serão omitidos. Se for especificado `ORDER BY`, os elementos irão aparecer na matriz nesta ordem, e não na ordem em que foram inseridos. `SELECT json_arrayagg(v) FROM (VALUES(2),(1)) t(v)` → `[2, 1]`	Não
`json_objectagg` ( [ { `key_expression` { `VALUE` \| ':' } `value_expression` } ] [ { `NULL` \| `ABSENT` } `ON NULL` ] [ { `WITH` \| `WITHOUT` } `UNIQUE` [ `KEYS` ] ] [ `RETURNING` `data_type` [ `FORMAT JSON` [ `ENCODING UTF8` ] ] ]) Se comporta da mesma maneira que a função `json_object`, mas sendo uma função de agregação aceita apenas um parâmetro `key_expression` e um parâmetro `value_expression`. `SELECT json_objectagg(k:v) FROM (VALUES ('a'::text,current_date),('b',current_date + 1)) AS t(k,v)` → `{ "a" : "2022-05-10", "b" : "2022-05-11" }`	Não
`json_object_agg` ( `key` `"any"`, `value` `"any"` `ORDER BY` `input_sort_columns` ) → `json` `jsonb_object_agg` ( `key` `"any"`, `value` `"any"` `ORDER BY` `input_sort_columns` ) → `jsonb` Coleta todos os pares chave/valor em um objeto JSON. Os argumentos chave são convertidos em texto; os argumentos de valor são convertidos conforme as funções `to_json` ou `to_jsonb`. Os valores podem ser nulos, mas as chaves não.	Não
`json_object_agg_strict` ( `key` `"any"`, `value` `"any"` ) → `json` `jsonb_object_agg_strict` ( `key` `"any"`, `value` `"any"` ) → `jsonb` Coleta todos os pares chave/valor em um objeto JSON. Os argumentos chave são convertidos em texto; os argumentos de valor são convertidos conforme as funções `to_json` ou `to_jsonb`. O parâmetro `key` não pode ser nulo. Se o parâmetro `value` for nulo então a entrada será saltada,	Não
`json_object_agg_unique` ( `key` `"any"`, `value` `"any"` ) → `json` `jsonb_object_agg_unique` ( `key` `"any"`, `value` `"any"` ) → `jsonb` Coleta todos os pares chave/valor em um objeto JSON. Os argumentos chave são convertidos em texto; os argumentos de valor são convertidos conforme as funções `to_json` ou `to_jsonb`. Os valores podem ser nulos, mas as chaves não. Havendo chave duplicada, será gerado um erro.	Não
`json_object_agg_unique_strict` ( `key` `"any"`, `value` `"any"` ) → `json` `jsonb_object_agg_unique_strict` ( `key` `"any"`, `value` `"any"` ) → `jsonb` Coleta todos os pares chave/valor em um objeto JSON. Os argumentos chave são convertidos em texto; os argumentos de valor são convertidos conforme as funções `to_json` ou `to_jsonb`. O parâmetro `key` não pode ser nulo. Se o parâmetro `value` for nulo então a entrada será saltada, Havendo chave duplicada, será gerado um erro.	Não
`max` ( `veja o texto` ) → `o mesmo tipo de dados da entrada` Calcula o maior dos valores não nulos da entrada. Disponível para qualquer tipo de dados numérico, cadeia de caracteres, data e hora ou enum, assim como para os tipo de dados `bytea`, `inet`, `interval`, `money`, `oid`, `pg_lsn`, `tid`, `xid8`, e também matrizes e tipos de dados compostos que contêm tipos de dados ordenáveis.	Sim
`min` ( `veja o texto` ) → `o mesmo tipo de dados da entrada` Calcula o menor dos valores não nulos da entrada. Disponível para qualquer tipo de dados numérico, cadeia de caracteres, data e hora ou enum, assim como para os tipo de dados `bytea`, `inet`, `interval`, `money`, `oid`, `pg_lsn`, `tid`, `xid8`, e também matrizes e tipos de dados compostos que contêm tipos de dados ordenáveis.	Sim
`range_agg` ( `value` `anyrange` ) → `anymultirange` `range_agg` ( `value` `anymultirange` ) → `anymultirange` Calcula a união dos valores não nulos da entrada.	Não
`range_intersect_agg` ( `value` `anyrange` ) → `anyrange` `range_intersect_agg` ( `value` `anymultirange` ) → `anymultirange` Calcula a interseção dos valores não nulos da entrada.	Não
`string_agg` ( `value` `text`, `delimiter` `text` ) → `text` `string_agg` ( `value` `bytea`, `delimiter` `bytea` `ORDER BY` `input_sort_columns` ) → `bytea` Concatena os valores não nulos da entrada em uma cadeia de caracteres. Cada valor após o primeiro é precedido pelo delimitador (`delimiter`) correspondente (se não for nulo).	Sim
`sum` ( `smallint` ) → `bigint` `sum` ( `integer` ) → `bigint` `sum` ( `bigint` ) → `numeric` `sum` ( `numeric` ) → `numeric` `sum` ( `real` ) → `real` `sum` ( `double precision` ) → `double precision` `sum` ( `interval` ) → `interval` `sum` ( `money` ) → `money` Calcula a soma dos valores não nulos da entrada.	Sim
`xmlagg` ( `xml` `ORDER BY` `input_sort_columns` ) → `xml` Concatena os valores de entrada XML não nulos. (veja Seção 9.15.1.8).	Não

Deve-se notar que, exceto para count, estas funções retornam o valor nulo quando nenhuma linha é selecionada. Em particular, sum de nenhuma linha retorna nulo, e não zero como se poderia esperar, e array_agg retorna nulo, em vez de uma matriz vazia, quando não há linhas na entrada. A função coalesce pode ser usada para substituir nulo por zero, ou por uma matriz vazia, quando for necessário.

As funções de agregação array_agg, json_agg, jsonb_agg, json_agg_strict, jsonb_agg_strict, json_object_agg, jsonb_object_agg, json_object_agg_strict, jsonb_object_agg_strict, json_object_agg_unique, jsonb_object_agg_unique, json_object_agg_unique_strict, jsonb_object_agg_unique_strict, string_agg e xmlagg, assim como as funções de agregação semelhantes definidas pelo usuário, produzem valores de resultado muito diferentes dependendo da ordem dos valores da entrada. Esta ordem não é especificada por padrão, mas pode ser controlada colocando uma cláusula ORDER BY dentro da chamada de agregação, conforme descrito em Expressões de agregação. Como alternativa, fornecer os valores da entrada a partir de uma subconsulta ordenada geralmente funciona. Por exemplo:

SELECT xmlagg(x) FROM (SELECT x FROM test ORDER BY y DESC) AS tab;

Esteja ciente que esta abordagem pode falhar se o nível da consulta externa contiver processamento adicional, como uma junção, porque isto pode fazer com que a saída da subconsulta seja reordenada antes que a agregação seja computada.

Nota

As funções de agregação booleanas bool_and e bool_or correspondem às agregações do padrão SQL every e any ou some. O PostgreSQL oferece suporte a every, mas não a any ou some, porque há uma ambiguidade incorporada na sintaxe padrão:

SELECT b1 = ANY((SELECT b2 FROM t2 ...)) FROM t1 ...;

Aqui ANY pode ser considerada como introdução a uma subconsulta, ou como uma função de agregação, se a subconsulta retornar uma linha com valor booleano. Assim, não pode ser dado o nome padrão a estas agregações.

Nota

Os usuários acostumados a trabalhar com outros sistemas de gerenciamento de banco de dados SQL podem ficar desapontados com o desempenho da agregação count quando aplicado à tabela inteira. Uma consulta como:

SELECT count(*) FROM alguma_tabela;

exigirá um esforço proporcional ao tamanho da tabela: O PostgreSQL precisará varrer a tabela inteira, ou a totalidade de um índice que inclua todas as linhas da tabela.

A Tabela 9.63 descreve as funções de agregação normalmente usadas em análise estatística ^[89] ^[90]. (Estão separadas apenas para evitar desordenar a lista das agregações mais usadas.) As funções descritas como aceitando tipo_numérico estão disponíveis para os tipos de dados smallint, integer, bigint, numeric, real, e double precision. Onde a descrição menciona N, significa o número de linhas da entrada para as quais todas as expressões da entrada não são nulas. Em todos os casos, será retornado nulo se a computação não fizer sentido, por exemplo, quando N for zero.

Tabela 9.63. Funções de agregação de estatísticas

Função Descrição	Modo Parcial
`corr` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula o coeficiente de correlação. ^[a].	Sim
`covar_pop` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a covariância da população. ^[b].	Sim
`covar_samp` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a covariância da amostra. ^[c].	Sim
`regr_avgx` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a média da variável independente, `sum(X)/N`. ^[d].	Sim
`regr_avgy` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a média da variável dependente, `sum(Y)/N`. ^[e].	Sim
`regr_count` ( `Y` `double precision`, `X` `double precision` ) → `bigint` Calcula o número de linhas onde as duas entradas não são nulas. ^[f].	Sim
`regr_intercept` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcule a intersecção com o eixo y da equação de regressão linear por mínimos quadrados determinada pelos pares de valores (`X`, `Y`). ^[g].	Sim
`regr_r2` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula o quadrado do coeficiente de correlação. ^[h].	Sim
`regr_slope` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a inclinação da linha da equação de ajuste de mínimos quadrados lineares determinada pelos pares de valores (`X`, `Y`). ^[i].	Sim
`regr_sxx` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a “soma dos quadrados” da variável independente, `sum(X^2) - sum(X)^2/N`. ^[j].	Sim
`regr_sxy` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a “soma dos produtos” de variáveis independentes multiplicadas por variáveis dependentes, `sum(XY) - sum(X) sum(Y)/N`.	Sim
`regr_syy` ( `Y` `double precision`, `X` `double precision` ) → `double precision` Calcula a “soma dos quadrados” da variável dependente, `sum(Y^2) - sum(Y)^2/N`.	Sim
`stddev` ( `tipo_numérico` ) → `double precision` para o tipo de dados `real` ou `double precision`, caso contrário `numeric` Este é um alias histórico para a função `stddev_samp`.	Sim
`stddev_pop` ( `tipo_numérico` ) → `double precision` para o tipo de dados `real` ou `double precision`, caso contrário `numeric` Calcula o desvio padrão da população para os valores de entrada. ^[k].	Sim
`stddev_samp` ( `tipo_numérico` ) → `double precision` para o tipo de dados `real` ou `double precision`, caso contrário `numeric` Calcula o desvio padrão da amostra dos valores de entrada. ^[l].	Sim
`variance` ( `tipo_numérico` ) → `double precision` para o tipo de dados `real` ou `double precision`, caso contrário `numeric` Este é um alias histórico para a função `var_samp`.	Sim
`var_pop` ( `tipo_numérico` ) → `double precision` para o tipo de dados `real` ou `double precision`, caso contrário `numeric` Calcula a variância da população para os valores de entrada (quadrado do desvio padrão da população). ^[m].	Sim
`var_samp` ( `tipo_numérico` ) → `double precision` para o tipo de dados `real` ou `double precision`, caso contrário `numeric` Calcula a variância da amostra para os valores de entrada (quadrado do desvio padrão da amostra). ^[n].	Sim
^[a] `CORR` retorna o coeficiente de correlação de um conjunto de pares de números. Oracle – CORR (N. T.) ^[b] `COVAR_POP` retorna a covariância da população de um conjunto de pares de números. Oracle – COVAR_POP (N. T.) ^[c] `COVAR_SAMP` retorna a covariância da amostra de um conjunto de pares de números. Oracle – COVAR_SAMP (N. T.) ^[d] `REGR_AVGX` calcula a média da variável independente (expr2) da linha de regressão. Oracle – REGR_ (Linear Regression) Functions (N. T.) ^[e] `REGR_AVGY` calcula a média da variável dependente (expr1) da linha de regressão. Oracle – REGR_ (Linear Regression) Functions (N. T.) ^[f] `REGR_COUNT` retorna um número inteiro que representa a quantidade de pares de números não nulos usados para ajustar a linha de regressão. Oracle – REGR_ (Linear Regression) Functions (N. T.) ^[g] `REGR_INTERCEPT` retorna a intersecção com o eixo y da linha de regressão. Oracle – REGR_ (Linear Regression) Functions (N. T.) ^[h] `REGR_R2` retorna o coeficiente de determinação (também chamado de R-quadrado ou bondade do ajuste) para a regressão. Oracle – REGR_ (Linear Regression) Functions (N. T.) ^[i] `REGR_SLOPE` retorna a inclinação da linha. Oracle – REGR_ (Linear Regression) Functions (N. T.) ^[j] `REGR_SXY, REGR_SXX, REGR_SYY` são funções auxiliares utilizadas para calcular diversas estatísticas de diagnóstico. Oracle – REGR_ (Linear Regression) Functions (N. T.) ^[k] `STDDEV_POP` calcula o desvio padrão da população e retorna a raiz quadrada da variância da população. Oracle – STDDEV_POP (N. T.) ^[l] `STDDEV_SAMP` calcula o desvio padrão cumulativo da amostra e retorna a raiz quadrada da variância da amostra. Oracle – STDDEV_SAMP (N. T.) ^[m] `VAR_POP` retorna a variância da população de um conjunto de números após descartar os valores nulos neste conjunto. Oracle – VAR_POP (N. T.) ^[n] `VAR_SAMP` retorna a variância da amostra de um conjunto de números após descartar os valores nulos neste conjunto. Oracle – VAR_SAMP (N. T.)

A Tabela 9.64 descreve algumas funções de agregação que usam a sintaxe de agregação para conjunto ordenado. Estas funções são algumas vezes chamadas de funções de “distribuição inversa”. Sua entrada de agregação é introduzida pela cláusula ORDER BY, e também podem receber um argumento direto, que não é agregação, mas é calculado apenas uma vez. Todas estas funções ignoram os valores nulos em sua entrada de agregação. Para as funções que recebem o parâmetro fraction (fração) o valor da fração deve estar entre 0 e 1; senão é gerado um erro. Entretanto, um valor nulo para fraction simplesmente produz um resultado nulo.

Tabela 9.64. Funções de agregação de conjunto ordenado

Função Descrição	Modo Parcial
`mode` () `WITHIN GROUP` ( `ORDER BY` `anyelement` ) → `anyelement` Calcula a moda, o valor de maior frequência do argumento de agregação (escolhendo arbitrariamente o primeiro, se houver vários valores igualmente frequentes). O argumento de agregação deve ser de um tipo de dados ordenável.	Não
`percentile_cont` ( `fraction` `double precision` ) `WITHIN GROUP` ( `ORDER BY` `double precision` ) → `double precision` `percentile_cont` ( `fraction` `double precision` ) `WITHIN GROUP` ( `ORDER BY` `interval` ) → `interval` Calcula o percentil contínuo, um valor correspondente à `fração` especificada dentro do conjunto ordenado de valores de argumentos de agregação. Se for necessário, será realizada a interpolação entre itens adjacentes da entrada.	Não
`percentile_cont` ( `fractions` `double precision[]` ) `WITHIN GROUP` ( `ORDER BY` `double precision` ) → `double precision[]` `percentile_cont` ( `fractions` `double precision[]` ) `WITHIN GROUP` ( `ORDER BY` `interval` ) → `interval[]` Calcula múltiplos percentis contínuos. O resultado é uma matriz com as mesmas dimensões do parâmetro `fractions` (frações), com cada elemento não nulo substituído pelo valor (possivelmente interpolado) correspondente a este percentil.	Não
`percentile_disc` ( `fraction` `double precision` ) `WITHIN GROUP` ( `ORDER BY` `anyelement` ) → `anyelement` Calcula o percentil discreto, o primeiro valor dentro do conjunto ordenado de valores de argumentos de agregação cuja posição na ordenação é igual ou superior à `fração` especificada. O argumento de agregação deve ser de um tipo de dados classificável.	Não
`percentile_disc` ( `fractions` `double precision[]` ) `WITHIN GROUP` ( `ORDER BY` `anyelement` ) → `anyarray` Calcula múltiplos percentis discretos. O resultado é uma matriz com as mesmas dimensões do parâmetro `frações`, com cada elemento não nulo substituído pelo valor da entrada correspondente àquele percentil. O argumento de agregação deve ser de um tipo de dados classificável.	Não

Cada uma das agregações para “conjunto hipotético” listadas na Tabela 9.65 está associada a uma função de janela com o mesmo nome definida em Funções de janela. Em cada caso, o resultado da agregação é o valor que a função de janela associada teria retornado para a linha “hipotética”, construída a partir de args, se tal linha tivesse sido adicionada ao grupo ordenado de linhas representado por sorted_args. Para cada uma dessas funções, a lista de argumentos diretos fornecida em args deve corresponder ao número e tipos de argumentos de agregação fornecidos em sorted_args. Ao contrário da maioria das agregações integradas, estas agregações não são estritas, ou seja, não descartam linhas de entrada contendo nulos. Os valores nulos são ordenados segundo a regra especificada na cláusula ORDER BY.

Tabela 9.65. Funções de agregação de conjunto hipotético

Função Descrição	Modo Parcial
`rank` ( `args` ) `WITHIN GROUP` ( `ORDER BY` `sorted_args` ) → `bigint` Calcula o nível (`rank`) da linha hipotética, com lacunas; ou seja, o número da linha da primeira linha em seu grupo de pares.	Não
`dense_rank` ( `args` ) `WITHIN GROUP` ( `ORDER BY` `sorted_args` ) → `bigint` Calcula o nível da linha hipotética, sem lacunas; esta função conta de fato os grupos de pares.	Não
`percent_rank` ( `args` ) `WITHIN GROUP` ( `ORDER BY` `sorted_args` ) → `double precision` Calcula o nível relativo da linha hipotética, que é (`rank` - 1) / (total de linhas - 1). O valor varia assim entre 0 e 1, inclusive.	Não
`cume_dist` ( `args` ) `WITHIN GROUP` ( `ORDER BY` `sorted_args` ) → `double precision` Calcula a distribuição cumulativa, ou seja, (número de linhas anteriores ou pares com linha hipotética) / (total de linhas). O valor varia assim entre 1/`N` e 1.	Não

Tabela 9.66. Operações de agrupamento

Função Descrição
`GROUPING` ( `group_by_expression(s)` ) → `integer` Retorna uma máscara de bits indicando quais expressões `GROUP BY` não estão incluídas no conjunto de agrupamento corrente. Os bits são atribuídos com o argumento mais à direita correspondendo ao bit menos significativo; cada bit será 0 se a expressão correspondente estiver incluída nos critérios de agrupamento do conjunto de agrupamento que gera a linha de resultado corrente, e 1 se não estiver incluída.

Função

Descrição

GROUPING ( group_by_expression(s) ) → integer

Retorna uma máscara de bits indicando quais expressões GROUP BY não estão incluídas no conjunto de agrupamento corrente. Os bits são atribuídos com o argumento mais à direita correspondendo ao bit menos significativo; cada bit será 0 se a expressão correspondente estiver incluída nos critérios de agrupamento do conjunto de agrupamento que gera a linha de resultado corrente, e 1 se não estiver incluída.

As operações de agrupamento descritas na Tabela 9.66 são usados em conjunto com conjuntos de agrupamento (veja GROUPING SETS, CUBE e ROLLUP) para distinguir as linhas de resultados. Os argumentos para a função GROUPING não são realmente avaliados, mas devem corresponder exatamente às expressões fornecidas na cláusula GROUP BY do nível de consulta associado. Por exemplo:

SELECT * FROM items_sold;

 make  | model | sales
-------+-------+-------
 Foo   | GT    |  10
 Foo   | Tour  |  20
 Bar   | City  |  15
 Bar   | Sport |  5
(4 linhas)

SELECT make, model, GROUPING(make,model), sum(sales) FROM items_sold GROUP BY ROLLUP(make,model);

 make  | model | grouping | sum
-------+-------+----------+-----
 Foo   | GT    |        0 | 10
 Foo   | Tour  |        0 | 20
 Bar   | City  |        0 | 15
 Bar   | Sport |        0 | 5
 Foo   |       |        1 | 30
 Bar   |       |        1 | 20
       |       |        3 | 50
(7 linhas)

Acima, o valor de grouping igual a 0 nas quatro primeiras linhas mostra que elas foram agrupadas normalmente, pelas duas colunas de agrupamento. O valor 1 indica que model não foi agrupado nas duas penúltimas linhas, e o valor 3 indica que nem make, nem model, foram agrupadas na última linha (que é, portanto, uma agregação sobre todas as linhas da entrada).

Exemplo 9.6. Exemplo do tradutor

Neste exemplo é criada uma tabela contendo 400 valores aleatórios entre 0 e 999 e usadas funções de agregação de propósito geral e funções de agregação para estatísticas sobre os valores da tabela. Como os valores são aleatórios, se este exemplo for repetido os resultados obtidos serão um pouco diferentes, exceto para count.

-- Função para retornar uma matriz contendo o
-- número especificado de valores entre 0 e 999.
CREATE OR REPLACE FUNCTION amostra (n int)
    RETURNS int[] LANGUAGE plpgsql AS $$
DECLARE
    i int;
    matriz int[];
BEGIN
    matriz = array_fill(0, array[n]);
    FOR i IN 1..n LOOP
        matriz[i] = floor(random()*1000)::int;
    END LOOP;
    RETURN matriz;
END $$;

CREATE FUNCTION

-- Criação da tabela temporária de amostra contendo 400 valores
CREATE TEMPORARY TABLE amostra AS SELECT unnest FROM UNNEST(amostra(400));

SELECT 400

-- Funções de agregação de propósito geral
SELECT avg(unnest), min(unnest), max(unnest), count(unnest) FROM amostra;

         avg          | min | max | count
----------------------+-----+-----+-------
 496.2275000000000000 |   1 | 996 |   400
(1 linha)

-- Funções de agregação de estatísticas (desvio padrão)
SELECT stddev_pop(unnest), stddev_samp(unnest) FROM amostra;

    stddev_pop    |   stddev_samp
------------------+------------------
 291.513139916111 | 291.878216001452
(1 linha)

-- Funções de agregação de estatísticas (variância)
SELECT var_pop(unnest), var_samp(unnest) FROM amostra;

      var_pop       |      var_samp
--------------------+--------------------
 84979.910743750000 | 85192.892976190476
(1 linha)

Exemplo 9.7. Exemplo do tradutor

Este exemplo mostra o uso das funções de agregação disponíveis para cadeias de caracteres string_agg, array_agg, json_agg e jsonb_agg. No último exemplo foi usado DISTINCT para eliminar os valores repetidos.

CREATE VIEW nomes(nome) AS WITH nomes AS (
VALUES ('José'), ('João'), ('Maria'), ('Manoel'), ('João'), ('Jose')
) SELECT * FROM nomes;

CREATE VIEW

SELECT * FROM nomes;

  nome
--------
 José
 João
 Maria
 Manoel
 João
 Jose
(6 linhas)

SELECT string_agg(nome, ';') FROM nomes;

            string_agg
----------------------------------
 José;João;Maria;Manoel;João;Jose
(1 linha)

SELECT array_agg(nome) FROM nomes;

             array_agg
------------------------------------
 {José,João,Maria,Manoel,João,Jose}
(1 linha)

SELECT json_agg(nome) FROM nomes;

                      json_agg
-----------------------------------------------------
 ["José", "João", "Maria", "Manoel", "João", "Jose"]
(1 linha)

SELECT jsonb_agg(nome) FROM nomes;

                      jsonb_agg
-----------------------------------------------------
 ["José", "João", "Maria", "Manoel", "João", "Jose"]
(1 linha)

SELECT jsonb_agg(DISTINCT nome) FROM nomes;

                  jsonb_agg
---------------------------------------------
 ["João", "Jose", "José", "Manoel", "Maria"]
(1 linha)

^[88] Oracle Aggregate Functions: As funções de agregação retornam uma única linha de resultado com base em grupos de linhas, em vez de uma linha apenas. As funções de agregação podem aparecer em listas de seleção e em cláusulas ORDER BY e HAVING. (N. T.)

^[89] As funções estatísticas calculam valores relacionados a distribuições estatísticas e probabilidade, como desvio padrão e número de permutações.(Microsoft Learn) (N. T.)

^[90] O que são as variáveis dependentes, independentes e controladas? (Science19.com) (N. T.)