Quando é proposta a análise de um conjunto de dados sem características de séries cronológicas, geográficas ou específicas, o tratamento descritivo desses dados estatísticos pode iniciar-se por um processo de sintetização. A sintetização dos dados poderá ser feita, adotando algum critério de classificação (subconjuntos), que permita apresentar os dados em tabelas, de forma resumida. Tais tabelas são denominadas de DISTRIBUIÇÃO DE FREQUÊNCIAS.
Construção da Tabela
Exemplo de conjunto de dados |
Crítica dos Dados: verificação que se deve fazer nos dados, após sua coleta, a procura de possíveis falhas, imperfeições e erros.
Dados Brutos (Xi): conjunto de dados numéricos obtidos após a crítica dos valores coletados.
Representação: xi onde i = 1, ..., n (se amostrais)
Xi onde i = 1, ..., N (se populacionais)
Rol: arranjo dos dados brutos em ordem crescente ou decrescente. Organize os dados brutos em Rol Crescente .
Exemplo de rol de dados em ordem crescente |
Amplitude Total (AT): diferença entre o maior e o menor valor dos dados observado.
Exemplo: No quadro acima encontramos a amplitude total: AT = 102 - 47 = 55
Classes (k): a sintetização dos dados em tabelas nos leva a separá-los em subconjuntos, segundo “k“ classes de valores.
Há diversas maneiras para se encontrar o número de classes (k), uma delas é a raiz quadrada do número de elementos ( k = √n ou k = √N ):
Exemplo: k = √51 = 7,14 ≈ 7
Procure ter distribuições onde há crescimento e decrescimento da frequência absoluta. Evitar:
classes com frequência absoluta zero;
muitas classes com um número concentrado e semelhante de elementos.
Amplitude das Classes (h): intervalo de valores estabelecidos para cada classe.
Exemplo: h = AT / k = 55 / 7 = 7,85 ≈ 8
Dicas:
h tem que ter o mesmo número de casas decimais que os escores
h deve ser arredondado para o valor inteiro mais aproximado
Limites de Classes (li ou ls): valores extremos de cada intervalo de classe representados por:
li = limite inferior
ls = limite superior
Notações entre os limites de classes:li |—| ls inclui os valores inferior e superiorli |— ls inclui o inferior e exclui o superiorli —| ls exclui o inferior e inclui o superiorli — ls exclui os valores inferior e superior
Frequências Absolutas de Classes (Fi): número de dados cujos valores pertencem a cada classe.
Ponto Médio de Classe (xi): valor que representa os elementos de uma classe.
Frequências Absolutas Acumuladas (Fac): consiste em acumular o número de dados de uma dada classe acrescido de todos os dados das classes anteriores.
Frequências Relativas (fr ou fr%): é a proporção de dados em cada classe, dada pela expressão:
fr = Fi / n ou fr% = (Fi / n) * 100
Frequências Absolutas Acumuladas Percentuais (Fac%): traduzem a percentagem de dados acumulados até a classe “ i ”.
Fac% = (Fac / n) * 100
Exemplo de Distribuição de Frequência |
Representação Gráfica
Histograma
É o gráfico que representa em termos de área, a frequência total do fenômeno pesquisado abrangendo toda a amplitude da variável independente (Xi).
As classes da distribuição de frequências são representadas por colunas justapostas, cujas alturas são definidas pelas respectivas frequências absolutas (Fi).
O histograma é construído sobre os intervalos de classe e as áreas dos retângulos que o compõem representam proporcionalmente os dados cujos valores ocorrem em cada classe.
Polígono de Frequência
É um gráfico de área construído sobre os pontos médios (xi) dos intervalos de classe.
Assinalamos por pontos as frequências de classe (Fi) sobre os respectivos pontos médios (xi) e, em seguida, os ligamos por segmentos de reta, criando ainda no eixo das abcissas um ponto médio aquém do menor valor de xi e outro além do maior valor de xi, para que o polígono fique definido e tenha equivalência de área com o histograma da mesma distribuição.
Suavizando a linha poligonal que define o polígono, obtém-se uma curva que visualiza a tendência de variação dos dados.
Gráfico de frequência acumulada ou ogiva
As ogivas são construídas assinalando pontos relativos às frequências acumuladas (Fac ou Fac%) perpendicularmente aos extremos superiores dos intervalos de cada classe e ligando esses pontos por segmento de reta.
Esse gráfico, construído preferencialmente em papel milimetrado, é um diagrama de suma importância na análise visual extensiva de uma variável (Xi) que represente dados sob pesquisa.
Referência: NUNES, Elvira Maria Alves; ALMEIDA, Wesley Marcos. Estatística Aplicada Usando Excel. Maringá: EDUEM, 2016.
Bom dia! Muito obrigada pela disponibilização do material. Estou preparando um curso de Deseign of Experiments (DOE) e precisei montar uma parte introdutória de estatística descritiva e teste de hipóteses. Eu montei uma planilha no Excel para calcular as variáveis de distribuição de frequência mas fiquei com uma dúvida. Quando calculo o Fi, considero a notação que colocou dos para os intervalos de classe em que se inclui o li e exclui o ls. Dentro desta premissa, a frequência de dados no primeiro intervalo (F1), exclui os valores iguais a 55, e fica igual a 14 e não 17 como consta na Tabela. Poderia comentar? Grata, Érika