top of page
Foto do escritorWesley Almeida

Modelos Probabilísticos

Atualizado: 2 de mai. de 2022

Para utilizar a teoria das probabilidades no estudo de um fenômeno concreto, deve-se encontrar um modelo probabilístico adequado a tal fenômeno.


Entende-se por modelo probabilístico de uma variável aleatória X uma forma específica de função de distribuição de probabilidade que reflita o comportamento de X. Por isso, é que serão estudados agora alguns desses modelos, a fim de enfatizar as condições em que eles aparecem, sua função de probabilidade, parâmetros e a forma de calcular probabilidade por meio deles.


Distribuição Binomial

Muitos experimentos são tais que os resultados possíveis apresentam ou não uma determinada característica. - uma família tem filhos: os resultados podem ser filhos do sexo masculino ou filhos do sexo feminino; - um dado é lançado: ou ocorre sim ou não. - numa pesquisa de opinião, foram entrevistadas 200 pessoas ao acaso, eles podem responder sim ou não.


Em todos os casos como estes, os experimentos são denominados experimentos de Bernoulli e só admitem dois resultados quais sejam, sucesso (sim) ou fracasso (não). Imagine-se agora que seja repetido um experimento de Bernoulli n vezes e que as repetições sejam independentes, isto é, o resultado de um ensaio não tem influência nenhuma no resultado de qualquer outro ensaio.

Supondo ainda que haja interesse no cálculo da probabilidade de ocorrência de certo número de sucesso, como nos exemplos a seguir:

  • uma família tem cinco filhos. Qual a probabilidade de se ter três meninas?

  • um dado é lançado cinco vezes. Qual a probabilidade de se obter a face 5 no máximo três vezes?

Em todos os casos, tem-se n repetições do experimento de Bernoulli, as repetições são independentes e se há interesse no cálculo da probabilidade de um certo número de sucesso, não importa a ordem em que tenham ocorrido, isto é, deseja-se estudar a variável aleatória X, a qual atribui a cada ensaio o número de sucesso ocorrido.


Definição
Considerando um experimento Bernoulli E, e seja A algum evento associado a E. Admita-se que P(A) = p e consequentemente P(A~) = 1-p.
Considerem-se n repetições de E. Então, o espaço amostral será formado por todas as sequências possíveis {a1, a2,...,an}, em que cada ai é A ou A~, dependendo de que tenha ocorrido A ou A~ na i–ésima repetição de E.

De acordo com a definição acima, denomina-se de experimento binomial ao experimento:

  • que consiste em n ensaios de Bernoulli;

  • cujos ensaios são independentes;

  • em que a probabilidade de sucesso em cada ensaio é sempre igual.

Obtenhamos agora P(X=xi), ou seja, para uma variável aleatória binomial, a probabilidade de obter X sucesso (e portanto, q = p–1 = fracasso).


Seja X uma variável binomial, baseada em n repetições. Então



x = 0, 1, 2, ...,n q = 1–p

A esperança, a variância e o desvio-padrão de uma variável aleatória binomial são dadas respectivamente por: Média:



Variância:



Desvio padrão:












Noção básica de como operar com fatorial: o fatorial é indicado por um ponto de exclamação ao lado do número. Assim, sendo n um número natural, n! (lê-se: n fatorial) é o produto de todos os números naturais consecutivos de 1 até n, portanto, n!=1.2.3.4....n Por convenção: 1! = 1 0! = 1 3! = 3.2.1 = 6 4! = 4.3.2.1 = 24


Distribuição Normal


A distribuição normal é a mais importante das distribuições contínuas de probabilidade, uma vez que a mesma serve como excelente aproximação para uma grande classe de distribuições, que têm enorme importância prática.


Tem-se por definição que a variável aleatória X, que toma todos os valores reais, possui distribuição normal, com média (µ, Mi) e Variância (Sigma2) se sua função de densidade de probabilidade for da forma:





em que µ e (Sigma2) são os parâmetros da distribuição.


A notação usada é:

, isto é, a variável aleatória contínua X tem distribuição normal.



A representação gráfica desta distribuição é uma curva em forma de sino, que recebe o nome de Curva Normal.


O objetivo principal para uma variável aleatória contínua com distribuição normal é obter a probabilidade dessa variável assumindo um valor em um determinado intervalo (a, b), e tal probabilidade correspondente à área sob a curva da distribuição normal.


O cálculo direto de tal probabilidade exige recursos do cálculo infinitesimal e, mesmo assim, dada a forma da função de densidade de probabilidade, não é um processo elementar. Para contornar esse problema, recorre-se a uma mudança de variável, transformando a variável aleatória contínua X na variável aleatória contínua Z.


Distribuição Normal Padronizada (ou reduzida)


Z que tem distribuição normal reduzida com média zero e variância um, e é dado por:


em que X é uma variável normal de média µ e variância (Sigma2).





Então, pode-se denotar Z como:


Em que Z é conhecido como variável normal padronizada ou reduzida.


As probabilidades, isto é, as áreas sob esta curva de distribuição normal reduzida se encontram previamente calculadas em tabelas próprias. Comparando-se os gráficos da distribuição normal com o da distribuição normal reduzida, destacam-se as seguintes características:

  • f(x) é simétrica em relação à média (origem) x = µ. F(z) é simétrica em relação à média (origem) µz = 0;

  • f(x) possui ponto de máximo para x = µ. F(z) possui ponto de máximo para z = 0;

  • f(x) tende a zero quando x tende para . F(z) tende a zero quando z tende para ;

  • f(x) tem dois pontos de inflexão, cujas abcissas valem µ ± . F(z) tem dois pontos de inflexão, cujas abcissas valem ± 1;

  • A área total sob a curva é igual a 1;

  • A área compreendida entre:

    • ± 1 (± um desvio-padrão, pois Sigma = 1) = 68,28 %;

    • ± 2 (± dois desvios-padrão, pois Sigma = 1) = 95,45 %;

    • ± 3 (± três desvios-padrão, pois Sigma = 1) = 99,73 %

    • ±(infinito) = 1 ou 100%.


Tabela da Curva da Distribuição Normal


Há vários tipos de tabelas que fornecem as áreas (probabilidades) sob a curva da distribuição normal reduzida. A tabela utilizada (aqui) fornece a área a esquerda do ponto z0, tal que esta área representa a probabilidade de um valor escolhido estar contido no intervalo de - (infinito) e z0.

Acesse aqui:

Há três propriedades para o uso desta tabela, tais como:


P(Z≤z0)

F maiúsculo representa a função acumulada. P(Z≤z0) é a medida de - infinito até o ponto z0, sendo que esta medida significa a área sob a curva da distribuição normal reduzida (isto é, pega-se o valor direto da tabela; a parte pintada representa a área mensurada).


Na figura abaixo é apresentada a representação gráfica da propriedade deste item:


P(Z≥z0)

Nesta propriedade, têm-se duas formas de representá-la:


1º Caso (usando o complementar): P(Z≥z0) = 1-F(z0) Pelo gráfico pode-se observar que a área total sob a curva = 1, que o F(z0) vai ser a medida que vem de menos infinito até o ponto z0, toma-se a liberdade de tratar até o ponto porque está se falando de uma medida que vem de menos infinito, no sentido acumulado, este F(z0) é a posição que ele está localizado sob a curva da distribuição normal reduzida, então 1 – valor de z0 será a probabilidade procurada.


2º Caso: Como a curva é simétrica em relação à média, e como o sinal de maior está localizado à direita da média, troca-se o sinal de z0, conforme mostrado graficamente.


P(z1 ≤ Z ≤ z2) = F(z2)-F(z1)


Observa-se que F(z2) é medido desde menos infinito () até z2 e, sendo este, igual a maior distância. Já F(z1) também é medido desde - infinito até z1, o qual é a menor distância. Como o objetivo é a área entre z1 ≤ Z ≤ z2, faz-se necessário subtrair a maior área da menor área F(z2)-F(z1) para assim obter-se a área desejada.


Uso da tabela


Os valores de Z apresentam-se com uma parte inteira e duas decimais. Para consultar a tabela é necessário decompor o valor de Z em duas parcelas. A primeira parcela é a parte inteira positiva mais a primeira decimal, as quais ficam localizadas na coluna da parte esquerda da tabela. A segunda parcela é a segunda decimal, que fica localizada na linha superior da tabela. A tabela é simétrica em relação à média de Z, que é zero, logo as posições negativas (-) sob a curva ficam à esquerda da média e as posições positivas (+) sob a curva ficam à direita da média.

Exemplo:

Com base nas propriedades dadas acima, exemplifica-se a utilização da tabela, por intermédio de um resumo da mesma. Para P(Z < -2,13) = F(z), pode-se encontrar a área (probabilidade), como ilustra o esquema seguinte:




Referências: prof. Wesley Almeida, Escola de Negócios, PUCPR NUNES, Elvira Maria Alves; ALMEIDA, Wesley Marcos. Estatística Aplicada Usando Excel. Maringá: EDUEM, 2016.

26 visualizações0 comentário

Posts recentes

Ver tudo

Distribuição Normal no Excel

Conceito abordado: Distribuição Normal Ferramenta utilizada: Microsoft Excel v2016 Quando são fornecidos os valores de x, μ e σ, o Excel...

Distribuição Binomial no Excel

Conceito abordado: Distribuição Binomial Ferramenta utilizada: Microsoft Excel v2016 Quando são fornecidos os valores de x, n e p, o...

Comentarios


bottom of page