Como criar intervalos de confiança a partir do Z Score
Z Score mede o número de desvios-padrão que um determinado valor se afasta da média. Uma distribuição normal padrão, que tem uma média de 0 e um desvio-padrão de 1, pode ajudar-nos a calcular os valores de Z Score facilmente.
Como tínhamos visto anteriormente, é possível criar diversos intervalos de confiança para os resultados a partir da média e do desvio-padrão. Um conceito que nos ajudará a fazer este trabalho é o de Z Score.
Vejamos como. No Excel, vamos usar a fórmula NORM.INV para calcular o inverso da distribuição normal padrão acumulada das probabilidades 2,5% e 97,5%, conforme as imagens abaixo:
Como podemos verificar, os resultados são de -1,96 e 1,96, respetivamente. Isto significa que podemos definir um intervalo de confiança de 95% (a diferença entre 97,5% e 2,5%), com um afastamento de 1,96 desvios-padrão em torno da média.
Ou seja, a probabilidade de um valor aleatório de uma distribuição normal se situar entre Z_0,025 e Z_0,975 é de 95%. Genericamente, podemos formular os limites do intervalo de confiança com as seguintes expressões:
Vejamos um pequeno exemplo para ilustrar melhor este conceito: numa cadeia de restaurantes foi feito um levantamento do número de almoços servidos diariamente durante 100 dias. A média recolhida dessa amostra foi de 5.000 refeições por dia e o desvio-padrão de 400. Para termos 95% de confiança quanto à média de almoços servidos diariamente, que intervalo de valores teremos de usar?
Aplicando as fórmulas acima, teríamos:
Temos 95% de confiança que o número médio de almoços servidos por dia está entre 4.922 e 5.078.
Agora podemos aplicar este conceito ao nosso problema: se a média do resultado operacional de 2021 das 1.000 simulações realizadas for de 44.958 e o desvio-padrão for de 4.433, então, temos 95% de confiança que o resultado se situará entre:
Esta informação é muito mais útil à tomada de decisão. Sabemos que a margem de erro é de €550. Se estivermos dispostos a tolerar este nível de incerteza, então o nosso plano de negócios deve avançar!
Concursos: Qual o preço que vence a concorrência maximizando os lucros?
Em muitos setores de atividade é normal existirem concursos, nos quais diversos concorrentes participam para vencer um contrato, seja uma obra, um projeto de consultoria ou desenvolvimento de software. Além dos fatores qualitativos que caracterizam cada concorrente, o preço é o fator decisivo para determinar quem vence o concurso - como é óbvio, vence aquele cujo preço proposto é mais baixo.
Neste cenário, lidamos com duas variáveis aleatórias que temos interesse em estudar para fixar o preço vencedor:
- Número de concorrentes que vão a concurso,
- Valor do preço proposto de cada concorrente.
A distribuição binomial
A primeira destas variáveis segue uma distribuição de probabilidade binomial. Esta distribuição permite determinar a probabilidade de, em n tentativas, se obter um determinado número de sucessos.
No nosso contexto, queremos saber qual a probabilidade de n concorrentes irem a concurso. Assim, n é o número de concorrentes e sucesso significa avançar para o concurso.
O Excel dispõe de, pelo menos, duas fórmulas que facilitam, muitíssimo, o cálculo deste tipo de probabilidades:
- A fórmula BINOM.DIST, que calcula a probabilidade de um determinado número de eventos serem bem-sucedidos num certo número de tentativas, sabendo-se à partida a probabilidade teórica desse sucesso e
- A fórmula BINOM.INV, que é a fórmula inversa à anterior. Calcula o número acima do qual a distribuição binomial acumulada é igual ou superior a uma determinada probabilidade.
Vamos ver um exemplo: uma fábrica aceita uma encomenda de 100.000 teclados de computador, sob condição de ter, no máximo, 5 produtos defeituosos. O diretor de produção está certo de que a taxa de defeituosos é de 1,5%. O cliente irá recolher uma amostra de 100 unidades. Qual a probabilidade de aceitar a entrega?
Recorremos à fórmula BINOM.DIST para resolver o problema. No primeiro argumento da fórmula, introduzimos o número de “sucessos”, que podemos identificar como o número de teclados que o cliente está disposto a aceitar como defeituosos (5). No segundo, introduzimos o número total de provas, que no problema em causa corresponde ao número de teclados a serem entregues (1.000). No terceiro argumento teremos de introduzir a probabilidade de “sucesso”, ou seja, a taxa de defeituosos, que é 1,5%. Por fim, no último argumento, introduzimos o valor 1 para indicar que procuramos a função de probabilidade acumulada (qualquer valor igual ou inferior será aceite).
Assim, exprimimos a fórmula como: =BINOM.DIST(5;1000;0,015;1). O resultado é 99,59%. Esta é a probabilidade de a encomenda ser revista pelo cliente num lote de 100 unidades e conter um número igual ou inferior a 5 teclados defeituosos.
Para ilustrarmos um exemplo de utilização da segunda fórmula, suponhamos que um vendedor de gelados ambulante sai de manhã para vender gelados na praia. Ele sabe que, em média, a praia tem 1.000 veraneantes e que 10% compram os seus gelados, por dia. Quantos gelados tem que encomendar antes de sair, para que a probabilidade de rutura de stock seja inferior a 5%?
Para resolver este problema, vamos usar a fórmula BINOM.INV. No primeiro argumento, teremos de introduzir 1.000, que corresponde ao número de “tentativas”, aqui entendido como o número de veraneantes. No segundo argumento, teremos 0,1, que corresponde à probabilidade de “sucesso”, ou seja, do número total de veraneantes, quantos compram o gelado. E, por fim, no terceiro argumento, introduzimos 0,95. Este valor é a diferença entre 100% e 5%, que corresponde à probabilidade mínima de quebra pretendida.
Assim, a fórmula será: =BINOM.INV(1000;0,1;0,95), cujo resultado é 116.
Este vendedor ambulante deverá encomendar 116 gelados se pretende aceitar uma taxa de rutura de stock de 5%.