ESTATÍSTICA ADAPTADO PARA O NAPNE Noções de Estatística Podemos entender a Estatística como sendo o método de estudo de comportamento coletivo, cujas conclusões são traduzidas em resultados numéricos. Podemos, intuitivamente, dizer que: Estatística é uma forma de traduzir o comportamento coletivo em números. Observação: Por traduzir o comportamento coletivo em números a estatística é amplamente utilizada fora da matemática como as áreas humanas, educação física, etc. Universo Estatístico ou População Estatística: Conjunto formado por todos os elementos que possam oferecer dados pertinentes ao assunto em questão. Exemplo 1: Um partido político quer saber a tendência do eleitorado quanto a preferência entre dois candidatos à Presidência da República. O Universo Estatístico é o conjunto de todos os eleitores brasileiros. Amostra: É um subconjunto da população estatística. Quando o Universo Estatístico é muito vasto ou quando não é possível coletar dados de todos os seus elementos, retira-se desse universo um subconjunto chamado amostra. Os dados são coletados dessa amostra. Exemplo 2: “Numa pesquisa para saber a intenção de votos para presidente da república, foram ouvidas 400 pessoas...” • Esse grupo de 400 pessoas é uma amostra. • Cada pessoa ouvida nessa pesquisa é uma unidade estatística. • Cada informação numérica obtida nessa pesquisa é um dado estatístico. Rol: É toda sequência de dados numéricos colocados em ordem não decrescente ou não crescente. Exemplo 3: Os 5 alunos de uma amostra apresentam as seguintes notas de matemática: 6; 4; 8; 7; 8 O rol desses resultados é : (4; 6; 7; 8; 8 ) ou (8; 8; 7; 6; 4 ). Frequência absoluta (F): É o número de vezes que um determinado valor é observado na amostra. Frequência total (FT): É a soma de todas as frequências absolutas. Frequência relativa (FR): É o quociente FR = F/ FT ou FR = (F/ FT)*100%. Exemplo 3: Numa turma foram registradas as idades de todos os 25 alunos. Há 5 alunos com 14 anos,10 alunos com 15 anos, 7 alunos com 16 anos e 3 alunos com 17 anos. Qual a frequência absoluta e a frequência relativa do número de alunos de 14 anos, 15 anos, 16 anos e 17 anos? Solução: Frequência total = FT =25 alunos. Alunos de 14 anos: Frequência absoluta: F = 5 Frequência Relativa: FR = (F/ FT)*100 = (5/25)*100% = (1/5)*100% = 20% Alunos de 15 anos: Frequência absoluta: F = 10 Frequência Relativa: FR = (F/ FT)*100 = (10/25)*100% = (2/5)*100% = 40% Alunos de 16 anos: Frequência absoluta: F = 7 Frequência Relativa: FR = (F/ FT)*100 = (7/25)*100% = 28% Alunos de 17 anos: Frequência absoluta: F = 3 Frequência Relativa: FR = (F/ FT)*100 = (3/25)*100% = 12%. Medidas de Centralização: (Média, Mediana, Moda) Média Aritmética: Considere a seguinte a situação. Um aluno do Colégio Pedro II teve as seguintes notas nas três certificações durante o ano letivo: Primeira Certificação: 9,0 Segunda Certificação: 8,0 Terceira Certificação: 1,0 A média aritmética simples (MA) dessas notas é dada por: MA = (9 + 8 + 1) / 3 = 18 / 3 = 6. Obs.: Ter média aritmética simples igual a 6 significa dizer que, apesar de ele ter obtido notas mais altas ou mais baixas nas certificações, a soma das notas (18) é a mesma que ele alcançaria se tivesse obtido nota 6 em todas as certificações. Média Aritmética Ponderada No Colégio Pedro II, como vocês sabem, a média anual é “ponderada”, ou seja, são atribuídos pesos para cada uma das certificações, da seguinte maneira: Primeira Certificação: peso 3 Segunda Certificação: peso 3 Terceira Cerificação: peso 4 Considerando as notas do exemplo anterior, ou seja, Primeira Certificação: 9,0 Segunda Certificação: 8,0 Terceira Certificação: 1,0 ; a média aritmética ponderada (MAP), das notas do exemplo anterior, é calculada da seguinte maneira: MAP = (9*3 + 8*3 + 1*4) / (3+3+4) = (27+24+4) / 10 = 55 / 10 = 5,5. Como a média para ser aprovado “direto”, é igual a 6, esse aluno teria que fazer prova final de verificação. Note que a média aritmética ponderada desse aluno é menor que a média aritmética simples porque ele tirou uma nota muita baixa na certificação que tem o maior peso. Em certas situações a média aritmética ponderada pode aparecer de maneira tão natural que o cálculo é feito sem mencionar, formalmente, o valor dos pesos. Exemplo: Cinco baldes contêm 4 litros de água cada um, três outros 2 litros de água, cada um e, ainda, dois outros contêm 5 litros de água, cada um. Se toda essa água fosse distribuída igualmente em cada um dos baldes, com quantos litros ficaria cada um? Solução: A quantidade de litros que ficaria em cada balde é a média aritmética ponderada: MAP = (4 litros * 5 + 2 litros * 3 + 5 litros * 2) / (5 + 3 + 2) = = (20 litros + 6 litros + 10 litros) / 10 = 36 litros / 10 = 3,6 litros. Ou seja, a quantidade, em litros, de água em cada balde é chamada de média ponderada dos valores 4 litros, 2 litros e 5 litros, com pesos 5; 3 e 2. MEDIANA (ME) Vamos estudar agora uma outra medida de centralização chamada de mediana, que tem vantagens em relação à média aritmética. Considere a seguinte situação: Os salários de 5 pessoas que trabalham em uma empresa são: R$1000,00 ; R$1100,00 ; R$1300,00 ; R$1600,00 e R$20000,00. O salário médio dessas 5 pessoas é: MA = (1000 + 1100 + 1300 + 1600 + 20000) / 5 = 25000 / 5 = 5000 reais. Parece lógico que, neste caso, a média aritmética não é a melhor medida de centralização para representar esse conjunto de dados, pois a maioria dos salários é bem menor que 5000 reais (há quatro trabalhadores que ganham bem menos que a média e somente um que ganha muito acima da média). O salário médio pode dar uma noção distorcida da realidade salarial de um grupo. Em algumas situações a mediana é um número mais representativo. A mediana é o termo central do rol. Logo, escrevendo o rol dos dados numéricos dessa situação, temos: (1000 ; 1100 ; 1300 ; 1600 ; 20000) Logo, o termo central desse rol é “1300”. Então a mediana é ME=1300 ou seja, o salário mediano é igual a 1300 reais. Esse valor é mais representativo que o salário médio porque há dois trabalhadores que ganham menos que 1300 reais e os outros dois ganham acima de 1300 reais. Considere agora que a empresa contratou um novo trabalhador com um salário de R$1.600,00. Nesse caso ficaríamos com um número par de dados numéricos. Como calcular a mediana nessa situação? A mediana, nesse caso, seria a média aritmética dos termos centrais do rol, que agora tem 6 elementos. (1000 ; 1100 ; 1300 ;1600; 1600 ; 20000) Logo a mediana é dada por: ME = (1300 + 1600) / 2 = 1450 reais. Note que esse valor é mais coerente com a realidade salarial que o salário médio. Salário Médio = (1000 + 1100 + 1300 + 1600 +1600 + 20000) / 6 Salário Médio = 26600 / 6 = 4433,33 reais. O salário médio, nessa situação, ainda é superior ao salário de 5 dos 6 funcionários dessa empresa. Generalizando: Se n é ímpar, a mediana é o termo central do rol. Se n é par, a mediana é a média aritmética dos termos centrais do rol. Moda (Mo) Voltemos ao exemplo 3, onde foram registradas as idades de 25 alunos de uma turma. Numa turma foram registradas as idades de todos os 25 alunos. Há 5 alunos com 14 anos,10 alunos com 15 anos, 7 alunos com 16 anos e 3 alunos com 17 anos. Qual a frequência absoluta e a frequência relativa do número de alunos de 14 anos, 15 anos, 16 anos e 17 anos? A idade de maior frequência é a de 15 anos. Por isso dizemos que a Moda dessa amostra é de 15 anos e indicamos Mo = 15. Definição: Em uma amostra cujas frequências dos elementos não são todas iguais, chama-se moda, que se indica por Mo, todo elemento de maior frequência possível. Exemplo 4 Na amostra (3; 4; 7; 3; 7; 9; 7) a moda é Mo = 7 Exemplo 5 Na amostra (9; 9; 5; 7; 10; 22; 1; 10) temos duas modas: Mo = 9 e Mo = 10. (amostra bimodal) Exemplo 6 Na amostra (1; 3; 5; 7; 9) não apresenta moda, pois todos os elementos têm a mesma frequência. Exemplo 7. No rol dos salários (1000; 1100 ; 1300 ;1600; 1600 ; 20000) a moda é M0 = 1600, ou seja, o salário modal é igual a 1600 reais. Exercícios 1) Os salários dos funcionários de uma empresa estão distribuídos da seguinte maneira: Há 5 trabalhadores com salários de 1000 reais, 2 trabalhadores com salários de 2000 reais, 2 trabalhadores com salários de 10000 reais e 1 trabalhador com salário de 50000 reais. Determine o salário médio, o salário mediano e o salário modal. Solução: Salário médio = (1000*5+2000*2+10000*2+50000*1)/(5+2+2+1)= =(5000+4000+20000+50000)/10=79000/10= 7900 reais Salário mediano: fazendo o rol dos salários, temos: (1000; 1000; 1000; 1000; 1000; 2000; 2000; 10000; 10000; 50000) Temos um rol com 10 termos, ou seja, um número par de termos. O salário mediano é a média aritmética dos termos centrais do rol, ou seja, a média aritmética do quinto e do sexto termo do rol. Logo: Salário mediano = (1000 + 2000) / 2 = 3000 / 2 = 1500 reais. Salário modal é o salário mais frequente, ou seja, salário modal = 1000 reais (aparece 5 vezes). 2) (Enem) Depois de jogar um dado em forma de cubo e de faces numeradas de 1 a 6, por 10 vezes consecutivas, e anotar o número obtido em cada jogada, construiu-se a seguinte tabela de distribuição de frequências. Número obtido: 1. Frequência: 4 Número obtido: 2. Frequência: 1 Número obtido: 4. Frequência: 2 Número obtido: 5. Frequência: 2 Número obtido: 6. Frequência: 1 A média, mediana e moda dessa distribuição de frequências são, respectivamente a) 3, 2 e 1 b) 3, 3 e 1 c) 3, 4 e 2 d) 5, 4 e 2 e) 6, 2 e 4 Média = (1*4 + 2*1 + 4*2 + 5*2 + 6*1) / (4+1+2+2+1) = 30/10 = 3 Mediana (ME) Vamos escrever o rol dos valores: ROL: (1;1;1;1;2;4;4;5;5;6) Como o rol tem 10 termos, a mediana é a média aritmética dos termos centrais desse rol, ou seja, o quinto e o sexto termo. Logo, ME = (2+4)/2 = 6/2 = 3 Moda é o número que aparece mais, ou seja, o de maior frequência. Logo, moda = 1 (maior frequência) Opção correta: [B] 3. (Enem) Na tabela, são apresentados dados da cotação mensal do ovo extra branco vendido no atacado, em Brasília, em reais, por caixa de 30 dúzias de ovos, em alguns meses dos anos 2007 e 2008. Mês: Outubro. Cotação R$83,00. Ano 2007 Mês: Novembro. Cotação R$73,10. Ano 2007 Mês: Dezembro. Cotação R$81,60. Ano 2007 Mês: Janeiro. Cotação R$82,00. Ano 2008 Mês: Fevereiro. Cotação R$85,30. Ano 2008 Mês: Março. Cotação R$84,00. Ano 2008 Mês: Abril. Cotação R$84,60. Ano 2008 De acordo com esses dados, o valor da mediana das cotações mensais do ovo extra branco nesse período era igual a a) R$ 73,10. b) R$ 81,50. c) R$ 82,00. d) R$ 83,00. e) R$ 85,30. Solução: CUIDADO: questão fácil, porém perigosa. Temos cinco termos, ou seja, um número ímpar de termos. A mediana é o termo central do rol, ou seja, temos que colocar esses valores em ordem não decrescente ou não crescente. Escrevendo o rol:(73,10; 81,60; 82,00; 83,00; 84,00; 84,60; 85,30). Logo, o termo central de uma sequência de 7 termos é o quarto termo, então: mediana = 83,00(termo central). Opção correta: letra [D]