Artigos

3.4: Medidas de Localização dos Dados


As medidas comuns de localização são quartis e percentis. Os quartis são percentis especiais. O primeiro quartil, Q1, é o mesmo que 25º percentil, e o terceiro quartil, Q3, é o mesmo que 75º percentil. A mediana, M, é chamado de segundo quartil e 50º percentil.

Para calcular quartis e percentis, os dados devem ser ordenados do menor para o maior. Os quartis dividem os dados ordenados em quartos. Os percentis dividem os dados ordenados em centésimos. Para marcar nos 90º percentil de um exame não significa, necessariamente, que você acertou 90% em um teste. Isso significa que 90% das pontuações dos testes são iguais ou menores que a sua pontuação e 10% das pontuações dos testes são iguais ou maiores que a sua pontuação.

Os percentis são úteis para comparar valores. Por esse motivo, as universidades e faculdades usam amplamente os percentis. Uma instância em que faculdades e universidades usam percentis é quando os resultados do SAT são usados ​​para determinar uma pontuação mínima de teste que será usada como um fator de aceitação. Por exemplo, suponha que Duke aceite pontuações SAT iguais ou acima de 75º percentil. Isso se traduz em uma pontuação de pelo menos 1220.

Os percentis são usados ​​principalmente com populações muito grandes. Portanto, se você dissesse que 90% das pontuações do teste são menores (e não iguais ou menores) que sua pontuação, seria aceitável porque remover um determinado valor de dados não é significativo.

O mediana é um número que mede o "centro" dos dados. Você pode pensar na mediana como o "valor médio", mas na verdade não precisa ser um dos valores observados. É um número que separa os dados ordenados em metades. Metade dos valores é o mesmo número ou menor que a mediana e metade dos valores é o mesmo número ou maior. Por exemplo, considere os seguintes dados.

1; 11.5; 6; 7.2; 4; 8; 9; 10; 6.8; 8.3; 2; 2; 10; 1

Ordenado do menor para o maior:

1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5

Como há 14 observações, a mediana está entre o sétimo valor, 6,8, e o oitavo valor, 7,2. Para encontrar a mediana, some os dois valores e divida por dois.

[ dfrac {6,8 + 7,2} {2} = 7 ]

A mediana é sete. Metade dos valores são menores que sete e metade dos valores são maiores que sete.

Quartis são números que separam os dados em trimestres. Os quartis podem ou não fazer parte dos dados. Para encontrar os quartis, primeiro encontre a mediana ou o segundo quartil. O primeiro quartil, Q1, é o valor médio da metade inferior dos dados e o terceiro quartil, Q3, é o valor médio, ou mediana, da metade superior dos dados. Para ter uma ideia, considere o mesmo conjunto de dados:

1; 1; 2; 2; 4; 6; 6.8; 7.2; 8; 8.3; 9; 10; 10; 11.5

A mediana ou segundo quartil é sete. A metade inferior dos dados são 1, 1, 2, 2, 4, 6, 6,8. O valor médio da metade inferior é dois.

1; 1; 2; 2; 4; 6; 6.8

O número dois, que faz parte dos dados, é o primeiro quartil. Um quarto de todos os conjuntos de valores são iguais ou menos que dois e três quartos dos valores são mais que dois.

A metade superior dos dados é 7,2, 8, 8,3, 9, 10, 10, 11,5. O valor médio da metade superior é nove.

O terceiro quartil, Q3, é nove. Três quartos (75%) do conjunto de dados ordenado são menos de nove. Um quarto (25%) do conjunto de dados ordenado é maior que nove. O terceiro quartil faz parte do conjunto de dados neste exemplo.

O intervalo interquartil é um número que indica a propagação da metade do meio ou 50% do meio dos dados. É a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1).

[IQR = Q_3 - Q_1 tag {2.4.1} ]

O IQR pode ajudar a determinar o potencial outliers. Suspeita-se que um valor seja um outlier potencial se for menor que (1,5) (IQR) abaixo do primeiro quartil ou mais do que (1,5) (IQR) acima do terceiro quartil. Os valores discrepantes em potencial sempre exigem uma investigação mais detalhada.

Definição: Outliers

Um outlier potencial é um ponto de dados significativamente diferente dos outros pontos de dados. Esses pontos de dados especiais podem ser erros ou algum tipo de anormalidade ou podem ser a chave para a compreensão dos dados.

Exemplo 2.4.1

Para os 13 preços de imóveis a seguir, calcule o IQR e determinar se os preços são valores discrepantes em potencial. Os preços estão em dólares.

389,950; 230,500; 158,000; 479,000; 639,000; 114,950; 5,500,000; 387,000; 659,000; 529,000; 575,000; 488,800; 1,095,000

Responder

Ordene os dados do menor para o maior.

114,950; 158,000; 230,500; 387,000; 389,950; 479,000; 488,800; 529,000; 575,000; 639,000; 659,000; 1,095,000; 5,500,000

[M = 488.800 não numérico ]

[Q_ {1} = dfrac {230.500 + 387.000} {2} = 308.750 não número ]

[Q_ {3} = dfrac {639.000 + 659.000} {2} = 649.000 não número ]

[IQR = 649.000 - 308.750 = 340.250 não número ]

[(1,5) (IQR) = (1,5) (340.250) = 510.375 não número ]

[Q_ {1} - (1,5) (IQR) = 308.750 - 510.375 = –201.625 não numérico ]

[Q_ {3} + (1,5) (IQR) = 649.000 + 510.375 = 1.159.375 não número ]

Nenhum preço da casa é inferior a –201.625. No entanto, 5.500.000 é mais de 1.159.375. Portanto, 5.500.000 é um potencial ponto fora da curva.

Exercício 2.4.1

Para os 11 salários a seguir, calcule o IQR e determinar se os salários são discrepantes. Os salários são em dólares.

$33,000; $64,500; $28,000; $54,000; $72,000; $68,500; $69,000; $42,000; $54,000; $120,000; $40,500

Responder

Ordene os dados do menor para o maior.

$28,000; $33,000; $40,500; $42,000; $54,000; $54,000; $64,500; $68,500; $69,000; $72,000; $120,000

Mediana = $ 54.000

[Q_ {1} = $ 40.500 não numérico ]

[Q_ {3} = $ 69.000 não numérico ]

[IQR = $ 69.000 - $ 40.500 = $ 28.500 não numérico ]

[(1,5) (IQR) = (1,5) ($ 28.500) = $ 42.750 não numérico ]

[Q_ {1} - (1,5) (IQR) = $ 40.500 - $ 42.750 = - $ 2.250 não numérico ]

[Q_ {3} + (1,5) (IQR) = $ 69.000 + $ 42.750 = $ 111.750 não número ]

Nenhum salário é inferior a - $ 2.250. No entanto, $ 120.000 é mais do que $ 11.750, portanto $ 120.000 é um valor discrepante em potencial.

Exemplo 2.4.2

Para os dois conjuntos de dados no exemplo de pontuação de teste, encontre o seguinte:

  1. O intervalo interquartil. Compare os dois intervalos interquartis.
  2. Quaisquer outliers em qualquer conjunto.

Responder

O resumo de cinco números para as aulas diurnas e noturnas é

MínimoQ1MedianaQ3Máximo
Dia325674.582.599
Noite25.578818998
  1. O IQR para o grupo diurno é (Q_ {3} - Q_ {1} = 82,5 - 56 = 26,5 )

    O IQR para o grupo noturno é (Q_ {3} - Q_ {1} = 89 - 78 = 11 )

    O intervalo interquartil (a propagação ou variabilidade) para a classe diurna é maior do que a classe noturna IQR. Isso sugere que mais variação será encontrada nas pontuações dos testes da aula diurna.

  2. Os valores discrepantes da classe diária são encontrados usando a regra IQR vezes 1,5. Então,
    • (Q_ {1} - IQR (1,5) = 56 - 26,5 (1,5) = 16,25 )
    • (Q_ {3} + IQR (1,5) = 82,5 + 26,5 (1,5) = 122,25 )

    Como os valores mínimo e máximo para a classe diurna são maiores que 16,25 e menores que 122,25, não há outliers.

    Os valores discrepantes da classe noturna são calculados como:

    • (Q_ {1} - IQR (1,5) = 78 - 11 (1,5) = 61,5 )
    • (Q_ {3} + IQR (1,5) = 89 + 11 (1,5) = 105,5 )

    Para esta classe, qualquer pontuação de teste inferior a 61,5 é um valor atípico. Portanto, as pontuações de 45 e 25,5 são outliers. Como nenhuma pontuação de teste é superior a 105,5, não há outlier na extremidade superior.

Exercício 2.4.2

Encontre o intervalo interquartil para os dois conjuntos de dados a seguir e compare-os.

Pontuações de teste para classe UMA

69; 96; 81; 79; 65; 76; 83; 99; 89; 67; 90; 77; 85; 98; 66; 91; 77; 69; 80; 94

Pontuações de teste para classe B

90; 72; 80; 92; 90; 97; 92; 75; 79; 68; 70; 80; 99; 95; 78; 73; 71; 68; 95; 100

Responder

Aula UMA

Ordene os dados do menor para o maior.

65; 66; 67; 69; 69; 76; 77; 77; 79; 80; 81; 83; 85; 89; 90; 91; 94; 96; 98; 99

(Mediana = dfrac {80 + 81} {2} ) = 80,5

(Q_ {1} = dfrac {69 + 76} {2} = 72,5 )

(Q_ {3} = dfrac {90 + 91} {2} = 90,5 )

(IQR = 90,5 - 72,5 = 18 )

Aula B

Ordene os dados do menor para o maior.

68; 68; 70; 71; 72; 73; 75; 78; 79; 80; 80; 90; 90; 92; 92; 95; 95; 97; 99; 100

(Mediana = dfrac {80 + 80} {2} = 80 )

(Q_ {1} = dfrac {72 + 73} {2} = 72,5 )

(Q_ {3} = dfrac {92 + 95} {2} = 93,5 )

(IQR = 93,5 - 72,5 = 21 )

Os dados para a aula B tem um maior IQR, então a pontuação entre Q3 e Q1 (meio 50%) para os dados para a classe B estão mais espalhados e não agrupados na mediana.

Exemplo 2.4.3

Perguntou-se a cinquenta alunos de estatísticas quanto sono eles dormem por noite escolar (arredondado para a hora mais próxima). Os resultados foram:

QUANTIDADE DE SONO POR NOITE ESCOLAR (HORAS)FREQUÊNCIAFREQUÊNCIA RELATIVAFREQUÊNCIA CUMULATIVA RELATIVA
420.040.04
550.100.14
670.140.28
7120.240.52
8140.280.80
970.140.94
1030.061.00

Encontre o 28º percentil. Observe o 0,28 na coluna "frequência relativa cumulativa". Vinte e oito por cento de 50 valores de dados são 14 valores. Existem 14 valores menores que 28º percentil. Eles incluem os dois 4s, os cinco 5s e os sete 6s. Os 28º o percentil está entre os últimos seis e os primeiros sete. Os 28º o percentil é 6,5.

Encontre a mediana. Olhe novamente para a coluna "frequência relativa cumulativa" e encontre 0,52. A mediana é 50º percentil ou segundo quartil. 50% de 50 é 25. Existem 25 valores abaixo da mediana. Eles incluem os dois 4s, os cinco 5s, os sete 6s e onze dos 7s. A mediana ou 50º percentil está entre 25º, ou sete, e 26º, ou sete, valores. A mediana é sete.

Encontre o terceiro quartil. O terceiro quartil é igual ao 75º percentil. Você pode "avaliar" esta resposta. Se você olhar a coluna "frequência relativa cumulativa", encontrará 0,52 e 0,80. Quando você tem todos os quatros, cincos, seis e setes, você tem 52% dos dados. Quando você inclui todos os 8s, você tem 80% dos dados. Os 75º percentil, então, deve ser um oito. Outra maneira de olhar para o problema é encontrar 75% de 50, que é 37,5, e arredondar para 38. O terceiro quartil, Q3, é o 38º valor, que é um oito. Você pode verificar esta resposta contando os valores. (Existem 37 valores abaixo do terceiro quartil e 12 valores acima.)

Exercício 2.4.3

Foi perguntado a 40 motoristas de ônibus quantas horas eles gastam por dia executando suas rotas (arredondado para a hora mais próxima). Encontre os 65º percentil.

Quantidade de tempo gasto na rota (horas)FrequênciaFrequência relativaFrequência Relativa Cumulativa
2120.300.30
3140.350.65
4100.250.90
540.101.00

Responder

Os 65º o percentil está entre os três últimos e os quatro primeiros.

Os 65º o percentil é 3,5.

Exemplo 2.4.4

Tabela de uso:

  1. Encontre os 80º percentil.
  2. Encontre os 90º percentil.
  3. Encontre o primeiro quartil. Qual é outro nome para o primeiro quartil?

Solução

Usando os dados da tabela de frequência, temos:

  1. Os 80º o percentil está entre os últimos oito e os primeiros nove da tabela (entre os 40º e 41st valores). Portanto, precisamos obter a média de 40º um 41st valores. Os 80º percentil (= dfrac {8 + 9} {2} = 8,5 )
  2. Os 90º o percentil será o 45º valor dos dados (a localização é (0,90 (50) = 45 )) e os 45º o valor dos dados é nove.
  3. Q1 também é o 25º percentil. Os 25º cálculo de localização do percentil: (P_ {25} = 0,25 (50) = 12,5 aproximadamente 13 ) o 13º valor dos dados. Assim, o 25º o percentil é seis.

Exercício 2.4.4

Consulte a Tabela. Encontre o terceiro quartil. Qual é outro nome para o terceiro quartil?

Responder

O terceiro quartil é o 75º percentil, que é quatro. Os 65º o percentil está entre três e quatro, e 90º o percentil está entre quatro e 5,75. O terceiro quartil está entre 65 e 90, então deve ser quatro.

ESTATÍSTICAS COLABORATIVAS

Seu instrutor ou um membro da classe perguntará a todos na classe quantos suéteres eles possuem. Responda as seguintes questões:

  1. Quantos alunos foram pesquisados?
  2. Que tipo de amostragem você fez?
  3. Construa dois histogramas diferentes. Para cada um, valor inicial = _____ valor final = ____.
  4. Encontre a mediana, o primeiro quartil e o terceiro quartil.
  5. Construa uma tabela de dados para encontrar o seguinte:
    1. os 10º percentil
    2. os 70º percentil
    3. a porcentagem de alunos que possuem menos de quatro suéteres

Uma fórmula para encontrar o kº percentil

Se você fizesse uma pequena pesquisa, encontraria várias fórmulas para calcular o k-ésimo percentil. Aqui está um deles.

  • (k = ) o percentil k. Pode ou não fazer parte dos dados.
  • (i = ) o índice (classificação ou posição de um valor de dados)
  • (n = ) o número total de dados

Ordene os dados do menor para o maior.

Calcule (i = dfrac {k} {100} (n + 1) )i = k100 (n + 1)

Se (i ) for um inteiro, então o percentil (k ^ {th} ) é o valor dos dados na posição (i ^ {th} ) no conjunto ordenado de dados.

Se (i ) não for um número inteiro, arredonde (i ) para cima e (i ) para baixo para os números inteiros mais próximos. Faça a média dos dois valores de dados nessas duas posições no conjunto de dados ordenado. Isso é mais fácil de entender em um exemplo.

Exemplo 2.4.5

Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

  1. Encontre os 70º percentil.
  2. Encontre o 83rd percentil.

Solução

    • (k = 70 )
    • (i ) = o índice
    • (n = 29 )
    (i = dfrac {k} {100} ) (n + 1) = dfrac {70} {100} (29 + 1) = 21 ). Vinte e um é um número inteiro e o valor dos dados no 21st posição no conjunto de dados ordenado é 64. Os 70º o percentil é 64 anos.
    • (k ) = 83rd percentil
    • (i = o índice )
    • (n = 29 )
    (i = dfrac {k} {100} (n + 1) = ( dfrac {83} {100}) (29 + 1) = 24,9 ), que NÃO é um número inteiro. Arredonde para 24 e até 25. A idade nos 24º a posição é 71 e a idade, 25º posição é 72. Média 71 e 72. A 83rd o percentil é 71,5 anos.

Exercício 2.4.5

Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

Calcule os 20º percentil e o 55º percentil.

Responder

(k = 20 ). Índice (= i = dfrac {k} {100} (n + 1) = dfrac {20} {100} (29 + 1) = 6 ). A idade na sexta posição é 27. Os 20º o percentil é 27 anos.

(k = 55 ). Índice (= i = dfrac {k} {100} (n + 1) = dfrac {55} {100} (29 + 1) = 16,5 ). Arredondar para 16 e até 17. A idade nos 16º a posição é 52 e a idade, 17º posição é 55. A média de 52 e 55 é 53,5. Os 55º o percentil é 53,5 anos.

Nota 2.4.2

Você pode calcular percentis usando calculadoras e computadores. Existem várias calculadoras online.

Uma fórmula para encontrar o percentil de um valor em um conjunto de dados

  • Ordene os dados do menor para o maior.
  • (x = ) o número de valores de dados contando da parte inferior da lista de dados até mas não incluindo o valor de dados para o qual você deseja encontrar o percentil.
  • (y = ) o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil.
  • (n = ) o número total de dados.
  • Calcule ( dfrac {x + 0,5y} {n} (100) ). Em seguida, arredonde para o número inteiro mais próximo.

Exemplo 2.4.6

Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

18; 21; 22; 25; 26; 27; 29; 30; 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

  1. Encontre o percentil para 58.
  2. Encontre o percentil para 25.

Solução

  1. Contando da parte inferior da lista, existem 18 valores de dados menores que 58. Existe um valor de 58.

    (x = 18 ) e (y = 1 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {18 + 0,5 (1)} {29} (100) = 63,80 ). 58 é o 64º percentil.

  2. Contando da parte inferior da lista, há três valores de dados menores que 25. Há um valor de 25.

    (x = 3 ) e (y = 1 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {3 + 0,5 (1)} {29} (100) = 12,07 ). Vinte e cinco é o 12ºpercentil.

Exercício 2.4.6

Estão listadas 30 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

18; 21; 22; 25; 26; 27; 29; 30; 31, 31; 33; 36; 37; 41; 42; 47; 52; 55; 57; 58; 62; 64; 67; 69; 71; 72; 73; 74; 76; 77

Encontre os percentis para 47 e 31.

Responder

Percentil para 47: Contando da parte inferior da lista, há 15 valores de dados menores que 47. Há um valor 47.

(x = 15 ) e (y = 1 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {15 + 0,5 (1)} {29} (100) = 53,45 ). 47 é o 53rd percentil.

Percentil para 31: contando da parte inferior da lista, há oito valores de dados menores que 31. Existem dois valores de 31.

(x = 15 ) e (y = 2 ). ( dfrac {x + 0,5y} {n} (100) = dfrac {15 + 0,5 (2)} {29} (100) = 31,03 ). 31 é o 31st percentil.

Interpretando percentis, quartis e mediana

Um percentil indica a posição relativa de um valor de dados quando os dados são classificados em ordem numérica do menor para o maior. As porcentagens dos valores dos dados são menores ou iguais a pº percentil. Por exemplo, 15% dos valores dos dados são menores ou iguais a 15º percentil.

  • Os percentis baixos sempre correspondem a valores de dados mais baixos.
  • Os percentis altos sempre correspondem a valores de dados mais altos.

Um percentil pode ou não corresponder a um julgamento de valor sobre se é "bom" ou "ruim". A interpretação de se um determinado percentil é "bom" ou "ruim" depende do contexto da situação à qual os dados se aplicam. Em algumas situações, um percentual baixo seria considerado "bom"; em outros contextos, um percentual alto pode ser considerado "bom". Em muitas situações, não há julgamento de valor aplicável.

Entender como interpretar percentis corretamente é importante não apenas ao descrever dados, mas também ao calcular probabilidades em capítulos posteriores deste texto.

DIRETRIZ

Ao escrever a interpretação de um percentil no contexto dos dados fornecidos, a frase deve conter as seguintes informações.

  • informações sobre o contexto da situação que está sendo considerada
  • o valor dos dados (valor da variável) que representa o percentil
  • a porcentagem de indivíduos ou itens com valores de dados abaixo do percentil
  • a porcentagem de indivíduos ou itens com valores de dados acima do percentil.

Exemplo 2.4.7

Em um teste de matemática cronometrado, o primeiro quartil do tempo que levou para terminar o exame foi de 35 minutos. Interprete o primeiro quartil no contexto desta situação.

Responder

  • Vinte e cinco por cento dos alunos concluíram o exame em 35 minutos ou menos.
  • Setenta e cinco por cento dos alunos concluíram o exame em 35 minutos ou mais.
  • Um baixo percentil pode ser considerado bom, pois é desejável terminar mais rapidamente em um exame cronometrado. (Se demorar muito, pode não conseguir terminar.)

Exercício 2.4.7

Para o traço de 100 metros, o terceiro quartil de tempos de finalização da corrida foi de 11,5 segundos. Interprete o terceiro quartil no contexto da situação.

Responder

Vinte e cinco por cento dos corredores terminaram a corrida em 11,5 segundos ou mais. Setenta e cinco por cento dos corredores terminaram a corrida em 11,5 segundos ou menos. Um percentil mais baixo é bom porque terminar uma corrida mais rapidamente é desejável.

Exemplo 2.4.8

Em um teste de matemática de 20 questões, o 70º o percentil para o número de respostas corretas foi 16. Interprete os 70º percentil no contexto desta situação.

Responder

  • Setenta por cento dos alunos responderam a 16 ou menos perguntas corretamente.
  • Trinta por cento dos alunos responderam 16 ou mais perguntas corretamente.
  • Um percentil mais alto pode ser considerado bom, pois é desejável responder a mais perguntas corretamente.

Exercício 2.4.8

Em uma tarefa escrita de 60 pontos, os 80º o percentil para o número de pontos ganhos foi 49. Interprete os 80º percentil no contexto desta situação.

Responder

Oitenta por cento dos alunos ganharam 49 pontos ou menos. Vinte por cento dos alunos ganharam 49 ou mais pontos. Um percentil mais alto é bom porque é desejável obter mais pontos em uma tarefa.

Exemplo 2.4.9

Em uma faculdade comunitária, verificou-se que 30º o percentil de unidades de crédito em que os alunos estão matriculados é de sete unidades. Interprete os 30º percentil no contexto desta situação.

Responder

  • Trinta por cento dos alunos estão matriculados em sete ou menos unidades de crédito.
  • Setenta por cento dos alunos estão matriculados em sete ou mais unidades de crédito.
  • Neste exemplo, não há julgamento de valor "bom" ou "ruim" associado a um percentil mais alto ou mais baixo. Os alunos frequentam a faculdade comunitária por motivos e necessidades variados, e sua carga horária varia de acordo com suas necessidades.

Exercício 2.4.9

Durante uma temporada, os 40º o percentil de pontos marcados por jogador em um jogo é oito. Interprete os 40º percentil no contexto desta situação.

Responder

Quarenta por cento dos jogadores marcaram oito pontos ou menos. Sessenta por cento dos jogadores marcaram oito pontos ou mais. Um percentil mais alto é bom porque é desejável obter mais pontos em um jogo de basquete.

Exemplo 2.4.10

A Sharpe Middle School está se candidatando a uma bolsa que será usada para adicionar equipamentos de ginástica à academia. O diretor entrevistou 15 alunos anônimos para determinar quantos minutos por dia os alunos gastam se exercitando. Os resultados dos 15 alunos anônimos são mostrados.

0 minutos; 40 minutos; 60 minutos; 30 minutos; 60 minutos

10 minutos; 45 minutos; 30 minutos; 300 minutos; 90 minutos;

30 minutos; 120 minutos; 60 minutos; 0 minutos; 20 minutos

Determine os cinco valores a seguir.

  • Min = 0
  • Q1 = 20
  • Med = 40
  • Q3 = 60
  • Máx = 300

Se você fosse o diretor, teria justificativa para comprar um novo equipamento de ginástica? Como 75% dos alunos se exercitam por 60 minutos ou menos diariamente, e desde o IQR é de 40 minutos (60 - 20 = 40), sabemos que metade dos alunos pesquisados ​​exercita-se entre 20 minutos e 60 minutos diariamente. Parece uma quantidade razoável de tempo gasto com exercícios, então o diretor teria uma justificativa para comprar o novo equipamento.

No entanto, o diretor precisa ter cuidado. O valor 300 parece ser um valor discrepante em potencial.

[Q_ {3} + 1,5 (IQR) = 60 + (1,5) (40) = 120 ].

O valor 300 é maior que 120, portanto, é um valor discrepante em potencial. Se o excluirmos e calcularmos os cinco valores, obteremos os seguintes valores:

  • Min = 0
  • Q1 = 20
  • Q3 = 60
  • Máx = 120

Ainda temos 75% dos alunos se exercitando por 60 minutos ou menos diariamente e metade dos alunos se exercitando entre 20 e 60 minutos por dia. No entanto, 15 alunos é uma amostra pequena e o diretor deve pesquisar mais alunos para ter certeza dos resultados de sua pesquisa.

Referências

  1. Cauchon, Dennis, Paul Overberg. “Os dados do censo mostram que as minorias agora são a maioria dos nascimentos nos EUA.” USA Today, 2012. Disponível online em http://usatoday30.usatoday.com/news/...sus/55029100/1 (acessado em 3 de abril de 2013).
  2. Dados do Departamento de Comércio dos Estados Unidos: United States Census Bureau. Disponível online em http://www.census.gov/ (acessado em 3 de abril de 2013).
  3. “Censo de 1990”. Departamento de Comércio dos Estados Unidos: Escritório do Censo dos Estados Unidos. Disponível online em http://www.census.gov/main/www/cen1990.html (acessado em 3 de abril de 2013).
  4. Dados de San Jose Mercury News.
  5. Dados de Revista Time; pesquisa da Yankelovich Partners, Inc.

Revisão do Capítulo

Os valores que dividem um conjunto de dados ordenado por classificação em 100 partes iguais são chamados de percentis. Os percentis são usados ​​para comparar e interpretar dados. Por exemplo, uma observação no 50º o percentil seria maior do que 50 por cento das outras obeservações no conjunto. Os quartis dividem os dados em trimestres. O primeiro quartil (Q1) é o 25º percentil, o segundo quartil (Q2 ou mediana) é 50º percentil, e o terceiro quartil (Q3) é o 75º percentil. O intervalo interquartil, ou IQR, é o intervalo dos 50 por cento intermediários dos valores de dados. O IQR é encontrado subtraindo Q1 a partir de Q3e pode ajudar a determinar valores discrepantes usando as duas expressões a seguir.

  • (Q_ {3} + IQR (1,5) )
  • (Q_ {1} - IQR (1,5) )

Revisão de fórmula

[i = dfrac {k} {100} (n + 1) ]

onde (i ) = a classificação ou posição de um valor de dados,

(k ) = kº percentil,

(n ) = número total de dados.

Expressão para encontrar o percentil de um valor de dados: ( left ( dfrac {x + 0,5y} {n} right ) (100) )

onde (x = ) o número de valores contando da parte inferior da lista de dados até, mas não incluindo o valor de dados para o qual você deseja encontrar o percentil,

(y = ) o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil,

(n = ) número total de dados

Intervalo Interquartil
ou IQR, é o intervalo dos 50 por cento intermediários dos valores de dados; a IQR é encontrado subtraindo o primeiro quartil do terceiro quartil.
Ponto fora da curva
uma observação que não se ajusta ao resto dos dados
Percentil
um número que divide os dados ordenados em centésimos; os percentis podem ou não fazer parte dos dados. A mediana dos dados é o segundo quartil e 50º percentil. O primeiro e o terceiro quartis são os 25º e os 75º percentis, respectivamente.
Quartis
os números que separam os dados em trimestres; quartis podem ou não fazer parte dos dados. O segundo quartil é a mediana dos dados.

3.4: Medidas de Localização dos Dados

A média é o valor mais comumente referido como a média. Usaremos o termo média como sinônimo de média e o termo valor típico para nos referirmos genericamente a medidas de localização.

Este gráfico mostra histogramas para 10.000 números aleatórios gerados a partir de uma distribuição normal, uma exponencial, uma de Cauchy e uma log-normal.

Distribuição normal O primeiro histograma é uma amostra de uma distribuição normal. A média é 0,005, a mediana é -0,010 e o modo é -0,144 (o modo é calculado como o ponto médio do intervalo do histograma com o pico mais alto).

A distribuição normal é uma distribuição simétrica com caudas bem comportadas e um único pico no centro da distribuição. Por simétrico, queremos dizer que a distribuição pode ser dobrada em torno de um eixo de modo que os 2 lados coincidam. Ou seja, ele se comporta da mesma forma à esquerda e à direita de algum ponto central. Para uma distribuição normal, a média, a mediana e a moda são realmente equivalentes. O histograma acima gera estimativas semelhantes para a média, mediana e moda. Portanto, se um histograma ou gráfico de probabilidade normal indica que seus dados são bem aproximados por uma distribuição normal, então é razoável usar a média como estimador de localização. Distribuição Exponencial O segundo histograma é uma amostra de uma distribuição exponencial. A média é 1,001, a mediana é 0,684 e o modo é 0,254 (o modo é calculado como o ponto médio do intervalo do histograma com o pico mais alto).

A distribuição exponencial é enviesada, i. e., distribuição não simétrica. Para distribuições assimétricas, a média e a mediana não são iguais. A média será puxada na direção da distorção. Ou seja, se a cauda direita for mais pesada que a esquerda, a média será maior que a mediana. Da mesma forma, se a cauda esquerda for mais pesada que a direita, a média será menor que a mediana.

Para distribuições distorcidas, não é de todo óbvio se a média, a mediana ou o modo é a medida mais significativa do valor típico. Nesse caso, todas as três medidas são úteis. Distribuição Cauchy O terceiro histograma é uma amostra de uma distribuição de Cauchy. A média é 3,70, a mediana é -0,016 e o ​​modo é -0,362 (o modo é calculado como o ponto médio do intervalo do histograma com o pico mais alto).

Para melhor comparação visual com os outros conjuntos de dados, restringimos o histograma da distribuição de Cauchy a valores entre -10 e 10. O conjunto de dados Cauchy completo na verdade tem um mínimo de aproximadamente -29.000 e um máximo de aproximadamente 89.000.

A distribuição de Cauchy é uma distribuição simétrica com caudas pesadas e um único pico no centro da distribuição. A distribuição de Cauchy tem a propriedade interessante de que coletar mais dados não fornece uma estimativa mais precisa da média. Ou seja, a distribuição amostral da média é equivalente à distribuição amostral dos dados originais. Isso significa que, para a distribuição de Cauchy, a média é inútil como medida do valor típico. Para este histograma, a média de 3,7 está bem acima da grande maioria dos dados. Isso é causado por alguns valores muito extremos na cauda. No entanto, a mediana fornece uma medida útil para o valor típico.

Embora a distribuição de Cauchy seja um caso extremo, ela ilustra a importância de caudas pesadas na medição da média. Valores extremos nas caudas distorcem a média. No entanto, esses valores extremos não distorcem a mediana, pois a mediana é baseada em classificações. Em geral, para dados com valores extremos nas caudas, a mediana fornece uma estimativa de localização melhor do que a média. Distribuição Lognormal O quarto histograma é uma amostra de uma distribuição log-normal. A média é 1,677, a mediana é 0,989 e o modo é 0,680 (o modo é calculado como o ponto médio do intervalo do histograma com o pico mais alto).

O lognormal também é uma distribuição enviesada. Portanto, a média e a mediana não fornecem estimativas semelhantes para o local. Tal como acontece com a distribuição exponencial, não há uma resposta óbvia para a questão de qual é a medida de localização mais significativa. Robustez Existem várias alternativas para a média e mediana para medir a localização. Essas alternativas foram desenvolvidas para tratar de dados não normais, uma vez que a média é um estimador ótimo se de fato seus dados são normais.

    Robustez de validade significa que os intervalos de confiança para a localização da população têm 95% de chance de cobrir a localização da população, independentemente de qual seja a distribuição subjacente.

A mediana é um exemplo de um estimador que tende a ter robustez de validade, mas não robustez de eficiência.


Como determinar medidas de posição (percentis e quartis)

Embora não seja comum usar medidas como percentis e quartis, esses valores são usados ​​para descrever dados em algumas situações, e saber como interpretá-los é benéfico.

o Determine o intervalo de um conjunto de dados

o Saber interpretar e determinar medidas de posição (percentis e quartis)

Embora as medidas de tendência central, dispersão e assimetria sejam freqüentemente usadas em estatísticas, existem outros métodos de caracterizar ou descrever distribuições de dados ou porções que também são comumente usadas. Examinaremos várias dessas medidas estatísticas, algumas das quais você já deve conhecer ou ter visto em outro lugar.

O alcance de um conjunto de dados é simplesmente a diferença entre os valores máximo e mínimo do conjunto. (Esta medida é normalmente considerada uma medida de dispersão, uma vez que é uma descrição simples de até onde os dados se estendem.) Assim, se um conjunto de dados como <x1, x2, x3. xN> é fornecido em ordem crescente para que xeu & lt xeu+1, então o intervalo do conjunto de dados é simplesmente xNx1. Se o conjunto de dados não for solicitado, você deve simplesmente determinar por inspeção os valores máximo e mínimo.

Problema prático:Encontre o intervalo do seguinte conjunto de dados.

Solução: Podemos encontrar o intervalo simplesmente procurando os valores máximo e mínimo ou organizando o conjunto em ordem crescente e, em seguida, subtraindo o primeiro elemento do último. Embora a última abordagem consuma um pouco mais de tempo, pode ser benéfica nos casos em que você precisa realizar outros cálculos. Portanto, vamos ordenar o conjunto de dados para fins de integridade.

O intervalo é então 15 & # 8211 1 = 14.

Quartis e percentis

Praticamente qualquer pessoa que tenha feito um teste padronizado em um momento ou outro está familiarizado com o termo percentil. Embora os percentis pareçam perigosamente semelhantes aos percentuais (ou seja, "porcentagem correta", referindo-se ao número de questões respondidas corretamente dividido pelo número total de questões, todas multiplicadas por 100%), eles são realmente diferentes. Uma medida semelhante é o quartil, que também discutiremos. Os percentis e quartis são estatísticos medidas de posição ou seja, eles não medem uma tendência central ou uma dispersão (dispersão), mas, em vez disso, medem a localização em um conjunto de dados. (A definição exata de um percentil e quartil difere essas diferenças, no entanto, tendem a ser menores e se concentram em certos pontos delicados. Além disso, essas diferenças tendem a desaparecer quando o número de valores de dados no conjunto é grande.)

Vamos considerar um número p, Onde p é um número inteiro entre 0 e 100. Suponha que o número p descreve a porcentagem de valores menores ou iguais a algum valor de dados Np. Consequentemente, 100 & # 8211 p é a porcentagem de valores maior que Np. Este número Np é o pº percentil. Assim, dizer que algum valor de dados x é o 75º percentil significa que 75% de todos os valores no conjunto de dados são menores ou iguais a x, e que 25% dos valores dos dados são maiores que x. Observe que o percentil de um valor de dados também pode ser entendido como 100 vezes a frequência relativa cumulativa desse valor. (Lembre-se de que a frequência relativa cumulativa de um valor x é a frequência relativa de todos os valores menores ou iguais a x.) Portanto, um aluno que obtém uma pontuação de teste no percentil 90, por exemplo, não (necessariamente) acertou 90/100 - ele simplesmente tem uma pontuação que é pelo menos tão boa quanto 90% dos outros alunos . Embora tal descrição não seja necessariamente muito satisfatória para o aluno (que provavelmente está mais interessado em descobrir sua porcentagem de respostas corretas), é estatisticamente útil em certas situações. Normalmente, os percentis 0 e 100 não são discutidos, porque esses valores são simplesmente o mínimo e o máximo (respectivamente) do conjunto de dados.

Problema prático: Para o conjunto de dados abaixo, qual valor está no 75º percentil?

Solução: Queremos encontrar o valor dos dados Np para o qual 75% do conjunto de dados é menor ou igual a Np. Observe que há um total de 16 valores no conjunto, portanto, 75% do conjunto de dados são 12 valores. Como o conjunto de dados está ordenado, precisamos simplesmente encontrar o 12º valor de dados, então 75% (12 de 16 valores) do conjunto de dados será menor ou igual a esse valor. O número 10 é o 75º percentil: 75% dos valores no conjunto são menores ou iguais a 10.

Problema prático: Qual dos seguintes valores de dados é o 50º percentil?

Solução: O 50º percentil é esse valor N para o qual 50% dos valores no conjunto são menores ou iguais a N. Para nos ajudar a encontrar esse valor, vamos primeiro solicitar o conjunto de dados.

O conjunto de dados tem 10 valores, portanto, o 50º percentil é o quinto valor de dados, 5,52. Exatamente metade (50%) dos valores dos dados são menores ou iguais a 5,52 e a metade restante é maior que 5,52.

Outra medida de posição é o quartil, que é semelhante ao percentil, exceto que divide os dados em trimestres (segmentos de 25% cada) em vez de centésimos. Então, o no quartil é o valor x para o qual (25n)% dos valores são menores ou iguais a x. Três quartis são definidos: Q1, Q2 e Q3. O quartil Q1 corresponde ao 25º percentil, Q2 ao 50º percentil e Q3 ao 75º percentil.

Às vezes, diz-se que o Q2 e o 50º percentil correspondem à mediana de um conjunto de dados. Dada a nossa definição de mediana, isso é verdade quando há um número ímpar de valores de dados, não é estritamente verdadeiro para um número par de valores de dados (consulte o problema prático acima) - a mediana, de acordo com nossa definição, seria na verdade a média de 5,52 e 5,97. Poderíamos, entretanto, dizer que esse valor mediano (5,75) é o 50º percentil para o conjunto de dados: tecnicamente, metade dos valores no conjunto de dados está abaixo desse valor e a outra metade acima. Assim, ainda podemos manter nossa definição de mediana se definirmos apropriadamente os percentis e quartis. Além disso, também podemos notar que Q1 é a mediana da primeira metade dos valores e Q3 é a mediana da segunda metade dos valores. (Nossas considerações acima sobre a definição da mediana se aplicam aqui também.)

Problema de prática: Qual é o terceiro trimestre para o seguinte conjunto de dados?

Solução: Q3 é o valor x para os quais 75% (três em quatro) dos valores dos dados são no máximo x. Como há oito membros no conjunto de dados, o sexto valor é Q3-75. Este valor também é o 75º percentil.


Medidas da localização dos dados

Os quartis são percentis especiais. O primeiro quartil, Q1, é o mesmo que o 25º percentil e o terceiro quartil, Q3, é o mesmo que o 75º percentil. A mediana, M, é chamado de segundo quartil e 50º percentil.

Para calcular quartis e percentis, os dados devem ser ordenados do menor para o maior. Os quartis dividem os dados ordenados em quartos. Os percentis dividem os dados ordenados em centésimos. A pontuação no percentil 90 de um exame não significa, necessariamente, que você recebeu 90% em um teste. Isso significa que 90% das pontuações do teste são iguais ou menores que a sua pontuação e 10% das pontuações do teste são iguais ou maiores que a sua pontuação no teste.

Os percentis são úteis para comparar valores. Por esse motivo, as universidades e faculdades usam amplamente os percentis. Uma instância em que faculdades e universidades usam percentis é quando os resultados do SAT são usados ​​para determinar uma pontuação mínima de teste que será usada como um fator de aceitação. Por exemplo, suponha que Duke aceite pontuações SAT iguais ou acima do 75º percentil. Isso se traduz em uma pontuação de pelo menos 1220.

Os percentis são usados ​​principalmente com populações muito grandes. Portanto, se você dissesse que 90% das pontuações do teste são menores (e não iguais ou menores) do que sua pontuação, seria aceitável porque remover um determinado valor de dados não é significativo.

A mediana é um número que mede o & # 8220center & # 8221 dos dados. Você pode pensar na mediana como o & # 8220 valor médio & # 8221, mas na verdade não precisa ser um dos valores observados. É um número que separa os dados ordenados em metades. Metade dos valores é o mesmo número ou menor que a mediana e metade dos valores é o mesmo número ou maior. Por exemplo, considere os seguintes dados.
1 11.5 6 7.2 4 8 9 10 6.8 8.3 2 2 10 1
Ordenado do menor para o maior:
1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

Como há 14 observações, a mediana está entre o sétimo valor, 6,8, e o oitavo valor, 7,2. Para encontrar a mediana, some os dois valores e divida por dois.

A mediana é sete. Metade dos valores são menores que sete e metade dos valores são maiores que sete.

Os quartis são números que separam os dados em trimestres. Os quartis podem ou não fazer parte dos dados. Para encontrar os quartis, primeiro encontre a mediana ou o segundo quartil. O primeiro quartil, Q1, é o valor médio da metade inferior dos dados e o terceiro quartil, Q3, é o valor médio, ou mediana, da metade superior dos dados. Para ter uma ideia, considere o mesmo conjunto de dados:
1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

A mediana ou segundo quartil é sete. A metade inferior dos dados são 1, 1, 2, 2, 4, 6, 6,8. O valor médio da metade inferior é dois.
1 1 2 2 4 6 6.8

O número dois, que faz parte dos dados, é o primeiro quartil. Um quarto de todos os conjuntos de valores são iguais ou menos que dois e três quartos dos valores são mais que dois.

A metade superior dos dados é 7,2, 8, 8,3, 9, 10, 10, 11,5. O valor médio da metade superior é nove.

O terceiro quartil, Q3, é nove. Três quartos (75%) do conjunto de dados ordenado são menos de nove. Um quarto (25%) do conjunto de dados ordenado é maior que nove. O terceiro quartil faz parte do conjunto de dados neste exemplo.

O intervalo interquartil é um número que indica a propagação da metade do meio ou 50% do meio dos dados. É a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1).

O IQR pode ajudar a determinar o potencial outliers. Suspeita-se que um valor seja um outlier potencial se for menor que (1,5) (IQR) abaixo do primeiro quartil ou mais do que (1,5) (IQR) acima do terceiro quartil. Os valores discrepantes em potencial sempre exigem uma investigação mais detalhada.

Um outlier potencial é um ponto de dados significativamente diferente dos outros pontos de dados. Esses pontos de dados especiais podem ser erros ou algum tipo de anormalidade ou podem ser a chave para a compreensão dos dados.

Para os 13 preços de imóveis a seguir, calcule o IQR e determinar se os preços são valores discrepantes em potencial. Os preços estão em dólares.
389,950 230,500 158,000 479,000 639,000 114,950 5,500,000 387,000 659,000 529,000 575,000 488,800 1,095,000

Ordene os dados do menor para o maior.
114,950 158,000 230,500 387,000 389,950 479,000 488,800 529,000 575,000 639,000 659,000 1,095,000 5,500,000

Q1 = = 308,750

Q3 = = 649,000

IQR = 649,000 – 308,750 = 340,250

Nenhum preço da casa é inferior a –201.625. No entanto, 5.500.000 é mais de 1.159.375. Portanto, 5.500.000 é um valor discrepante em potencial.

Para os 11 salários a seguir, calcule o IQR e determinar se os salários são discrepantes. Os salários são em dólares.

?33,000 ?64,500 ?28,000 ?54,000 ?72,000 ?68,500 ?69,000 ?42,000 ?54,000 ?120,000 ?40,500

Para os dois conjuntos de dados no exemplo de pontuação de teste, encontre o seguinte:

  1. O intervalo interquartil. Compare os dois intervalos interquartis.
  2. Quaisquer outliers em qualquer conjunto.

O resumo de cinco números para as aulas diurnas e noturnas é

    O IQR para o grupo diurno é Q3Q1 = 82.5 – 56 = 26.5

O IQR para o grupo noturno é Q3Q1 = 89 – 78 = 11

O intervalo interquartil (a propagação ou variabilidade) para a classe diurna é maior do que a classe noturna IQR. Isso sugere que mais variação será encontrada nas pontuações dos testes da aula diurna.

Como os valores mínimo e máximo para a classe diurna são maiores que 16,25 e menores que 122,25, não há outliers.

Os valores discrepantes da classe noturna são calculados como:

Para esta classe, qualquer pontuação de teste inferior a 61,5 é um valor atípico. Portanto, as pontuações de 45 e 25,5 são outliers. Como nenhuma pontuação de teste é superior a 105,5, não há outlier na extremidade superior.

Encontre o intervalo interquartil para os dois conjuntos de dados a seguir e compare-os.

Pontuações de teste para classe UMA
69 96 81 79 65 76 83 99 89 67 90 77 85 98 66 91 77 69 80 94
Pontuações de teste para classe B
90 72 80 92 90 97 92 75 79 68 70 80 99 95 78 73 71 68 95 100

Perguntou-se a cinquenta alunos de estatísticas quanto sono eles dormem por noite de aula (arredondado para a hora mais próxima). Os resultados foram:

QUANTIDADE DE SONO POR NOITE ESCOLAR (HORAS) FREQUÊNCIA FREQUÊNCIA RELATIVA FREQUÊNCIA CUMULATIVA RELATIVA
4 2 0.04 0.04
5 5 0.10 0.14
6 7 0.14 0.28
7 12 0.24 0.52
8 14 0.28 0.80
9 7 0.14 0.94
10 3 0.06 1.00

Encontre o 28º percentil. Observe o 0,28 na coluna & # 8220 frequência relativa cumulativa & # 8221. Vinte e oito por cento de 50 valores de dados são 14 valores. Existem 14 valores abaixo do 28º percentil. Eles incluem os dois 4s, os cinco 5s e os sete 6s. O 28º percentil está entre os últimos seis e os primeiros sete. O 28º percentil é 6,5.

Encontre a mediana. Olhe novamente para a coluna & # 8220 frequência relativa cumulativa & # 8221 e encontre 0,52. A mediana é o 50º percentil ou o segundo quartil. 50% de 50 é 25. Existem 25 valores abaixo da mediana. Eles incluem os dois 4s, os cinco 5s, os sete 6s e onze dos 7s. A mediana ou 50º percentil está entre o 25º ou sete e o 26º ou sete valores. A mediana é sete.

Encontre o terceiro quartil. O terceiro quartil é igual ao 75º percentil. Você pode & # 8220 assistir & # 8221 esta resposta. Se você olhar a coluna & # 8220 frequência relativa cumulativa & # 8221, encontrará 0,52 e 0,80. Quando você tem todos os quatros, cincos, seis e setes, você tem 52% dos dados. Quando você inclui todos os 8s, você tem 80% dos dados. O 75º percentil, então, deve ser um oito. Outra maneira de olhar para o problema é encontrar 75% de 50, que é 37,5, e arredondar para 38. O terceiro quartil, Q3, é o 38º valor, que é um oito. Você pode verificar esta resposta contando os valores. (Existem 37 valores abaixo do terceiro quartil e 12 valores acima.)

Foi perguntado a 40 motoristas de ônibus quantas horas eles gastam por dia executando suas rotas (arredondado para a hora mais próxima). Encontre o 65º percentil.

Quantidade de tempo gasto na rota (horas) Frequência Frequência relativa Frequência Relativa Cumulativa
2 12 0.30 0.30
3 14 0.35 0.65
4 10 0.25 0.90
5 4 0.10 1.00

  1. Encontre o 80º percentil.
  2. Encontre o 90º percentil.
  3. Encontre o primeiro quartil. Qual é outro nome para o primeiro quartil?

Usando os dados da tabela de frequência, temos:

  1. O 80º percentil está entre os últimos oito e os primeiros nove da tabela (entre os 40º e 41º valores). Portanto, precisamos tirar a média dos 40º e 41º valores. O 80º percentil
  2. O 90º percentil será o 45º valor dos dados (a localização é 0,90 (50) = 45) e o 45º valor dos dados é nove.
  3. Q1 também é o 25º percentil. O cálculo da localização do 25º percentil: P25 = 0,25 (50) = 12,5 ≈ 13 o 13º valor de dados. Portanto, o 25º percentil é seis.

Consulte a (Figura). Encontre o terceiro quartil. Qual é outro nome para o terceiro quartil?

Seu instrutor ou um membro da classe irá perguntar a todos na classe quantos suéteres eles possuem. Responda as seguintes questões:

  1. Quantos alunos foram pesquisados?
  2. Que tipo de amostragem você fez?
  3. Construa dois histogramas diferentes. Para cada um, valor inicial = _____ valor final = ____.
  4. Encontre a mediana, o primeiro quartil e o terceiro quartil.
  5. Construa uma tabela de dados para encontrar o seguinte:
    1. o 10º percentil
    2. o 70º percentil
    3. a porcentagem de alunos que possuem menos de quatro suéteres

    Uma fórmula para encontrar o kº percentil

    Se você fizesse uma pequena pesquisa, encontraria várias fórmulas para calcular o k º percentil. Aqui está um deles.

    k = o k th percentil. Pode ou não fazer parte dos dados.

    eu = o índice (classificação ou posição de um valor de dados)

    n = o número total de dados

    • Ordene os dados do menor para o maior.
    • Calcular
    • Se eu é um inteiro, então o k th percentil é o valor dos dados no eu th posição no conjunto ordenado de dados.
    • Se eu não é um número inteiro, então arredondar eu para cima e redondo eu até os números inteiros mais próximos. Faça a média dos dois valores de dados nessas duas posições no conjunto de dados ordenado. Isso é mais fácil de entender em um exemplo.

    Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.
    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77
    Calcule o 20º percentil e o 55º percentil.

    Você pode calcular percentis usando calculadoras e computadores. Existem várias calculadoras online.

    Uma fórmula para encontrar o percentil de um valor em um conjunto de dados

    • Ordene os dados do menor para o maior.
    • x = o número de valores de dados contando da parte inferior da lista de dados até, mas não incluindo, o valor de dados para o qual você deseja encontrar o percentil.
    • y = o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil.
    • n = o número total de dados.
    • Calcular (100). Em seguida, arredonde para o número inteiro mais próximo.

    Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.
    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    1. Contando da parte inferior da lista, existem 18 valores de dados menores que 58. Existe um valor de 58.

    x = 18 e y = 1.(100) = (100) = 63,80. 58 é o 64º percentil.

    x = 3 e y = 1.(100) = (100) = 12,07. Vinte e cinco é o 12º percentil.

    Estão listadas 30 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

    18 21 22 25 26 27 29 30 31, 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77
    Encontre os percentis para 47 e 31.

    Interpretando percentis, quartis e mediana

    Um percentil indica a posição relativa de um valor de dados quando os dados são classificados em ordem numérica do menor para o maior. As porcentagens dos valores dos dados são menores ou iguais ao p-ésimo percentil. Por exemplo, 15% dos valores dos dados são menores ou iguais ao 15º percentil.

    • Os percentis baixos sempre correspondem a valores de dados mais baixos.
    • Os percentis altos sempre correspondem a valores de dados mais altos.

    Um percentil pode ou não corresponder a um julgamento de valor sobre se é & # 8220bom & # 8221 ou & # 8220 ruim. & # 8221 A interpretação de se um determinado percentil é & # 8220bom & # 8221 ou & # 8220 ruim & # 8221 depende do contexto da situação à qual os dados se aplicam. Em algumas situações, um percentil baixo seria considerado & # 8220bom & # 8221 em outros contextos, um percentil alto pode ser considerado & # 8220bom & # 8221. Em muitas situações, não há julgamento de valor aplicável.

    Entender como interpretar percentis corretamente é importante não apenas ao descrever dados, mas também ao calcular probabilidades em capítulos posteriores deste texto.

    Ao escrever a interpretação de um percentil no contexto dos dados fornecidos, a frase deve conter as seguintes informações.

    • informações sobre o contexto da situação que está sendo considerada
    • o valor dos dados (valor da variável) que representa o percentil
    • a porcentagem de indivíduos ou itens com valores de dados abaixo do percentil
    • a porcentagem de indivíduos ou itens com valores de dados acima do percentil.

    Em um teste de matemática cronometrado, o primeiro quartil do tempo que levou para terminar o exame foi de 35 minutos. Interprete o primeiro quartil no contexto desta situação.

    • Vinte e cinco por cento dos alunos concluíram o exame em 35 minutos ou menos.
    • Setenta e cinco por cento dos alunos concluíram o exame em 35 minutos ou mais.
    • Um baixo percentil pode ser considerado bom, pois é desejável terminar mais rapidamente em um exame cronometrado. (Se demorar muito, pode não conseguir terminar.)

    Para o traço de 100 metros, o terceiro quartil de tempos de finalização da corrida foi de 11,5 segundos. Interprete o terceiro quartil no contexto da situação.

    Em um teste de matemática de 20 perguntas, o 70º percentil para o número de respostas corretas foi 16. Interprete o 70º percentil no contexto desta situação.

    Em uma tarefa escrita de 60 pontos, o 80º percentil para o número de pontos ganhos foi 49. Interprete o 80º percentil no contexto desta situação.

    Em uma faculdade comunitária, verificou-se que o 30º percentil das unidades de crédito em que os alunos estão matriculados é de sete unidades. Interprete o 30º percentil no contexto desta situação.

    Durante uma temporada, o 40º percentil de pontos marcados por jogador em um jogo é oito. Interprete o percentil 40 no contexto dessa situação.

    A Sharpe Middle School está se candidatando a uma bolsa que será usada para adicionar equipamentos de ginástica à academia. O diretor entrevistou 15 alunos anônimos para determinar quantos minutos por dia os alunos gastam se exercitando. Os resultados dos 15 alunos anônimos são mostrados.

    0 minutos 40 minutos 60 minutos 30 minutos 60 minutos

    10 minutos 45 minutos 30 minutos 300 minutos 90 minutos

    30 minutos 120 minutos 60 minutos 0 minutos 20 minutos

    Determine os cinco valores a seguir.

    Se você fosse o diretor, teria justificativa para comprar um novo equipamento de ginástica? Como 75% dos alunos se exercitam por 60 minutos ou menos diariamente, e desde o IQR é de 40 minutos (60 - 20 = 40), sabemos que metade dos alunos pesquisados ​​exercita-se entre 20 minutos e 60 minutos diariamente. Parece uma quantidade razoável de tempo gasto com exercícios, então o diretor teria justificativa para comprar o novo equipamento.

    No entanto, o diretor precisa ter cuidado. O valor 300 parece ser um valor discrepante em potencial.

    O valor 300 é maior que 120, portanto, é um valor discrepante em potencial. Se o excluirmos e calcularmos os cinco valores, obteremos os seguintes valores:

    Ainda temos 75% dos alunos se exercitando por 60 minutos ou menos diariamente e metade dos alunos se exercitando entre 20 e 60 minutos por dia. No entanto, 15 alunos é uma amostra pequena e o diretor deve pesquisar mais alunos para ter certeza dos resultados de sua pesquisa.

    Referências

    Cauchon, Dennis, Paul Overberg. “Os dados do censo mostram que as minorias agora são a maioria dos nascimentos nos EUA.” USA Today, 2012. Disponível online em http://usatoday30.usatoday.com/news/nation/story/2012-05-17/minority-birthscensus/55029100/1 (acessado em 3 de abril de 2013).

    Dados do Departamento de Comércio dos Estados Unidos: United States Census Bureau. Disponível online em http://www.census.gov/ (acessado em 3 de abril de 2013).

    “Censo de 1990”. Departamento de Comércio dos Estados Unidos: Escritório do Censo dos Estados Unidos. Disponível online em http://www.census.gov/main/www/cen1990.html (acessado em 3 de abril de 2013).

    Dados de San Jose Mercury News.

    Dados de Revista Time pesquisa da Yankelovich Partners, Inc.

    Revisão do Capítulo

    Os valores que dividem um conjunto de dados ordenado por classificação em 100 partes iguais são chamados de percentis. Os percentis são usados ​​para comparar e interpretar dados. Por exemplo, uma observação no 50º percentil seria maior do que 50 por cento das outras obeservações no conjunto. Os quartis dividem os dados em trimestres. O primeiro quartil (Q1) é o 25º percentil, o segundo quartil (Q2 ou mediana) é 50º percentil, e o terceiro quartil (Q3) é o 75º percentil. O intervalo interquartil, ou IQR, é o intervalo dos 50 por cento intermediários dos valores de dados. O IQR é encontrado subtraindo Q1 a partir de Q3e pode ajudar a determinar valores discrepantes usando as duas expressões a seguir.

    Revisão de fórmula

    Onde eu = a classificação ou posição de um valor de dados,

    Expressão para encontrar o percentil de um valor de dados: (100)

    Onde x = o número de valores contando da parte inferior da lista de dados até, mas não incluindo o valor de dados para o qual você deseja encontrar o percentil,

    y = o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil,

    Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

    18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    Estão listadas 32 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

    18 18 21 22 25 26 27 29 30 31 31 33 36 37 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

    Jesse ficou em 37º lugar em sua turma de 180 alunos. Em que percentil está a classificação de Jesse?

    Jesse se formou em 37º em uma classe de 180 alunos. Existem 180 - 37 = 143 alunos classificados abaixo de Jesse. Existe uma classificação de 37.

    x = 143 e y = 1. (100) = (100) = 79,72. A classificação de Jesse de 37 o coloca no 80º percentil.

    1. Para os corredores em uma corrida, um tempo baixo significa uma corrida mais rápida. Os vencedores de uma corrida têm os tempos de execução mais curtos. É mais desejável terminar uma corrida com um percentual alto ou baixo?
    2. O 20º percentil de tempos de corrida em uma corrida particular é de 5,2 minutos. Escreva uma frase interpretando o 20º percentil no contexto da situação.
    3. Um ciclista no percentil 90 de uma corrida de bicicleta completou a corrida em 1 hora e 12 minutos. Ele está entre os ciclistas mais rápidos ou mais lentos da corrida? Escreva uma frase interpretando o 90º percentil no contexto da situação.
    1. Para os corredores em uma corrida, uma velocidade mais alta significa uma corrida mais rápida. É mais desejável ter uma velocidade com um percentual alto ou baixo ao correr uma corrida?
    2. O 40º percentil das velocidades em uma corrida específica é de 7,5 milhas por hora. Escreva uma frase interpretando o 40º percentil no contexto da situação.
    1. Para corredores em uma corrida, é mais desejável ter um alto percentual de velocidade. Um percentual alto significa uma velocidade mais alta que é mais rápida.
    2. 40% dos corredores correram a velocidades de 7,5 milhas por hora ou menos (mais lento). 60% dos corredores correram a velocidades de 7,5 milhas por hora ou mais (mais rápido).

    Em um exame, seria mais desejável obter uma nota com um percentil alto ou baixo? Explique.

    Mina está esperando na fila do Departamento de Veículos Automotores (DMV). Seu tempo de espera de 32 minutos é o 85º percentil dos tempos de espera. Isso é bom ou ruim? Escreva uma frase interpretando o 85º percentil no contexto desta situação.

    Ao esperar na fila do DMV, o percentil 85 seria um longo tempo de espera em comparação com as outras pessoas que esperavam. 85% das pessoas tiveram tempos de espera mais curtos do que Mina. Neste contexto, Mina prefere um tempo de espera correspondente a um percentil inferior. 85% das pessoas no DMV esperaram 32 minutos ou menos. 15% das pessoas no DMV esperaram 32 minutos ou mais.

    Em uma pesquisa que coletou dados sobre os salários recebidos por recém-formados, Li descobriu que seu salário estava no 78º percentil. Li deve ficar satisfeito ou chateado com esse resultado? Explique.

    Em um estudo que coleta dados sobre os custos de reparo de danos a automóveis em certo tipo de testes de colisão, certo modelo de carro teve danos de £ 1.700 e estava no percentil 90. O fabricante e o consumidor devem ficar satisfeitos ou chateados com esse resultado? Explique e escreva uma frase que interprete o percentil 90 no contexto deste problema.

    O fabricante e o consumidor ficariam chateados. Este é um grande custo de reparo pelos danos, em comparação com os outros carros da amostra. INTERPRETAÇÃO: 90% dos carros testados em colisão tiveram custos de reparo de danos de 1700 ou menos, apenas 10% tiveram custos de reparo de 1700 ou mais.

    A Universidade da Califórnia tem dois critérios usados ​​para definir os padrões de admissão para calouros a serem admitidos em uma faculdade no sistema da UC:

    1. Os alunos & # 8217 GPAs e pontuações em testes padronizados (SATs e ACTs) são inseridos em uma fórmula que calcula um & # 8220 índice de admissões & # 8221 pontuação. A pontuação do índice de admissão é usada para definir os padrões de elegibilidade destinados a cumprir a meta de admitir os 12% melhores alunos do ensino médio no estado. Nesse contexto, qual percentual os 12% mais ricos representam?
    2. Os alunos cujos GPAs estão no percentil 96 ou acima de todos os alunos de sua escola de segundo grau são elegíveis (chamados de elegíveis no contexto local), mesmo que não estejam entre os 12% melhores do estado. Qual porcentagem de alunos de cada escola secundária são & # 8220elegíveis no contexto local & # 8221?

    Suponha que você esteja comprando uma casa. Você e seu corretor de imóveis determinaram que a casa mais cara que você pode pagar é o 34º percentil. O 34º percentil dos preços das moradias é £ 240.000 na cidade para a qual você deseja se mudar. Nesta cidade, você pode pagar 34% das casas ou 66% das casas?

    Você pode pagar 34% das casas. 66% das casas são muito caras para o seu orçamento. INTERPRETAÇÃO: 34% das casas custam? 240.000 ou menos. 66% das casas custam £ 240.000 ou mais.

    Use as seguintes informações para responder aos próximos seis exercícios. Sessenta e cinco vendedores de carros selecionados aleatoriamente foram questionados sobre o número de carros que geralmente vendem em uma semana. Quatorze pessoas responderam que geralmente vendem três carros dezenove geralmente vendem quatro carros doze geralmente vendem cinco carros nove geralmente vendem seis carros onze geralmente vendem sete carros.


    Medidas da localização dos dados

    Os quartis são percentis especiais. O primeiro quartil, Q1, é o mesmo que o 25º percentil e o terceiro quartil, Q3, é o mesmo que o 75º percentil. A mediana, M, é chamado de segundo quartil e 50º percentil.

    Para calcular quartis e percentis, os dados devem ser ordenados do menor para o maior. Os quartis dividem os dados ordenados em trimestres. Os percentis dividem os dados ordenados em centésimos. A pontuação no 90º percentil de um exame não significa, necessariamente, que você acertou 90% em um teste. Isso significa que 90% das pontuações dos testes são iguais ou inferiores à sua pontuação e 10% das pontuações dos testes são iguais ou superiores à sua pontuação.

    Os percentis são úteis para comparar valores. Por esse motivo, as universidades e faculdades usam amplamente os percentis. Uma instância em que faculdades e universidades usam percentis é quando os resultados do SAT são usados ​​para determinar uma pontuação mínima de teste que será usada como um fator de aceitação. Por exemplo, suponha que Duke aceite pontuações SAT iguais ou acima do 75º percentil. Isso se traduz em uma pontuação de pelo menos 1220.

    Os percentis são usados ​​principalmente com populações muito grandes. Portanto, se você dissesse que 90% das pontuações do teste são menores (e não iguais ou menores) que sua pontuação, seria aceitável porque remover um determinado valor de dados não é significativo.

    O mediana é um número que mede o "centro" dos dados. Você pode pensar na mediana como o "valor médio", mas na verdade não precisa ser um dos valores observados. É um número que separa os dados ordenados em metades. Metade dos valores é o mesmo número ou menor que a mediana e metade dos valores é o mesmo número ou maior. Por exemplo, considere os seguintes dados. * * *

    1 11.5 6 7.2 4 8 9 10 6.8 8.3 2 2 10 1 * * *

    Ordenado do menor para o maior: * * *

    1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

    Como há 14 observações, a mediana está entre o sétimo valor, 6,8, e o oitavo valor, 7,2. Para encontrar a mediana, some os dois valores e divida por dois.

    A mediana é sete. Metade dos valores são menores que sete e metade dos valores são maiores que sete.

    Quartis são números que separam os dados em trimestres. Os quartis podem ou não fazer parte dos dados. Para encontrar os quartis, primeiro encontre a mediana ou o segundo quartil. O primeiro quartil, Q1, é o valor médio da metade inferior dos dados e o terceiro quartil, Q3, é o valor médio, ou mediana, da metade superior dos dados. Para ter uma ideia, considere o mesmo conjunto de dados: * * *

    1 1 2 2 4 6 6.8 7.2 8 8.3 9 10 10 11.5

    A mediana ou segundo quartil é sete. A metade inferior dos dados são 1, 1, 2, 2, 4, 6, 6,8. O valor médio da metade inferior é dois. * * *

    O número dois, que faz parte dos dados, é o primeiro quartil. Um quarto de todos os conjuntos de valores são iguais ou menos que dois e três quartos dos valores são mais que dois.

    A metade superior dos dados é 7,2, 8, 8,3, 9, 10, 10, 11,5. O valor médio da metade superior é nove.

    O terceiro quartil, Q3, é nove. Três quartos (75%) do conjunto de dados ordenado são menos de nove. Um quarto (25%) do conjunto de dados ordenado é maior que nove. O terceiro quartil faz parte do conjunto de dados neste exemplo.

    O intervalo interquartil é um número que indica a propagação da metade do meio ou 50% do meio dos dados. É a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1).

    O IQR pode ajudar a determinar o potencial outliers. Suspeita-se que um valor seja um outlier potencial se for menor que (1,5) (IQR) abaixo do primeiro quartil ou mais do que (1,5) (IQR) acima do terceiro quartil. Os valores discrepantes em potencial sempre exigem uma investigação mais detalhada.

    Um outlier potencial é um ponto de dados significativamente diferente dos outros pontos de dados. Esses pontos de dados especiais podem ser erros ou algum tipo de anormalidade ou podem ser a chave para a compreensão dos dados.

    Para os 13 preços de imóveis a seguir, calcule o IQR e determinar se os preços são valores discrepantes em potencial. Os preços estão em dólares. * * *

    389,950 230,500 158,000 479,000 639,000 114,950 5,500,000 387,000 659,000 529,000 575,000 488,800 1,095,000

    Ordene os dados do menor para o maior. * * *

    114,950 158,000 230,500 387,000 389,950 479,000 488,800 529,000 575,000 639,000 659,000 1,095,000 5,500,000

    IQR = 649,000 – 308,750 = 340,250

    Nenhum preço da casa é inferior a –201.625. No entanto, 5.500.000 é mais de 1.159.375. Portanto, 5.500.000 é um potencial ponto fora da curva.

    Para os 11 salários a seguir, calcule o IQR e determinar se os salários são discrepantes. Os salários são em dólares.

    $33,000 $64,500 $28,000 $54,000 $72,000 $68,500 $69,000 $42,000 $54,000 $120,000 $40,500

    Para os dois conjuntos de dados no exemplo de pontuação de teste, encontre o seguinte:

    1. O intervalo interquartil. Compare os dois intervalos interquartis.
    2. Quaisquer outliers em qualquer conjunto.

    O resumo de cinco números para as aulas diurnas e noturnas é

    O IQR para o grupo diurno é Q3Q1 = 82,5 - 56 = 26,5 O IQR para o grupo noturno é Q3Q1 = 89 – 78 = 11

    O intervalo interquartil (a propagação ou variabilidade) para a classe diurna é maior do que a classe noturna IQR. Isso sugere que mais variação será encontrada nas pontuações dos testes da aula diurna.

    Os valores discrepantes da classe diária são encontrados usando a regra IQR vezes 1,5. Então,

    Como os valores mínimo e máximo para a classe diurna são maiores que 16,25 e menores que 122,25, não há outliers.

    Os valores discrepantes da classe noturna são calculados como:

    Para esta classe, qualquer pontuação de teste inferior a 61,5 é um valor atípico. Portanto, as pontuações de 45 e 25,5 são outliers. Como nenhuma pontuação de teste é maior que 105,5, não há outlier na extremidade superior.

    Encontre o intervalo interquartil para os dois conjuntos de dados a seguir e compare-os.

    69 96 81 79 65 76 83 99 89 67 90 77 85 98 66 91 77 69 80 94 * * *

    90 72 80 92 90 97 92 75 79 68 70 80 99 95 78 73 71 68 95 100

    Perguntou-se a cinquenta alunos de estatísticas quanto sono eles dormem por noite de aula (arredondado para a hora mais próxima). Os resultados foram:

    QUANTIDADE DE SONO POR NOITE ESCOLAR (HORAS) FREQUÊNCIA FREQUÊNCIA RELATIVA FREQUÊNCIA CUMULATIVA RELATIVA
    4 2 0.04 0.04
    5 5 0.10 0.14
    6 7 0.14 0.28
    7 12 0.24 0.52
    8 14 0.28 0.80
    9 7 0.14 0.94
    10 3 0.06 1.00

    Encontre o 28º percentil. Observe o 0,28 na coluna "frequência relativa cumulativa". Vinte e oito por cento de 50 valores de dados são 14 valores. Existem 14 valores abaixo do 28º percentil. Eles incluem os dois 4s, os cinco 5s e os sete 6s. O 28º percentil está entre os últimos seis e os primeiros sete. O 28º percentil é 6,5.

    Encontre a mediana. Olhe novamente para a coluna "frequência relativa cumulativa" e encontre 0,52. A mediana é o 50º percentil ou o segundo quartil. 50% de 50 é 25. Existem 25 valores abaixo da mediana. Eles incluem os dois 4s, os cinco 5s, os sete 6s e onze dos 7s. A mediana ou 50º percentil está entre o 25º ou sete e o 26º ou sete valores. A mediana é sete.

    Encontre o terceiro quartil. O terceiro quartil é igual ao 75º percentil. Você pode "avaliar" esta resposta. Se você olhar a coluna "frequência relativa cumulativa", encontrará 0,52 e 0,80. Quando você tem todos os quatros, cincos, seis e setes, você tem 52% dos dados. Quando você inclui todos os 8s, você tem 80% dos dados. O 75º percentil, então, deve ser um oito. Outra maneira de olhar para o problema é encontrar 75% de 50, que é 37,5, e arredondar para 38. O terceiro quartil, Q3, é o 38º valor, que é um oito. Você pode verificar esta resposta contando os valores. (Existem 37 valores abaixo do terceiro quartil e 12 valores acima.)

    Foi perguntado a 40 motoristas de ônibus quantas horas eles gastam por dia executando suas rotas (arredondado para a hora mais próxima). Encontre o 65º percentil.

    Quantidade de tempo gasto na rota (horas) Frequência Frequência relativa Frequência relativa cumulativa
    2 12 0.30 0.30
    3 14 0.35 0.65
    4 10 0.25 0.90
    5 4 0.10 1.00

    1. Encontre o 80º percentil.
    2. Encontre o 90º percentil.
    3. Encontre o primeiro quartil. Qual é outro nome para o primeiro quartil?

    Usando os dados da tabela de frequência, temos:

    1. O 80º percentil está entre os últimos oito e os primeiros nove da tabela (entre os 40º e 41º valores). Portanto, precisamos tirar a média dos 40º e 41º valores. O 80º percentil = 8 + 9 2 = 8,5
    2. O 90º percentil será o 45º valor dos dados (a localização é 0,90 (50) = 45) e o 45º valor dos dados é nove.
    3. Q1 também é o 25º percentil. O cálculo da localização do 25º percentil: P25 = 0,25 (50) = 12,5 ≈ 13 o 13º valor de dados. Portanto, o 25º percentil é seis.

    Consulte o [link]. Encontre o terceiro quartil. Qual é outro nome para o terceiro quartil?

    Seu instrutor ou um membro da classe perguntará a todos na classe quantos suéteres eles possuem. Responda as seguintes questões:

    1. Quantos alunos foram pesquisados?
    2. Que tipo de amostragem você fez?
    3. Construa dois histogramas diferentes. Para cada um, valor inicial = _ _ _ _ _ valor final = _ _ _ _.
    4. Encontre a mediana, o primeiro quartil e o terceiro quartil.
    5. Construa uma tabela de dados para encontrar o seguinte:
      1. o 10º percentil
      2. o 70º percentil
      3. a porcentagem de alunos que possuem menos de quatro suéteres

      Uma fórmula para encontrar o kº percentil

      Se você fizesse uma pequena pesquisa, encontraria várias fórmulas para calcular o k º percentil. Aqui está um deles.

      k = o k th percentil. Pode ou não fazer parte dos dados.

      eu = o índice (classificação ou posição de um valor de dados)

      n = o número total de dados

      • Ordene os dados do menor para o maior.
      • Calcule i = k 100 (n + 1)
      • Se eu é um inteiro, então o k th percentil é o valor dos dados no eu th posição no conjunto ordenado de dados.
      • Se eu não é um número inteiro, então arredondar eu para cima e redondo eu até os números inteiros mais próximos. Faça a média dos dois valores de dados nessas duas posições no conjunto de dados ordenado. Isso é mais fácil de entender em um exemplo.

      Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior. * * *

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      ) (29 + 1) = 21. Vinte e um é um número inteiro e o valor dos dados na 21ª posição no conjunto de dados ordenado é 64. O 70º percentil é 64 anos.

      ) (29 + 1) = 24,9, que NÃO é um número inteiro. Arredonde para baixo para 24 e até 25. A idade na 24ª posição é 71 e a idade na 25ª posição é 72. Média 71 e 72. O 83º percentil é 71,5 anos.

      Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77 * * *

      Calcule o 20º percentil e o 55º percentil.

      Você pode calcular percentis usando calculadoras e computadores. Existem várias calculadoras online.

      Uma fórmula para encontrar o percentil de um valor em um conjunto de dados

      • Ordene os dados do menor para o maior.
      • x = o número de valores de dados contando da parte inferior da lista de dados até, mas não incluindo, o valor de dados para o qual você deseja encontrar o percentil.
      • y = o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil.
      • n = o número total de dados.
      • Calcule x + 0,5 y n

      (100). Em seguida, arredonde para o número inteiro mais próximo.

      Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior. * * *

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      Contando da parte inferior da lista, existem 18 valores de dados menores que 58. Existe um valor de 58. x = 18 e y = 1. x + 0,5 y n

      (100) = 63,80. 58 é o 64º percentil.

      Contando da parte inferior da lista, há três valores de dados menores que 25. Há um valor de 25. x = 3 e y = 1. x + 0,5 y n

      (100) = 12,07. Vinte e cinco é o 12º percentil.

      Estão listadas 30 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

      18 21 22 25 26 27 29 30 31, 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77 * * *

      Encontre os percentis para 47 e 31.

      Interpretando percentis, quartis e mediana

      Um percentil indica a posição relativa de um valor de dados quando os dados são classificados em ordem numérica do menor para o maior. As porcentagens dos valores dos dados são menores ou iguais ao p-ésimo percentil. Por exemplo, 15% dos valores dos dados são menores ou iguais ao 15º percentil.

      • Os percentis baixos sempre correspondem a valores de dados mais baixos.
      • Os percentis altos sempre correspondem a valores de dados mais altos.

      Um percentil pode ou não corresponder a um julgamento de valor sobre se é "bom" ou "ruim". A interpretação de se um determinado percentil é "bom" ou "ruim" depende do contexto da situação à qual os dados se aplicam. Em algumas situações, um percentil baixo seria considerado "bom" em outros contextos, um percentil alto pode ser considerado "bom". Em muitas situações, não há julgamento de valor aplicável.

      Entender como interpretar percentis corretamente é importante não apenas ao descrever dados, mas também ao calcular probabilidades em capítulos posteriores deste texto.

      Ao escrever a interpretação de um percentil no contexto dos dados fornecidos, a frase deve conter as seguintes informações.

      • informações sobre o contexto da situação que está sendo considerada
      • o valor dos dados (valor da variável) que representa o percentil
      • a porcentagem de indivíduos ou itens com valores de dados abaixo do percentil
      • a porcentagem de indivíduos ou itens com valores de dados acima do percentil.

      Em um teste de matemática cronometrado, o primeiro quartil do tempo que levou para terminar o exame foi de 35 minutos. Interprete o primeiro quartil no contexto desta situação.

      • Vinte e cinco por cento dos alunos concluíram o exame em 35 minutos ou menos.
      • Setenta e cinco por cento dos alunos concluíram o exame em 35 minutos ou mais.
      • Um baixo percentil pode ser considerado bom, pois é desejável terminar mais rapidamente em um exame cronometrado. (Se demorar muito, pode não conseguir terminar.)

      Para o traço de 100 metros, o terceiro quartil de tempos de finalização da corrida foi de 11,5 segundos. Interprete o terceiro quartil no contexto da situação.

      Em um teste de matemática de 20 perguntas, o 70º percentil para o número de respostas corretas foi 16. Interprete o 70º percentil no contexto desta situação.

      Em uma tarefa escrita de 60 pontos, o 80º percentil para o número de pontos ganhos foi 49. Interprete o 80º percentil no contexto desta situação.

      Em uma faculdade comunitária, verificou-se que o 30º percentil das unidades de crédito em que os alunos estão matriculados é de sete unidades. Interprete o 30º percentil no contexto desta situação.

      Durante uma temporada, o 40º percentil de pontos marcados por jogador em um jogo é oito. Interprete o 40º percentil no contexto desta situação.

      A Sharpe Middle School está se candidatando a uma bolsa que será usada para adicionar equipamentos de ginástica à academia. O diretor entrevistou 15 alunos anônimos para determinar quantos minutos por dia os alunos gastam se exercitando. Os resultados dos 15 alunos anônimos são mostrados.

      0 minutos 40 minutos 60 minutos 30 minutos 60 minutos

      10 minutos 45 minutos 30 minutos 300 minutos 90 minutos

      30 minutos 120 minutos 60 minutos 0 minutos 20 minutos

      Determine os cinco valores a seguir.

      Se você fosse o diretor, teria justificativa para comprar um novo equipamento de ginástica? Como 75% dos alunos se exercitam por 60 minutos ou menos diariamente, e desde o IQR é de 40 minutos (60 - 20 = 40), sabemos que metade dos alunos pesquisados ​​exercita-se entre 20 minutos e 60 minutos diariamente. Parece uma quantidade razoável de tempo gasto com exercícios, então o diretor teria uma justificativa para comprar o novo equipamento.

      No entanto, o diretor precisa ter cuidado. O valor 300 parece ser um valor discrepante em potencial.

      O valor 300 é maior que 120, portanto, é um valor discrepante em potencial. Se o excluirmos e calcularmos os cinco valores, obteremos os seguintes valores:

      Ainda temos 75% dos alunos se exercitando por 60 minutos ou menos diariamente e metade dos alunos se exercitando entre 20 e 60 minutos por dia. No entanto, 15 alunos é uma amostra pequena e o diretor deve pesquisar mais alunos para ter certeza dos resultados de sua pesquisa.

      Referências

      Cauchon, Dennis, Paul Overberg.“Os dados do censo mostram que as minorias agora são a maioria dos nascimentos nos EUA.” USA Today, 2012. Disponível online em http://usatoday30.usatoday.com/news/nation/story/2012-05-17/minority-birthscensus/55029100/1 (acessado em 3 de abril de 2013).

      Dados do Departamento de Comércio dos Estados Unidos: United States Census Bureau. Disponível online em http://www.census.gov/ (acessado em 3 de abril de 2013).

      “Censo de 1990”. Departamento de Comércio dos Estados Unidos: Escritório do Censo dos Estados Unidos. Disponível online em http://www.census.gov/main/www/cen1990.html (acessado em 3 de abril de 2013).

      Dados de San Jose Mercury News.

      Dados de Revista Time pesquisa da Yankelovich Partners, Inc.

      Revisão do Capítulo

      Os valores que dividem um conjunto de dados ordenado por classificação em 100 partes iguais são chamados de percentis. Os percentis são usados ​​para comparar e interpretar dados. Por exemplo, uma observação no 50º percentil seria maior do que 50 por cento das outras obeservações no conjunto. Os quartis dividem os dados em trimestres. O primeiro quartil (Q1) é o 25º percentil, o segundo quartil (Q2 ou mediana) é 50º percentil, e o terceiro quartil (Q3) é o 75º percentil. O intervalo interquartil, ou IQR, é o intervalo dos 50 por cento intermediários dos valores de dados. O IQR é encontrado subtraindo Q1 a partir de Q3e pode ajudar a determinar valores discrepantes usando as duas expressões a seguir.

      Revisão de fórmula

      Onde eu = a classificação ou posição de um valor de dados,

      Expressão para encontrar o percentil de um valor de dados: (x + 0,5 y n)

      Onde x = o número de valores contando da parte inferior da lista de dados até, mas não incluindo o valor de dados para o qual você deseja encontrar o percentil,

      y = o número de valores de dados igual ao valor de dados para o qual você deseja encontrar o percentil,

      Estão listados 29 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

      18 21 22 25 26 27 29 30 31 33 36 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      Estão listadas 32 idades para os melhores atores vencedores do Oscar em ordem do menor para o maior.

      18 18 21 22 25 26 27 29 30 31 31 33 36 37 37 41 42 47 52 55 57 58 62 64 67 69 71 72 73 74 76 77

      Jesse ficou em 37º lugar em sua turma de 180 alunos. Em que percentil está a classificação de Jesse?

      Jesse se formou em 37º em uma classe de 180 alunos. Existem 180 - 37 = 143 alunos classificados abaixo de Jesse. Existe uma classificação de 37.

      x = 143 e y = 1. x + 0,5 y n

      (100) = 79,72. A classificação de Jesse de 37 o coloca no 80º percentil.

      1. Para os corredores em uma corrida, um tempo baixo significa uma corrida mais rápida. Os vencedores de uma corrida têm os tempos de execução mais curtos. É mais desejável ter um tempo de chegada com um percentil alto ou baixo ao participar de uma corrida?
      2. O 20º percentil de tempos de corrida em uma corrida particular é de 5,2 minutos. Escreva uma frase interpretando o 20º percentil no contexto da situação.
      3. Um ciclista no percentil 90 de uma corrida de bicicleta completou a corrida em 1 hora e 12 minutos. Ele está entre os ciclistas mais rápidos ou mais lentos da corrida? Escreva uma frase interpretando o 90º percentil no contexto da situação.
      1. Para os corredores em uma corrida, uma velocidade mais alta significa uma corrida mais rápida. É mais desejável ter uma velocidade com um percentual alto ou baixo ao correr uma corrida?
      2. O 40º percentil das velocidades em uma corrida específica é de 7,5 milhas por hora. Escreva uma frase interpretando o 40º percentil no contexto da situação.
      1. Para corredores em uma corrida, é mais desejável ter um alto percentual de velocidade. Um percentual alto significa uma velocidade mais alta que é mais rápida.
      2. 40% dos corredores correram a velocidades de 7,5 milhas por hora ou menos (mais lento). 60% dos corredores correram a velocidades de 7,5 milhas por hora ou mais (mais rápido).

      Em um exame, seria mais desejável obter uma nota com um percentil alto ou baixo? Explique.

      Mina está esperando na fila do Departamento de Veículos Automotores (DMV). Seu tempo de espera de 32 minutos é o 85º percentil dos tempos de espera. Isso é bom ou ruim? Escreva uma frase interpretando o 85º percentil no contexto desta situação.

      Ao esperar na fila do DMV, o percentil 85 seria um longo tempo de espera em comparação com as outras pessoas que esperavam. 85% das pessoas tiveram tempos de espera mais curtos do que Mina. Neste contexto, Mina prefere um tempo de espera correspondente a um percentil inferior. 85% das pessoas no DMV esperaram 32 minutos ou menos. 15% das pessoas no DMV esperaram 32 minutos ou mais.

      Em uma pesquisa que coletou dados sobre os salários recebidos por recém-formados, Li descobriu que seu salário estava no 78º percentil. Li deve ficar satisfeito ou chateado com esse resultado? Explique.

      Em um estudo que coleta dados sobre os custos de reparo de danos a automóveis em certo tipo de testes de colisão, certo modelo de carro teve danos de US $ 1.700 e estava no percentil 90. O fabricante e o consumidor devem ficar satisfeitos ou chateados com esse resultado? Explique e escreva uma frase que interprete o percentil 90 no contexto deste problema.

      O fabricante e o consumidor ficariam chateados. Este é um grande custo de reparo pelos danos, em comparação com os outros carros da amostra. INTERPRETAÇÃO: 90% dos carros testados em colisão tiveram custos de reparo de danos de $ 1700 ou menos, apenas 10% tiveram custos de reparo de danos de $ 1700 ou mais.

      A Universidade da Califórnia tem dois critérios usados ​​para definir os padrões de admissão para calouros a serem admitidos em uma faculdade no sistema da UC:

      1. Os GPAs e pontuações dos alunos em testes padronizados (SATs e ACTs) são inseridos em uma fórmula que calcula uma pontuação de "índice de admissão". A pontuação do índice de admissão é usada para definir os padrões de elegibilidade destinados a cumprir a meta de admitir os 12% melhores alunos do ensino médio no estado. Nesse contexto, qual percentual os 12% mais ricos representam?
      2. Os alunos cujos GPAs estão no percentil 96 ou acima de todos os alunos de sua escola de segundo grau são elegíveis (chamados de elegíveis no contexto local), mesmo que não estejam entre os 12% melhores do estado. Qual porcentagem de alunos de cada escola secundária são “elegíveis no contexto local”?

      Suponha que você esteja comprando uma casa. Você e seu corretor de imóveis determinaram que a casa mais cara que você pode pagar é o 34º percentil. O 34º percentil dos preços das moradias é de US $ 240.000 na cidade para a qual você deseja se mudar. Nesta cidade, você pode pagar 34% das casas ou 66% das casas?

      Você pode pagar 34% das casas. 66% das casas são muito caras para o seu orçamento. INTERPRETAÇÃO: 34% das casas custam $ 240.000 ou menos. 66% das casas custam $ 240.000 ou mais.

      Use as seguintes informações para responder aos próximos seis exercícios. Sessenta e cinco vendedores de carros selecionados aleatoriamente foram questionados sobre o número de carros que geralmente vendem em uma semana. Quatorze pessoas responderam que geralmente vendem três carros dezenove geralmente vendem quatro carros doze geralmente vendem cinco carros nove geralmente vendem seis carros onze geralmente vendem sete carros.


      3.4: Medidas de Localização dos Dados


      Q-1- Medidas da localização dos dados

      • eu. Identifique o tipo de dados (quantitativos - discretos, quantitativos - contínuos ou qualitativos) que seriam usados ​​para descrever uma resposta.
      • ii. Dê um exemplo dos dados.
      • uma. Número de ingressos vendidos para um show
      • b. Quantidade de gordura corporal
      • c. Time de beisebol favorito
      • d. Tempo na fila para comprar mantimentos
      • e. Número de alunos matriculados na Evergreen Valley College
      • f. Mos & # 8211 assistiu ao programa de televisão
      • g. Marca de pasta de dente
      • h. Distância do cinema mais próximo
      • eu. Idade dos executivos em empresas Fortune 500
      • j. Número de pacotes de software de planilha de computador concorrentes
      • uma. quantitativo - discreto
      • b. quantitativo - contínuo
      • c. qualitativo
      • d. quantitativo - contínuo
      • e. quantitativo - discreto
      • f. qualitativo
      • g. qualitativo
      • h. quantitativo - contínuo
      • eu. quantitativo - contínuo
      • j. quantitativo - discreto

      Perguntou-se a cinquenta alunos em tempo parcial quantos cursos eles estavam cursando neste semestre. Os resultados (incompletos) são mostrados abaixo:

      • uma. Preencha os espaços em branco da tabela acima.
      • b. Qual porcentagem de alunos faz exatamente dois cursos?
      • c. Que porcentagem de alunos faz um ou dois cursos?

      Perguntou-se a 60 adultos com doenças gengivais quantas vezes por semana usavam fio dental antes do diagnóstico. Os resultados (incompletos) são mostrados abaixo:

      • uma. Preencha os espaços em branco da tabela acima.
      • b. Qual é a porcentagem de adultos que usam fio dental seis vezes por semana?
      • c. Qual a porcentagem de uso do fio dental no máximo três vezes por semana?

      Um centro de fitness está interessado na quantidade média de tempo que um cliente se exercita no centro a cada semana. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados

      As estações de esqui estão interessadas na idade média em que as crianças fazem as primeiras aulas de esqui e snowboard. Eles precisam dessas informações para planejar de forma otimizada suas aulas de esqui. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados
      • uma. Crianças que fazem aulas de esqui ou snowboard
      • b. Um grupo dessas crianças
      • c. A média da população
      • d. A média da amostra
      • e. X = a idade de uma criança que faz a primeira aula de esqui ou snowboard
      • f. Um valor para X, como 3, 7, etc.

      Um cardiologista está interessado no período médio de recuperação de seus pacientes que tiveram ataques cardíacos. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados

      As seguradoras estão interessadas nos custos médios de saúde de seus clientes a cada ano, para que possam determinar os custos do seguro saúde. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados
      • uma. Os clientes das seguradoras
      • b. Um grupo de clientes
      • c. Os custos médios de saúde dos clientes
      • d. Os custos médios de saúde da amostra
      • e. X = os custos de saúde de um cliente
      • f. Um valor para X, como 34, 9, 82, etc.

      Um político está interessado na proporção de eleitores em seu distrito que pensam que ele está fazendo um bom trabalho. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados

      Uma conselheira matrimonial está interessada na proporção de clientes que aconselha que permanecem casados. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados
      • uma. Todos os clientes do conselheiro
      • b. Um grupo de clientes
      • c. A proporção de todos os seus clientes que permanecem casados
      • d. A proporção da amostra que permanece casada
      • e. X = o número de casais que permanecem casados
      • f. sim não

      Pesquisadores políticos podem estar interessados ​​na proporção de pessoas que votarão em uma causa específica. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados

      Uma empresa de marketing está interessada na proporção de pessoas que comprarão um determinado produto. Defina o seguinte em termos do estudo. Dê exemplos quando apropriado.

      • uma. População
      • b. Amostra
      • c. Parâmetro
      • d. Estatística
      • e. Variável
      • f. Dados
      • uma. Todas as pessoas (talvez em uma determinada área geográfica, como os Estados Unidos)
      • b. Um grupo de pessoas
      • c. A proporção de todas as pessoas que comprarão o produto
      • d. A proporção da amostra que comprará o produto
      • e. X = o número de pessoas que irão comprá-lo
      • f. compre, não compre

      As companhias aéreas estão interessadas na consistência do número de bebês em cada voo, para que tenham equipamentos de segurança adequados. Suponha que uma companhia aérea faça uma pesquisa. No fim de semana de Ação de Graças, ele pesquisa 6 voos de Boston a Salt Lake City para determinar o número de bebês nos voos. Ele determina a quantidade de equipamento de segurança necessária para o resultado desse estudo.

      • uma. Usando frases completas, liste três coisas erradas na maneira como a pesquisa foi conduzida.
      • b. Usando frases completas, liste três maneiras de melhorar a pesquisa se ela fosse repetida.

      Suponha que você queira determinar o número médio de alunos por aula de estatística em seu estado. Descreva um possível método de amostragem em 3 e # 8211 5 frases completas. Faça a descrição detalhada.

      Suponha que você queira determinar o número médio de latas de refrigerante consumidas por mês por pessoas na casa dos 20 anos. Descreva um possível método de amostragem em 3 - 5 sentenças completas. Faça a descrição detalhada.

      726 alunos de ensino à distância no Long Beach City College no ano letivo de 2004-2005 foram entrevistados e questionados sobre os motivos pelos quais fizeram um curso de ensino à distância. (Fonte: Amit Schitai, Diretor de Tecnologia Instrucional e Ensino à Distância, LBCC). Os resultados desta pesquisa estão listados na tabela a seguir.

      Razões para fazer cursos de ensino à distância da LBCC
      Conveniência 87.6%
      Incapaz de vir ao campus 85.1%
      Fazer cursos no campus, além do meu curso DL 71.7%
      O instrutor tem uma boa reputação 69.1%
      Para cumprir os requisitos de transferência 60.8%
      Para cumprir os requisitos para o grau de associado 53.6%
      Achei que DE seria mais variado e interessante 53.2%
      Eu gosto de tecnologia de computador 52.1%
      Teve sucesso com o curso DL anterior 52.0%
      As seções no campus estavam cheias 42.1%
      Para cumprir os requisitos de certificação vocacional 27.1%
      Por causa da deficiência 20.5%

      Suponha que a pesquisa permitiu que os alunos escolhessem uma das respostas listadas na tabela acima.

      • uma. Por que as porcentagens podem somar mais de 100%?
      • b. Isso implica necessariamente um erro no relatório?
      • c. Como você acha que a pergunta foi formulada para obter respostas que totalizaram mais de 100%?
      • d. Como a pergunta pode ser formulada para obter respostas que totalizem 100%?

      Dezenove imigrantes nos EUA foram questionados por quantos anos, até o ano mais próximo, eles viveram nos EUA. Os dados são os seguintes:

      2 5 7 2 2 10 20 15 0 7 0 20 5 12 15 12 4 5 10

      A seguinte tabela foi produzida:

      • uma. Corrija os erros da mesa. Além disso, explique como alguém pode ter chegado ao (s) número (s) incorreto (s).
      • b. Explique o que há de errado com esta declaração: & # 822047 por cento das pessoas pesquisadas viveram nos EUA por 5 anos & # 8221
      • c. Corrija a afirmação acima para torná-la correta.
      • d. Qual fração das pessoas pesquisadas morou nos EUA por 5 ou 7 anos?
      • e. Qual fração das pessoas pesquisadas moram nos EUA há no máximo 12 anos?
      • f. Qual fração das pessoas pesquisadas viveu nos EUA há menos de 12 anos?
      • g. Qual fração das pessoas pesquisadas viveu nos EUA de 5 a 20 anos, inclusive?

      Uma & # 8220 pesquisa aleatória & # 8221 foi conduzida com 3.274 pessoas da & # 8220 microprocessador geração & # 8221 (pessoas nascidas desde 1971, o ano em que o microprocessador foi inventado). Foi relatado que 48% dos indivíduos pesquisados ​​afirmaram que, se tivessem US $ 2.000 para gastar, eles os usariam para equipamentos de informática. Além disso, 66% dos entrevistados se consideram usuários de computador relativamente experientes. (Fonte: San Jose Mercury News)

      • uma. Você considera o tamanho da amostra grande o suficiente para um estudo desse tipo? Por que ou por que não?
      • b. Com base em seu & # 8220gut pressentimento & # 8221, você acredita que as porcentagens refletem com precisão a população dos EUA para os indivíduos nascidos desde 1971? Se não, você acha que as porcentagens da população são realmente maiores ou menores do que as estatísticas da amostra? Por quê?

      Informações adicionais: a pesquisa foi relatada pela Intel Corporation com indivíduos que visitaram o Centro de Convenções de Los Angeles para ver o road show do Smithsonian Institure chamado & # 8220Americ & # 8217s Smithsonian & # 8221

      • c. Com essas informações adicionais, você acha que todos os grupos demográficos e étnicos estiveram igualmente representados no evento? Por que ou por que não?
      • d. Com as informações adicionais, comente sobre a precisão com que você acha que as estatísticas da amostra refletem os parâmetros da população.
      • uma. Liste algumas dificuldades práticas envolvidas na obtenção de resultados precisos de uma pesquisa por telefone.
      • b. Liste algumas dificuldades práticas envolvidas na obtenção de resultados precisos de uma pesquisa enviada pelo correio.
      • c. Com seus colegas de classe, pense em algumas maneiras de superar esses problemas se você precisar realizar uma pesquisa por telefone ou correio.

      Experimente estas questões de múltipla escolha

      As próximas quatro perguntas referem-se ao seguinte: Um instrutor do Lake Tahoe Community College está interessado no número médio de dias que os alunos de matemática do Lake Tahoe Community College faltam às aulas durante um trimestre.

      Qual é a população em que ela está interessada?

      • A. Todos os alunos do Lake Tahoe Community College
      • B. Todos os alunos de inglês do Lake Tahoe Community College
      • C. Todos os alunos do Lake Tahoe Community College em suas turmas
      • D. Todos os alunos de matemática do Lake Tahoe Community College

      X = número de dias que um aluno de matemática do Lake Tahoe Community College está ausente

      Nesse caso, X é um exemplo de:

      O instrutor obtém sua amostra reunindo dados sobre 5 alunos selecionados aleatoriamente de cada aula de matemática do Lake Tahoe Community College. O tipo de amostra que ela usou é

      • A. Amostragem de cluster
      • B. Amostragem estratificada
      • C. Amostragem aleatória simples
      • D. Amostragem de conveniência

      A amostra instructo & # 8217s produz um número médio de dias ausentes de 3,5 dias. Este valor é um exemplo de um

      As próximas duas perguntas referem-se à seguinte tabela de frequência relativa em furacões que atingiram diretamente os EUA entre 1851 e 2004. Os furacões recebem uma classificação de categoria de força com base na velocidade mínima do vento gerada pela tempestade. (http://www.nhc.noaa.gov/gifs/table5.gif)

      Frequência de ataques diretos de furacão
      Categoria Número de acertos diretos Frequência relativa Frequência acumulativa
      Total = 273
      1 109 0.3993 0.3993
      2 72 0.2637 0.6630
      3 71 0.2601
      4 18 0.9890
      5 3 0.0110 1.0000

      Qual é a frequência relativa de ataques diretos que foram furacões de categoria 4?

      Qual é a frequência relativa de acessos diretos que foram, NO MÍNIMO, uma tempestade de categoria 3?

      As próximas três questões referem-se ao seguinte: Um estudo foi feito para determinar a idade, o número de vezes por semana e a duração (quantidade de tempo) de uso residente de um parque local em San Jose. A primeira casa na vizinhança ao redor do parque foi selecionada aleatoriamente e, em seguida, a cada oito casas na vizinhança ao redor do parque foi entrevistada.

      & # 8216Número de vezes por semana & # 8217 é que tipo de dados?

      & # 8216Duração (quantidade de tempo & # 8217 é que tipo de dados?

      [A sua opinião é importante para nós. Se você tiver um comentário, correção ou pergunta relacionada a este capítulo, envie-o para a pessoa apropriada listada nas informações de contato ou visite os fóruns deste curso.]


      Introdução

      As medidas comuns de localização são quartis e percentis.

      Os quartis são percentis especiais. O primeiro quartil, Q1, é o mesmo que o 25º percentil e o terceiro quartil, Q3, é o mesmo que o 75º percentil. A mediana, M, é chamado de segundo quartil e 50º percentil.

      Para calcular quartis e percentis, você deve ordenar os dados do menor para o maior. Os quartis dividem os dados ordenados em trimestres. Os percentis dividem os dados ordenados em centésimos. Lembre-se de que um por cento significa um centésimo. Portanto, percentis significam que os dados são divididos em 100 seções. A pontuação no 90º percentil de um exame não significa, necessariamente, que você recebeu 90% em um teste. Isso significa que 90% das pontuações do teste são iguais ou menores que sua pontuação e que 10% das pontuações do teste são iguais ou maiores que sua pontuação.

      Os percentis são úteis para comparar valores. Por esse motivo, as universidades e faculdades usam amplamente os percentis. Uma instância em que faculdades e universidades usam percentis é quando os resultados do SAT são usados ​​para determinar uma pontuação mínima de teste que será usada como um fator de aceitação. Por exemplo, suponha que Duke aceite pontuações SAT iguais ou acima do 75º percentil. Isso se traduz em uma pontuação de pelo menos 1220.

      Os percentis são usados ​​principalmente com populações muito grandes. Portanto, se você dissesse que 90 por cento das pontuações do teste são menores - e não iguais ou menores - do que sua pontuação, seria aceitável porque remover um determinado valor de dados não é significativo.

      A mediana é um número que mede o Centro dos dados. Você pode pensar na mediana como o valor médio, mas na verdade não precisa ser um dos valores observados. É um número que separa os dados ordenados em metades. Metade dos valores é o mesmo número ou menor que a mediana e metade dos valores é o mesmo número ou maior. Por exemplo, considere os seguintes dados:

      Como há 14 observações (um número par de valores de dados), a mediana está entre o sétimo valor, 6,8, e o oitavo valor, 7,2. Para encontrar a mediana, some os dois valores e divida por dois.

      A mediana é sete. Metade dos valores são menores que sete e metade dos valores são maiores que sete.

      Os quartis são números que separam os dados em trimestres. Os quartis podem ou não fazer parte dos dados. Para encontrar os quartis, primeiro encontre a mediana, ou o segundo quartil. O primeiro quartil, Q1, é o valor médio da metade inferior dos dados e o terceiro quartil, Q3, é o valor médio, ou mediana, da metade superior dos dados. Para ter uma ideia, considere o mesmo conjunto de dados:

      1, 1, 2, 2, 4, 6, 6.8, 7.2, 8, 8.3, 9, 10, 10, 11.5

      O conjunto de dados tem um número par de valores (14 valores de dados), então a mediana será a média dos dois valores intermediários (a média de 6,8 e 7,2), que é calculada como 6,8 + 7,2 2 6,8 + 7,2 2 e é igual 7

      Portanto, a mediana, ou segundo quartil (Q 2 Q 2), é 7.

      O primeiro quartil é a mediana da metade inferior dos dados, então se dividirmos os dados em sete valores na metade inferior e sete valores na metade superior, podemos ver que temos um número ímpar de valores na metade inferior . Assim, a mediana da metade inferior, ou do primeiro quartil (Q 1 Q 1) será o valor médio, ou 2. Usando o mesmo procedimento, podemos ver que a mediana da metade superior, ou terceiro quartil (Q 3 Q 3) será o valor médio da metade superior, ou 9.

      Os quartis são ilustrados abaixo:

      O intervalo interquartil é um número que indica a propagação da metade do meio, ou 50 por cento do meio dos dados. É a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1)

      IQR = Q3Q1. O IQR para este conjunto de dados é calculado como 9 menos 2 ou 7.

      O IQR pode ajudar a determinar o potencial outliers. Suspeita-se que um valor seja um outlier potencial se for inferior a 1,5 × IQR abaixo do primeiro quartil ou mais de 1,5 × IQR acima do terceiro quartil. Os valores discrepantes em potencial sempre exigem uma investigação mais detalhada.

      Um outlier potencial é um ponto de dados significativamente diferente dos outros pontos de dados. Esses pontos de dados especiais podem ser erros ou algum tipo de anormalidade, ou podem ser a chave para a compreensão dos dados.

      Exemplo 2.15

      Para os 13 preços de imóveis a seguir, calcule o IQR e determinar se os preços são valores discrepantes em potencial. Os preços estão em dólares.

      389,950 230,500 158,000 479,000 639,000 114,950 5,500,000 387,000 659,000 529,000 575,000 488,800 1,095,000

      Ordene os seguintes dados do menor para o maior:

      114,950, 158,000, 230,500, 387,000, 389,950, 479,000, 488,800, 529,000, 575,000, 639,000, 659,000, 1,095,000, 5,500,000.

      IQR = 649,000 – 308,750 = 340,250

      Nenhum preço da casa é inferior a –201.625. No entanto, 5.500.000 é mais de 1.159.375. Portanto, 5.500.000 é um valor discrepante em potencial.

      Para os 11 salários, calcule o IQR e determinar se os salários são discrepantes. Os seguintes salários são em dólares:

      $33,000 , $64,500 , $28,000 , $54,000 , $72,000 , $68,500 , $69,000 , $42,000 , $54,000 , $120,000 , $40,500

      No exemplo acima, você acabou de ver o cálculo da mediana, primeiro quartil e terceiro quartil. Esses três valores fazem parte do resumo de cinco números. Os outros dois valores são o valor mínimo (ou mínimo) e o valor máximo (ou máximo). O resumo de cinco números é usado para criar um gráfico de caixa.

      Encontre o intervalo interquartil para os dois conjuntos de dados a seguir e compare-os:

      69, 96, 81, 79, 65, 76, 83, 99, 89, 67, 90, 77, 85, 98, 66, 91, 77, 69, 80, 94

      Exemplo 2.16

      Perguntou-se a cinquenta alunos de estatísticas quanto sono eles dormem por noite de aula (arredondado para a hora mais próxima). Os resultados foram os seguintes:

      Quantidade de sono por noite escolar (horas) Frequência Frequência relativa Frequência relativa cumulativa
      4 2 0.04 0.04
      5 5 0.10 0.14
      6 7 0.14 0.28
      7 12 0.24 0.52
      8 14 0.28 0.80
      9 7 0.14 0.94
      10 3 0.06 1.00

      Encontre o 28º percentil. Observe o 0,28 na coluna Frequência relativa cumulativa. Vinte e oito por cento de 50 valores de dados são 14 valores. Existem 14 valores abaixo do 28º percentil. Eles incluem os dois 4s, os cinco 5s e os sete 6s. O 28º percentil está entre os últimos seis e os primeiros sete. O 28º percentil é 6,5.

      Encontre a mediana. Olhe novamente para a coluna Frequência relativa cumulativa e encontre 0,52. A mediana é o 50º percentil ou o segundo quartil. Cinquenta por cento de 50 é 25. Existem 25 valores abaixo da mediana. Eles incluem os dois 4s, os cinco 5s, os sete 6s e 11 dos 7s. A mediana ou 50º percentil está entre o 25º ou sete e o 26º ou sete valores. A mediana é sete.

      Encontre o terceiro quartil. O terceiro quartil é igual ao 75º percentil. Você pode globo ocular esta resposta. Se você olhar a coluna Frequência relativa cumulativa, encontrará 0,52 e 0,80. Quando você tem todos os quatros, cincos, seis e setes, você tem 52 por cento dos dados. Quando você inclui todos os 8s, tem 80% dos dados. O 75º percentil, então, deve ser um oito. Outra maneira de olhar para o problema é encontrar 75 por cento de 50, que é 37,5, e arredondar para 38. O terceiro quartil, Q3, é o 38º valor, que é um oito. Você pode verificar esta resposta contando os valores. Existem 37 valores abaixo do terceiro quartil e 12 valores acima.

      Foi perguntado a 40 motoristas de ônibus quantas horas eles gastam por dia executando suas rotas (arredondado para a hora mais próxima). Encontre o 65º percentil.


      Cálculo do modo de mediana média

      Medida de tendência central é um valor único para descrever um conjunto de dados, identificando a posição central dentro desse conjunto de dados. As medidas de tendência central são às vezes chamadas de medidas de localização central. É usado para encontrar a média, a mediana e a moda com base nas medidas de localização central. Média é a média da soma de um conjunto de dados dividido pelo número de dados. A mediana é o valor médio de dois valores dados e a moda é o valor que tem mais número de repetições.


      3. Medidas de Spread

      O objetivo de identificar um valor & # 8220 central & # 8221 de um conjunto de dados era descrever um típica valor no conjunto de dados. Assim que soubermos disso, podemos medir a quantidade de dispersão ou propagação dos valores dos dados do valor central, típico. Em outras palavras, vamos calcular como estão & # 8220 espalhados & # 8221 nossos dados. Três medidas principais de dispersão para um conjunto de dados são o alcance, a variância, e as desvio padrão.

      The Range

      O intervalo de uma variável é simplesmente a & # 8220distância & # 8221 entre o maior valor de dados e o menor valor de dados. Em símbolos matemáticos:

      Intervalo = maior valor de dados - menor valor de dados


      A tabela mostrada fornece as notas do primeiro exame para uma classe com 11 alunos. O intervalo para este conjunto de dados é:

      O cálculo do intervalo requer o uso de apenas dois valores: o menor e o maior valor de dados. Se qualquer um dos dois valores mudar, o intervalo também muda. Portanto, o intervalo é claramente não resistente para valores extremos no conjunto de dados. Nenhum outro valor de dados afeta o intervalo.

      Variância de Amostra

      A variação de um conjunto de dados é um resumo numérico que indica o desvio médio de cada valor de dados da média de um conjunto de dados. O cálculo da variância de um conjunto de dados exige que comparemos cada valor de dados de nossa lista bruta, <x1, x2, x3,…, X(n-1), xn>, para a média . A ideia de desvio é apenas a diferença, calculada por subtração. Em símbolos, o desvio sobre a média para o eu th valor de dados, xeu, é o valor: (xeu & # 8211 x̄).

      Por causa da definição da média de um conjunto de dados, se você somar o desvio da média para cada valor de dados, sempre obterá zero. Em símbolos, Σ (xeu & # 8211 x̄) = 0. Isso é um pouco técnico, mas basicamente significa que não podemos apenas calcular a média da soma dos desvios. Nós sempre obtemos zero !!

      Para contornar isso, precisamos encontrar uma maneira de tornar todos os desvios da média positivos, independentemente de o valor dos dados estar abaixo ou acima da média. Por exemplo, se você mora a 3 km ao norte de uma cidade e eu moro a 3 km ao sul da mesma cidade, seria ridículo dizer: & # 8220Eu moro a 2 milhas negativas da cidade. & # 8221 Nós dois moramos a 3 km de distância .

      Matematicamente, uma maneira de tornar todos os desvios positivos é usar um valor absoluto. Outra maneira, que usaremos para calcular a variação e o desvio padrão de um conjunto de dados, é quadrado cada desvio. Para o exemplo da cidade, seu valor de desvio seria 2 2 = 4 e meu valor de desvio seria (-2) 2 = 4. Portanto, nosso desvio, independentemente de ser positivo ou negativo, seria o mesmo! Portanto, para tratar diferenças positivas e diferenças negativas como iguais, elevamos ao quadrado os desvios: (xeu & # 8211 x̄) 2 .

      Finalmente, uma vez que a variância mede o desvio médio de cada valor de dados da média de todo o conjunto de dados, somamos o valor do desvio ao quadrado para cada ponto de dados e dividimos pelo valor (n & # 8211 1), um a menos que o número de valores de dados. Esta é outra dificuldade técnica & # 8220 & # 8221 da qual lidaremos mais tarde. O valor que (n & # 8211 1) recebe a designação especial graus de liberdade de um conjunto de dados. O motivo para isso ficará mais claro ao longo da aula, mas imagine o seguinte cenário simples: Você e quatro amigos vão a um restaurante chinês e, ao final da refeição, seu garçom traz para seu grupo 5 biscoitos da sorte, colocando-os uma pilha no meio da mesa. Quantos membros do seu grupo de 5 vão realmente escolher sua fortuna? Apenas 4. O motivo é óbvio: depois de 4 pessoas terem escolhido os biscoitos da sorte, apenas um permanece. A quinta pessoa tem nenhuma escolha de fortuna. Os graus de liberdade para este & # 8220problema & # 8221 são, portanto, 5 & # 8211 1 = 4.

      Aqui está outro exemplo, desta vez do ponto de vista matemático: se alguém lhe disser que está pensando em 3 números cuja média é 5, quantos dos três números você precisa saber antes de saber todos os 3? Depois de pensar um pouco, você perceberá que a resposta é 2. Se lhe disserem que dois dos números são 2 e 10, um pouco de reflexão (e alguma álgebra) o ajudará a descobrir que o último número deve ser


      Novamente, os graus de liberdade para este problema são 3 & # 8211 1 = 2.

      Em toda a sua glória, a fórmula matemática para calcular a variância da amostra é:

      Onde n é o tamanho da amostra.

      Exemplo: Cálculos para uma Variância de Amostra

      Voltando à população de pontuações de exames para uma classe com 11 alunos, a tabela acima ilustra os cálculos (às vezes tediosos!) Para a variação da população. A média desta população de dados é = 82.

      O desvio quadrado total para os dados da população é 1272. Portanto, a variação do conjunto de dados é:


      Medidas de tendência central

      As medidas de tendência central fornecem uma medida resumida que tenta descrever um conjunto completo de dados com um único valor que representa o meio ou o centro de sua distribuição. Existem três medidas principais de tendência central: a média, a mediana e a moda.

      A média de um conjunto de dados também é conhecida como valor médio. É calculado dividindo a soma de todos os valores em um conjunto de dados pelo número de valores.

      Portanto, em um conjunto de dados de 1, 2, 3, 4, 5, calcularíamos a média adicionando os valores (1 + 2 + 3 + 4 + 5) e dividindo pelo número total de valores (5). Nossa média então é 15/5, que é igual a 3.

      As desvantagens da média como uma medida de tendência central são que ela é altamente suscetível a outliers (observações que estão marcadamente distantes da maioria das observações em um conjunto de dados), e que não é apropriado usar quando os dados estão distorcidos, em vez disso do que ter uma distribuição normal.

      Mediana

      A mediana de um conjunto de dados é o valor que está no meio de um conjunto de dados organizado do menor ao maior.

      No conjunto de dados 1, 2, 3, 4, 5, a mediana é 3.

      Em um conjunto de dados com um número par de observações, a mediana é calculada dividindo a soma dos dois valores intermediários por dois. Portanto, em: 1, 2, 3, 4, 5, 6, a mediana é (3 + 4) / 2, que é igual a 3,5.

      A mediana é apropriada para usar com variáveis ​​ordinais e com variáveis ​​de intervalo com uma distribuição enviesada.

      O modo é a observação mais comum de um conjunto de dados ou o valor no conjunto de dados que ocorre com mais frequência.

      O modo tem várias desvantagens. É possível que dois modos apareçam em um conjunto de dados (por exemplo, em: 1, 2, 2, 3, 4, 5, 5, ambos 2 e 5 são os modos).

      O modo é uma medida apropriada para usar com dados categóricos.

      Recursos

      Desenhar e conduzir projetos de pesquisa em sistemas de saúde: Módulo 22 (página 28) deste guia da OMS fornece instruções sobre o uso de medidas de tendência central.

      Esta página é um esboço (uma versão mínima de uma página). Você pode ajudar a expandi-lo. Clique em Contribuir com Conteúdo ou Fale Conosco para sugerir recursos adicionais, compartilhar sua experiência usando a opção ou se oferecer para expandir a descrição.


      Assista o vídeo: Miary położenia - kwartyl dolny górny mediana przy danych indywidualnych interpretacja (Outubro 2021).