Artigos

8.4.4: Comparando Populações Usando Amostras - Matemática


Lição

Vamos comparar diferentes populações usando amostras.

Exercício ( PageIndex {1} ): Mesma média? Mesmo MAD?

Sem calcular, diga se cada par de conjuntos de dados tem a mesma média e se eles têm o mesmo desvio médio absoluto.

  1. conjunto A1335681014
    conjunto B2123232526283034
    Tabela ( PageIndex {1} )
  2. conjunto X12345
    definir Y123456
    Tabela ( PageIndex {2} )
  3. conjunto P47535862
    conjunto Q37436872
    Tabela ( PageIndex {3} )

Exercício ( PageIndex {2} ): Com uma carga pesada

Considere a pergunta: As mochilas dos alunos da décima série geralmente pesam mais do que as mochilas dos alunos da sétima série?

Aqui estão os gráficos de pontos que mostram os pesos das mochilas para uma amostra aleatória de alunos dessas duas séries:

  1. Alguma mochila da sétima série nesta amostra pesava mais do que uma mochila da décima série?
  2. O peso médio dessa amostra de mochilas da sétima série é de 6,3 libras. Você acha que o peso médio das mochilas para tudo alunos da sétima série pesam exatamente 6,3 libras?
  3. O peso médio desta amostra de mochilas de décima série é 14,8 libras. Você acha que há uma diferença significativa entre o peso das mochilas de todos os alunos da sétima e décima série? Explique ou mostre seu raciocínio.

Exercício ( PageIndex {3} ): Eles carregam mais?

Aqui estão mais 10 amostras aleatórias dos pesos das mochilas dos alunos da sétima série.

número da amostrapeso médio (libras)
15.8
29.2
35.5
47.3
57.2
66.6
75.2
85.3
96.3
106.4
Tabela ( PageIndex {4} )
    1. Qual amostra tem o maior peso médio?
    2. Qual amostra tem o menor peso médio?
    3. Qual é a diferença entre essas duas médias de amostra?
  1. Todas as amostras têm um desvio absoluto médio de cerca de 2,8 libras. Expresse a diferença entre as médias de amostra mais altas e mais baixas como um múltiplo da MAD.
  2. Essas amostras são muito diferentes? Explique ou mostre seu raciocínio.
  3. Lembre-se de que nossa amostra de mochilas de alunos da décima série tinha um peso médio de 14,8 libras. O MAD para esta amostra é 2,7 libras. Seu professor designará a você um dos exemplos de mochilas dos alunos da sétima série para usar.
    1. Qual a diferença entre as médias amostrais das mochilas dos alunos da décima série e das mochilas dos alunos da sétima série?
    2. Expresse a diferença entre essas duas médias de amostra como um múltiplo do maior dos MADs.
  4. Você acha que há uma diferença significativa entre os pesos das mochilas de todos os alunos da sétima e décima série? Explique ou mostre seu raciocínio.

Exercício ( PageIndex {4} ): Aço de diferentes regiões

Quando os antropólogos encontram artefatos de aço, eles podem testar a quantidade de carbono no aço para aprender sobre as pessoas que fizeram os artefatos. Aqui estão alguns gráficos de caixa que mostram a porcentagem de carbono em amostras de aço que foram encontradas em duas regiões diferentes:

  1. Foi encontrado algum aço na região 1 que tinha:
    1. mais carbono do que algum do aço encontrado na região 2?
    2. menos carbono do que algum do aço encontrado na região 2?
  2. Você acha que há uma diferença significativa entre todos os artefatos de aço encontrados nas regiões 1 e 2?
  3. Qual amostra tem uma distribuição que é não aproximadamente simétrico?
  4. Qual é a diferença entre as medianas da amostra para essas duas regiões?
    mediana da amostra (%)IQR (%)
    região 1(0.64)(0.05)
    região 2(0.47)(0.03)
    Tabela ( PageIndex {5} )
  5. Expresse a diferença entre essas duas medianas da amostra como um múltiplo do intervalo interquartil maior.
  6. Os antropólogos que conduziram o estudo concluíram que havia uma diferença significativa entre o aço dessas regiões. Você concorda? Explique ou mostre seu raciocínio.

Resumo

Às vezes, queremos comparar duas populações diferentes. Por exemplo, há uma diferença significativa entre os pesos de pugs e beagles? Aqui estão os histogramas que mostram os pesos para uma amostra de cães de cada uma dessas raças:

Os triângulos vermelhos mostram o peso médio de cada amostra, 6,9 kg para os pugs e 10,1 kg para os beagles. As linhas vermelhas mostram os pesos que estão dentro de 1 MAD da média. Podemos pensar neles como pesos “típicos” para a raça. Esses pesos típicos não se sobrepõem. Na verdade, a distância entre as médias é (10,1-6,9 ) ou 3,2 kg, mais de 6 vezes o maior MAD! Então podemos dizer lá é uma diferença significativa entre os pesos de pugs e beagles.

Existe uma diferença significativa entre os pesos dos pugs machos e das fêmeas? Aqui estão os gráficos de caixa que mostram os pesos para uma amostra de pugs machos e fêmeas:

Podemos ver que as medianas são diferentes, mas os pesos entre o primeiro e o terceiro quartis se sobrepõem. Com base nessas amostras, diríamos que há não uma diferença significativa entre os pesos dos pugs machos e fêmeas.

Em geral, se as medidas de centro para duas amostras são pelo menos duas medidas de variabilidade separadas, dizemos que a diferença nas medidas de centro é significativa. Visualmente, isso significa que o intervalo de valores típicos não se sobrepõe. Se eles estiverem mais próximos, não consideramos a diferença significativa.

Entradas do glossário

Definição: intervalo interquartil (IQR)

O intervalo interquartil é uma forma de medir a extensão de um conjunto de dados. Às vezes chamamos isso de IQR. Para encontrar o intervalo interquartil, subtraímos o primeiro quartil do terceiro quartil.

Por exemplo, o IQR deste conjunto de dados é 20 porque (50-30 = 20 ).

2229303132434445505059
T1Q23º T
Tabela ( PageIndex {6} )

Definição: Proporção

Uma proporção de um conjunto de dados é a fração dos dados em uma determinada categoria.

Por exemplo, uma classe tem 18 alunos. Há 2 alunos canhotos e 16 alunos destros na classe. A proporção de alunos canhotos é ( frac {2} {20} ), ou 0,1.

Prática

Exercício ( PageIndex {5} )

Lin quer saber se os alunos do ensino fundamental geralmente passam mais tempo brincando ao ar livre do que os alunos do ensino médio. Ela seleciona uma amostra aleatória de tamanho 20 de cada população de alunos e pergunta quantas horas eles jogaram ao ar livre na semana passada. Suponha que o MAD para cada uma de suas amostras seja de cerca de 3 horas.

Selecione tudo pares de médias amostrais para as quais Lin poderia concluir que há uma diferença significativa entre as duas populações.

  1. ensino fundamental: 12 horas, ensino médio: 10 horas
  2. ensino fundamental: 14 horas, ensino médio: 9 horas
  3. ensino fundamental: 13 horas, ensino médio: 6 horas
  4. ensino fundamental: 13 horas, ensino médio: 10 horas
  5. ensino fundamental: 7 horas, ensino médio: 15 horas

Exercício ( PageIndex {6} )

Esses dois gráficos de caixa mostram as distâncias de um salto vertical, em polegadas, para uma amostra aleatória de crianças de 10 anos e uma amostra aleatória de 15 anos.

Existe uma diferença significativa na distância mediana para as duas populações? Explique como você sabe.

Exercício ( PageIndex {7} )

A renda mediana de uma amostra de pessoas de Chicago é de cerca de US $ 60.000 e a renda mediana de uma amostra de pessoas de Kansas City é de cerca de US $ 46.000, mas os pesquisadores determinaram que não há uma diferença significativa nas medianas. Explique por que os pesquisadores podem estar corretos.

Exercício ( PageIndex {8} )

Um fazendeiro cultiva 5.000 abóboras a cada ano. As abóboras são precificadas de acordo com seu peso, então o agricultor gostaria de estimar o peso médio das abóboras que ele plantou este ano. Ele seleciona aleatoriamente 8 abóboras e as pesa. Aqui estão os pesos (em libras) dessas abóboras:

(2,9 quad 6.8 quad 7.3 quad 7.7 quad 8.9 quad 10.6 quad 12.3 quad 15.3 )

1. Estime o peso médio das abóboras que o fazendeiro plantou.

Este gráfico de pontos mostra o peso médio de 100 amostras de oito abóboras, semelhante ao anterior.

2. Qual parece ser o peso médio das 5.000 abóboras?

3. O que o gráfico de pontos da amostra significa sugere sobre o quão precisa uma estimativa com base em uma única amostra de 8 abóboras pode ser?

4. O que você acha que o agricultor pode fazer para obter uma estimativa mais precisa da média da população?

(Da Unidade 8.4.3)


População vs amostra: qual é a diferença?

Publicado em 14 de maio de 2020 por Pritha Bhandari. Revisado em 3 de junho de 2021.

UMA população é todo o grupo sobre o qual você deseja tirar conclusões.

UMA amostra é o grupo específico do qual você coletará dados. O tamanho da amostra é sempre menor que o tamanho total da população.

Na pesquisa, uma população nem sempre se refere a pessoas. Pode significar um grupo contendo elementos de qualquer coisa que você queira estudar, como objetos, eventos, organizações, países, espécies, organismos, etc.

População vs amostra
População Amostra
Anúncios de empregos de TI na Holanda Os 50 principais resultados da pesquisa para anúncios de empregos de TI na Holanda em 1º de maio de 2020
Músicas do Festival Eurovisão da Canção Músicas vencedoras do Eurovision Song Contest que foram apresentadas em inglês
Alunos de graduação na Holanda 300 alunos de graduação de três universidades holandesas que se oferecem como voluntários para o seu estudo de pesquisa em psicologia
Todos os países do mundo Países com dados publicados disponíveis sobre taxas de natalidade e PIB desde 2000


Diferença Quantitativa

Veremos como esses dois tipos de desvios-padrão são diferentes numericamente um do outro. Para fazer isso, consideramos as fórmulas para o desvio padrão da amostra e o desvio padrão da população.

As fórmulas para calcular esses dois desvios padrão são quase idênticas:

  1. Calcule a média.
  2. Subtraia a média de cada valor para obter desvios da média.
  3. Faça o quadrado de cada um dos desvios.
  4. Some todos esses desvios quadrados.

Agora, o cálculo desses desvios padrão difere:

  • Se estivermos calculando o desvio padrão da população, então dividimos por n, o número de valores de dados.
  • Se estivermos calculando o desvio padrão da amostra, então dividimos por n -1, um a menos que o número de valores de dados.

A etapa final, em qualquer um dos dois casos que estamos considerando, é obter a raiz quadrada do quociente da etapa anterior.

Quanto maior o valor de n ou seja, quanto mais próximos estarão os desvios padrão da população e da amostra.


Lição 18

Lin quer saber se os alunos do ensino fundamental geralmente passam mais tempo brincando ao ar livre do que os alunos do ensino médio. Ela seleciona uma amostra aleatória de tamanho 20 de cada população de alunos e pergunta quantas horas eles jogaram ao ar livre na semana passada. Suponha que o MAD para cada uma de suas amostras seja de cerca de 3 horas.

Selecione tudo pares de médias amostrais para as quais Lin poderia concluir que há uma diferença significativa entre as duas populações.

ensino fundamental: 12 horas, ensino médio: 10 horas

ensino fundamental: 14 horas, ensino médio: 9 horas

ensino fundamental: 13 horas, ensino médio: 6 horas

ensino fundamental: 13 horas, ensino médio: 10 horas

ensino fundamental: 7 horas, ensino médio: 15 horas

Solução

Os professores com um endereço de e-mail comercial válido podem clicar aqui para se registrar ou se inscrever para ter acesso gratuito à Solução Formatada.

Problema 2

Esses dois gráficos de caixa mostram as distâncias de um salto vertical, em polegadas, para uma amostra aleatória de crianças de 10 anos e uma amostra aleatória de 15 anos.

Expandir Imagem

Descrição: & ltp & gtDois gráficos de caixa de 50 a 80 por 2's. Gráfico de caixa superior com o rótulo "10 anos". Bigode de 51 a 53. Caixa de 53 a 58 com linha vertical em 56. Bigode de 58 a 59. Gráfico de caixa inferior rotulado "15 anos de idade". Bigode de 64 a 65. Caixa de 65 a 70 com linha vertical em 69. Bigode de 70 a 80. & lt / p & gt

Existe uma diferença significativa na distância mediana para as duas populações? Explique como você sabe.

Solução

Os professores com um endereço de e-mail comercial válido podem clicar aqui para se registrar ou se inscrever para ter acesso gratuito à Solução Formatada.

Problema 3

A renda mediana de uma amostra de pessoas de Chicago é de cerca de US $ 60.000 e a renda mediana de uma amostra de pessoas de Kansas City é de cerca de US $ 46.000, mas os pesquisadores determinaram que não há uma diferença significativa nas medianas. Explique por que os pesquisadores podem estar corretos.

Solução

Os professores com um endereço de e-mail comercial válido podem clicar aqui para se registrar ou entrar para ter acesso gratuito à Solução Formatada.

Problema 4

Um fazendeiro cultiva 5.000 abóboras a cada ano. As abóboras são precificadas de acordo com seu peso, então o agricultor gostaria de estimar o peso médio das abóboras que ele plantou este ano. Ele seleciona aleatoriamente 8 abóboras e as pesa. Aqui estão os pesos (em libras) dessas abóboras:

Faça uma estimativa do peso médio das abóboras que o fazendeiro cultivou.

Este gráfico de pontos mostra o peso médio de 100 amostras de oito abóboras, semelhante ao anterior.

Expandir Imagem

Qual parece ser o peso médio das 5.000 abóboras?

O que o gráfico de pontos da amostra significa sugere sobre o quão precisa uma estimativa com base em uma única amostra de 8 abóboras pode ser?

O que você acha que o agricultor pode fazer para obter uma estimativa mais precisa da média da população?

Solução

Os professores com um endereço de e-mail comercial válido podem clicar aqui para se registrar ou se inscrever para ter acesso gratuito à Solução Formatada.

IM 6–8 Math foi originalmente desenvolvido pela Open Up Resources e de autoria da Illustrative Mathematics®, e possui direitos autorais 2017-2019 da Open Up Resources. É licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0). O Currículo de Matemática 6–8 do NOSSO está disponível em https://openupresources.org/math-curriculum/.

As adaptações e atualizações do IM 6–8 Math são copyright 2019 da Illustrative Mathematics e são licenciadas pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

As adaptações para adicionar suporte adicional ao aluno do idioma inglês são copyright 2019 da Open Up Resources e estão licenciadas sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

O segundo conjunto de avaliações de inglês (marcado como conjunto "B") é protegido por direitos autorais 2019 da Open Up Resources e está licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0).

A tradução para o espanhol das avaliações "B" possui copyright 2020 da Illustrative Mathematics e está licenciada pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

O nome e o logotipo da Illustrative Mathematics não estão sujeitos à licença Creative Commons e não podem ser usados ​​sem o consentimento prévio e expresso por escrito da Illustrative Mathematics.

Este site inclui imagens de domínio público ou imagens licenciadas abertamente que são protegidas por direitos autorais de seus respectivos proprietários. As imagens com licença aberta permanecem sob os termos de suas respectivas licenças. Veja a seção de atribuição de imagem para mais informações.


Lição 18

Nas aulas anteriores, os alunos examinaram as distribuições de duas populações inteiras para decidir se eram ou não muito diferentes. Nesta lição, os alunos usam amostras para fazer inferências comparativas sobre as populações.

Os alunos vêem que se as amostras de duas populações diferentes têm apenas uma pequena diferença entre suas medidas de centro (em relação à sua variabilidade), então não podemos dizer que há uma diferença significativa entre as medidas de centro das populações (MP2). Devido à variabilidade da amostragem, é possível que as duas populações não sejam muito diferentes. No entanto, se as amostras de duas populações diferentes têm uma grande diferença entre suas medidas de centro (em relação à sua variabilidade), então podemos dizer que é provável que haja uma diferença significativa entre as medidas de centro das duas populações.

Metas de aprendizagem

Vamos comparar diferentes populações usando amostras.

Alvos de aprendizagem

Padrões CCSS

Entradas do glossário

O intervalo interquartil é uma forma de medir a extensão de um conjunto de dados. Às vezes chamamos isso de IQR. Para encontrar o intervalo interquartil, subtraímos o primeiro quartil do terceiro quartil.

Por exemplo, o IQR deste conjunto de dados é 20 porque (50-30 = 20 ).

22 29 30 31 32 43 44 45 50 50 59
T1 Q2 3º T

Uma proporção de um conjunto de dados é a fração dos dados em uma determinada categoria.

Por exemplo, uma classe tem 18 alunos. Há 2 alunos canhotos e 16 alunos destros na classe. A proporção de alunos canhotos é ( frac <2> <20> ) ou 0,1.

Imprimir materiais formatados

Os professores com um endereço de e-mail comercial válido podem clicar aqui para se registrar ou entrar para ter acesso gratuito aos materiais Cool Down, Guia do professor e PowerPoint.

Recursos adicionais

IM 6–8 Math foi originalmente desenvolvido pela Open Up Resources e de autoria da Illustrative Mathematics®, e possui direitos autorais 2017-2019 da Open Up Resources. É licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0). O Currículo de Matemática 6–8 do NOSSO está disponível em https://openupresources.org/math-curriculum/.

As adaptações e atualizações do IM 6–8 Math são copyright 2019 da Illustrative Mathematics e são licenciadas pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

As adaptações para adicionar suporte adicional ao aluno do idioma inglês são copyright 2019 da Open Up Resources e estão licenciadas sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

O segundo conjunto de avaliações de inglês (marcado como conjunto "B") é protegido por direitos autorais 2019 da Open Up Resources e está licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0).

A tradução para o espanhol das avaliações "B" possui copyright 2020 da Illustrative Mathematics e está licenciada pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

O nome e o logotipo da Illustrative Mathematics não estão sujeitos à licença Creative Commons e não podem ser usados ​​sem o consentimento prévio e expresso por escrito da Illustrative Mathematics.

Este site inclui imagens de domínio público ou imagens licenciadas abertamente que são protegidas por direitos autorais de seus respectivos proprietários. As imagens com licença aberta permanecem sob os termos de suas respectivas licenças. Veja a seção de atribuição de imagem para mais informações.


7.8 Probabilidade e Amostragem

IM 6–8 Math foi originalmente desenvolvido pela Open Up Resources e de autoria da Illustrative Mathematics®, e possui direitos autorais 2017-2019 da Open Up Resources. É licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0). O Currículo de Matemática 6–8 do NOSSO está disponível em https://openupresources.org/math-curriculum/.

As adaptações e atualizações do IM 6–8 Math são copyright 2019 da Illustrative Mathematics e são licenciadas pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

As adaptações para adicionar suporte adicional ao aluno do idioma inglês são copyright 2019 da Open Up Resources e estão licenciadas sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

O segundo conjunto de avaliações de inglês (marcado como conjunto "B") é protegido por direitos autorais 2019 da Open Up Resources e está licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0).

A tradução para o espanhol das avaliações "B" possui copyright 2020 da Illustrative Mathematics e está licenciada pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

O nome e o logotipo da Illustrative Mathematics não estão sujeitos à licença Creative Commons e não podem ser usados ​​sem o consentimento prévio e expresso por escrito da Illustrative Mathematics.

Este site inclui imagens de domínio público ou imagens licenciadas abertamente que são protegidas por direitos autorais de seus respectivos proprietários. As imagens com licença aberta permanecem sob os termos de suas respectivas licenças. Veja a seção de atribuição de imagem para mais informações.


Ao usar amostras para comparar duas populações, há muitos fatores a serem considerados.

  • As amostras são representativas de suas populações? Se a amostra for tendenciosa, pode não ter o mesmo centro e variabilidade da população.
  • Qual característica das populações faz sentido comparar - a média, a mediana ou uma proporção?
  • Quão variáveis ​​são os dados? Se os dados forem muito dispersos, pode ser mais difícil tirar conclusões com certeza.

Saber as perguntas corretas a fazer ao tentar comparar grupos é importante para interpretar corretamente os resultados.


Usando várias amostras para comparar populações

Um grupo de cerca de 250 alunos na 7ª série e cerca de 250 alunos na série & # xa0 11 foram questionados: “Quantas horas por mês você trabalha como voluntário?” As respostas & # xa0 de uma amostra aleatória de 10 alunos na 7ª série e uma amostra aleatória & # xa0 de 10 alunos na 11ª série estão resumidas nos gráficos de caixa.

Como podemos saber se os alunos da 11ª série fazem mais trabalho voluntário do que os alunos da 7ª série?

A mediana é mais alta para os alunos da 11ª série. Mas há uma grande variação. Para fazer uma inferência para toda a população & # xa0, é útil considerar como as medianas variam entre & # xa0 várias amostras.

Os gráficos de caixa abaixo mostram como as medianas de 10 amostras aleatórias diferentes & # xa0 para cada grupo variam.

As medianas variam menos do que os dados reais. Metade das medianas da 7ª série está dentro de 1 hora de 9. Metade das medianas da 11ª série está dentro de 1 ou 2 horas de 11.

Embora as distribuições se sobreponham, as metades do meio dos dados quase não se sobrepõem.

Esta é uma evidência bastante convincente de que os alunos da 11ª série são voluntários mais do que os alunos da 7ª série.

Além do material fornecido acima, se você precisar de qualquer outro material em matemática, use nossa pesquisa personalizada do Google aqui.

Se você tiver algum comentário sobre nosso conteúdo de matemática, envie-nos um e-mail: & # xa0

Sempre apreciamos seus comentários. & # Xa0

Você também pode visitar as seguintes páginas da web sobre diferentes assuntos em matemática. & # Xa0


População vs. Amostra & # 8211 Tudo que você precisa saber

O conceito de população x amostra é importante para todo pesquisador compreender. Compreender a diferença entre uma determinada população e uma amostra é fácil. Você deve se lembrar de uma lei fundamental da estatística: uma amostra é sempre um grupo menor (subconjunto) dentro da população.

Em pesquisas de mercado e estatísticas, todo estudo tem uma investigação essencial em mãos. A observação e a experiência de uma amostra da população determinam o resultado desta investigação. É feito para obter percepções que explicam um fenômeno dentro de toda a população.

Qual é a & # 8216população & # 8217 em pesquisa de mercado?

Definição: População em pesquisa é um conjunto completo de elementos que possuem um parâmetro padrão entre eles.

Todos sabemos o que a palavra ‘população’ significa na nossa vida quotidiana. Freqüentemente é usado para descrever a população humana ou o número total de pessoas que vivem em uma área geográfica de nosso país ou estado.

A & # 8216população & # 8217 na pesquisa não precisa necessariamente ser humana. Pode ser qualquer parâmetro de dado que possua uma característica comum.

Exemplo: O número total de 'Pet Stores' na Sunset Boulevard em Los Angeles, Califórnia.

O que é uma amostra em pesquisa de mercado?

Definição: Uma amostra é uma parte menor do todo, ou seja, um subconjunto de toda a população. É representativo da população em um estudo. Ao realizar pesquisas, a amostra são os membros da população que são convidados a participar da pesquisa. Portanto, uma amostra é um subgrupo ou subconjunto da população. Esta amostra pode ser estudada para investigar as características ou comportamento de todos os dados da população.

Amostras de dados são criadas usando vários métodos de pesquisa, como amostragem probabilística e amostragem não probabilística. Os métodos de amostragem variam de acordo com os tipos de pesquisa, com base no tipo de inquérito e na qualidade da informação exigida.

Exemplo : Uma empresa de ração para gatos gostaria de conhecer todas as lojas de animais onde pode vender seu peixe enlatado. A empresa possui dados populacionais sobre o número total de lojas de animais de estimação em Sunset Boulevard.

Este fabricante de ração agora pode criar uma amostra de pesquisa online selecionando apenas as lojas de animais que vendem ração para gatos. As características dos dados são estudadas. Os resultados são exibidos em estatísticas e relatórios analisados ​​para insights de negócios. Usando dados da amostra, a empresa pode descobrir maneiras de expandir seus negócios para a população total de lojas de animais.

Aqui estão as técnicas de amostragem mais comuns:

As técnicas de amostragem são amplamente classificadas em dois tipos:
Amostragem probabilística e amostragem não probabilística.

  1. Amostragem probabilística & # 8211 Amostras escolhidas com base na teoria da probabilidade.
    uma. Amostragem aleatória simples
    b. Amostras agrupadas
    c. Amostragem sistemática
    d. Amostragem aleatória estratificada
  2. Amostragem não probabilística & # 8211 Amostras escolhidas com base no julgamento subjetivo do pesquisador & # 8217s.
    uma. Amostragem de conveniência
    b. Amostragem de julgamento ou proposital
    c. Amostragem de bola de neve
    d. Amostragem de cota

Como escolher amostras de alta qualidade:

Embora tenhamos certeza de que todos os membros de uma população têm chances iguais de serem incluídos na amostra, isso não significa que as amostras derivadas de uma determinada população e que satisfaçam o critério serão semelhantes. Eles ainda variam um do outro. Essa variação pode ser leve ou substancial.

Por exemplo, um conjunto de amostras de temperatura corporal de pessoas saudáveis ​​mostrará uma diferença muito menor. Mas a diferença na pressão arterial sistólica dessas pessoas seria considerável.

Observa-se também que a precisão dos dados depende do tamanho da amostra. A precisão é muito menor com um tamanho de amostra menor em comparação com o uso de uma amostra maior para o estudo. Assim, se duas, três ou mais amostras são derivadas de uma população, quanto maiores são, mais tendem a se assemelhar.

População vs. Amostra & # 8211 sete razões principais para escolher uma amostra de uma determinada população

A amostragem é uma obrigação para conduzir qualquer estudo de pesquisa. Aqui estão os sete principais motivos para usar uma amostra:

  • Praticidade: Na maioria dos casos, uma população pode ser muito grande para coletar dados precisos & # 8211, o que não é prático. As amostras oferecem uma representação de toda a população se amostradas de acordo. As amostras permitem aos pesquisadores coletar dados que podem ser analisados ​​para fornecer insights sobre toda a população.
  • Oferece dados urgentes: Quando se trata de pesquisa, a quantidade de tempo disponível pode ser um fator determinante para um estudo. Uma amostra fornece um conjunto menor da população para revisão, que fornece dados úteis para representar toda a população. Levantar uma amostra menor, em oposição a toda a população, pode economizar um tempo precioso para os pesquisadores e oferecer dados urgentes.
  • Custo-beneficio: O custo da realização de pesquisas costuma ser um parâmetro para o estudo. Os pesquisadores devem fazer o melhor com os recursos de que dispõem para realizar uma pesquisa e obter percepções precisas. Levantar uma amostra representativa de uma população é econômico, pois requer menos recursos - como computadores, pesquisadores, entrevistadores, servidores e centros de coleta de dados.
  • Precisão de representação: Dependendo do método de amostragem, a pesquisa conduzida em uma amostra pode ser precisa com menor viés de não resposta do que se realizada pelo censo. Uma amostra selecionada usando o método não probabilístico é uma representação precisa da população. Esses dados coletados podem ser usados ​​para reunir informações sobre toda a comunidade.
  • Estatística inferencial: A estatística inferencial é um processo pelo qual dados representativos são usados ​​para inferir insights sobre toda a população. Os dados coletados de uma amostra representam toda a população. As estatísticas inferenciais só podem ser obtidas usando amostras de dados.
  • Às vezes, uma amostra é mais precisa do que um censo: Um censo de uma população inteira nem sempre oferece dados precisos devido a erros como inconsistência nas respostas ou viés de não resposta. Uma amostra cuidadosamente obtida, no entanto, acaba com esse viés e fornece dados mais precisos - que representam adequadamente a população.
  • Gerenciável: Às vezes, coletar uma população inteira de dados é quase impossível, pois algumas populações são muito difíceis de encontrar. Nesse caso, uma amostra pode ser usada para representar o estudo, pois é viável, gerenciável e acessível.

População vs. Amostra & # 8211 Qual é a diferença?

Normalmente, uma amostra da população é usada na pesquisa, pois é mais fácil e econômico processar um subconjunto menor da população em vez de todo o grupo.

Nesta tabela, podemos dar uma olhada mais de perto na diferença entre a amostra e a população:

Embora População e Amostra sejam dois termos diferentes, ambos estão relacionados entre si. A população é usada para tirar amostras. Fazer inferências estatísticas sobre a população é o objetivo principal da amostra. Sem a população, as amostras não podem existir. Quanto melhor for a qualidade da amostra, maior será o nível de precisão da generalização.

A amostragem correta é essencial para conduzir pesquisas de mercado criteriosas. Explore amostras de qualidade com QuestionPro Audience.


USANDO MÚLTIPLAS AMOSTRAS PARA COMPARAR POPULAÇÕES

Muitas amostras aleatórias diferentes são possíveis para qualquer população, e & # xa0 suas medidas de centro podem variar. O uso de várias amostras pode nos dar uma idéia & # xa0 de quão confiáveis ​​são quaisquer inferências ou previsões que fazemos.

Um grupo de cerca de 250 alunos na 7ª série e cerca de 250 alunos na série & # xa0 11 foram questionados: “Quantas horas por mês você trabalha como voluntário?” As respostas & # xa0 de uma amostra aleatória de 10 alunos na 7ª série e uma amostra aleatória & # xa0 de 10 alunos na 11ª série estão resumidas nos gráficos de caixa.

Como podemos saber se os alunos da 11ª série fazem mais trabalho voluntário do que os alunos da 7ª série?

A mediana é mais alta para os alunos da 11ª série. Mas há uma grande variação. Para fazer uma inferência para toda a população & # xa0, é útil considerar como as medianas variam entre & # xa0 várias amostras.

Os gráficos de caixa abaixo mostram como as medianas de 10 amostras aleatórias diferentes & # xa0 para cada grupo variam.

As medianas variam menos do que os dados reais. Metade das medianas da 7ª série está dentro de 1 hora de 9. Metade das medianas da 11ª série está dentro de 1 ou 2 horas de 11.

Embora as distribuições se sobreponham, as metades do meio dos dados quase não se sobrepõem.

Esta é uma evidência bastante convincente de que os alunos da 11ª série são voluntários mais do que os alunos da 7ª série.

Os gráficos de caixa mostram a variação nas médias para 10 amostras aleatórias diferentes & # xa0 para os grupos no exemplo. Por que esses dados fornecem menos evidências convincentes de que os alunos da 11ª série são mais voluntários?

Uma vez que há muito mais sobreposição entre as duas distribuições & # xa0, & # xa0 esses dados fornecem menos evidências & # xa0 convincentes de que os alunos da 11ª série são mais voluntários

Além do material fornecido acima, se você precisar de qualquer outro material em matemática, use nossa pesquisa personalizada do Google aqui.

Se você tiver algum comentário sobre nosso conteúdo de matemática, envie-nos um e-mail: & # xa0

Sempre apreciamos seus comentários. & # Xa0

Você também pode visitar as seguintes páginas da web sobre diferentes assuntos em matemática. & # Xa0


8.4: Exemplos de teste de hipóteses para proporções

  • Contribuição de Barbara Illowsky e Susan Dean
  • Estatística no De Anza College
  • Fonte do OpenStax
  • Em um problema de teste de hipótese, você pode ver palavras como & quott o nível de significância é 1%. & Quot O & quot1% & quot é o pré-concebido ou predefinido ( alpha ).
  • O estatístico que configura o teste de hipótese seleciona o valor de &alfa para usar antes de coletar os dados de amostra.
  • Se nenhum nível de significância for fornecido, um padrão comum a ser usado é ( alpha = 0,05 ).
  • Quando você calcula o valor (p ) - e desenha a figura, o valor (p ) - é a área na cauda esquerda, na cauda direita ou dividido igualmente entre as duas caudas. Por esse motivo, chamamos o teste de hipótese de esquerda, direita ou bicaudal.
  • A hipótese alternativa, (H_ ), informa se o teste é esquerdo, direito ou bicaudal. É a chave para conduzir o teste apropriado.
  • (H_ ) nunca tem um símbolo que contenha um sinal de igual.
  • Pensando sobre o significado do valor (p ) -: Um analista de dados (e qualquer outra pessoa) deve ter mais confiança de que tomou a decisão correta de rejeitar a hipótese nula com um valor (p ) menor (por exemplo , 0,001 em oposição a 0,04) mesmo se usar o nível 0,05 para alfa. Da mesma forma, para um grande p-valor como 0,4, ao contrário de a (p ) - valor de 0,056 ( ( alpha = 0,05 ) é menor do que qualquer um dos números), um analista de dados deve ter mais confiança de que tomou a decisão correta em não rejeitando a hipótese nula. Isso faz com que o analista de dados use o julgamento em vez de aplicar regras sem pensar.

Exemplos de teste de hipótese completa

Joon believes that 50% of first-time brides in the United States are younger than their grooms. She performs a hypothesis test to determine if the percentage is the same or different from 50%. Joon samples 100 first-time brides e 53 reply that they are younger than their grooms. For the hypothesis test, she uses a 1% level of significance.

Set up the hypothesis test:

The 1% level of significance means that &alpha = 0.01. This is a test of a single population proportion.

The words "is the same or different from" tell you this is a two-tailed test.

Calculate the distribution needed:

Random variable: (P&prime =) the percent of of first-time brides who are younger than their grooms.

Distribution for the test: The problem contains no mention of a mean. The information is given in terms of percentages. Use the distribution for P&prime, the estimated proportion.

where (p = 0.50, q = 1&minusp = 0.50), and (n = 100)

Calculate the p-value using the normal distribution for proportions:

where [x = 53, p' = frac = frac<53> <100>= 0.53 onumber ].

Interpretation of the (p ext<-value>): If the null hypothesis is true, there is 0.5485 probability (54.85%) that the sample (estimated) proportion (p') is 0.53 or more OR 0.47 or less (see the graph in Figure).

Figure (PageIndex<12>)

(mu = p = 0.50) comes from (H_<0>), the null hypothesis.

(p&prime = 0.53). Since the curve is symmetrical and the test is two-tailed, the (p&prime) for the left tail is equal to (0.50 &ndash 0.03 = 0.47) where (mu = p = 0.50). (0.03 is the difference between 0.53 and 0.50.)

Compare (alpha) and the (p ext<-value>):

Since (alpha = 0.01) and (p ext <-value>= 0.5485). (alpha < p ext<-value>).

Make a decision: Since (alpha < p ext<-value>), you cannot reject (H_<0>).

Conclusion: At the 1% level of significance, the sample data do not show sufficient evidence that the percentage of first-time brides who are younger than their grooms is different from 50%.

The (p ext<-value>) can easily be calculated.

Press STAT and arrow over to TESTS . Press 5:1-PropZTest . Enter .5 for (p_<0>), 53 for (x) and 100 for (n). Arrow down to Prop and arrow to not equals (p_<0>). Press ENTER . Arrow down to Calculate and press ENTER . The calculator calculates the (p ext<-value>) ((p = 0.5485)) and the test statistic ((z)-score). Prop not equals .5 is the alternate hypothesis. Do this set of instructions again except arrow to Draw (instead of Calculate ). Press ENTER . A shaded graph appears with ((z) = 0.6) (test statistic) and (p = 0.5485) ((p ext<-value>)). Make sure when you use Draw that no other equations are highlighted in (Y =) and the plots are turned off.

The Type I and Type II errors are as follows:

The Type I error is to conclude that the proportion of first-time brides who are younger than their grooms is different from 50% when, in fact, the proportion is actually 50%. (Reject the null hypothesis when the null hypothesis is true).

The Type II error is there is not enough evidence to conclude that the proportion of first time brides who are younger than their grooms differs from 50% when, in fact, the proportion does differ from 50%. (Do not reject the null hypothesis when the null hypothesis is false.)

A teacher believes that 85% of students in the class will want to go on a field trip to the local zoo. She performs a hypothesis test to determine if the percentage is the same or different from 85%. The teacher samples 50 students and 39 reply that they would want to go to the zoo. For the hypothesis test, use a 1% level of significance.

First, determine what type of test this is, set up the hypothesis test, find the (p ext<-value>), sketch the graph, and state your conclusion.

Since the problem is about percentages, this is a test of single population proportions.

Because (p > alpha), we fail to reject the null hypothesis. There is not sufficient evidence to suggest that the proportion of students that want to go to the zoo is not 85%.

Suppose a consumer group suspects that the proportion of households that have three cell phones is 30%. A cell phone company has reason to believe that the proportion is not 30%. Before they start a big advertising campaign, they conduct a hypothesis test. Their marketing people survey 150 households with the result that 43 of the households have three cell phones.

Set up the Hypothesis Test:

Determine the distribution needed:

O random variable is (P&prime =) proportion of households that have three cell phones.

O distribution for the hypothesis test is (P' - Nleft(0.30, sqrt<150>> ight))

uma. The value that helps determine the (p ext<-value>) is (p&prime). Calculate (p&prime).

uma. (p' = frac) where (x) is the number of successes and (n) is the total number in the sample.

b. What is a success for this problem?

b. A success is having three cell phones in a household.

c. What is the level of significance?

c. The level of significance is the preset (alpha). Since (alpha) is not given, assume that (alpha = 0.05).

d. Draw the graph for this problem. Draw the horizontal axis. Label and shade appropriately.

e. Make a decision. _____________(Reject/Do not reject) (H_<0>) because____________.

e. Assuming that (alpha = 0.05, alpha < p ext<-value>). The decision is do not reject (H_<0>) because there is not sufficient evidence to conclude that the proportion of households that have three cell phones is not 30%.

Marketers believe that 92% of adults in the United States own a cell phone. A cell phone manufacturer believes that number is actually lower. 200 American adults are surveyed, of which, 174 report having cell phones. Use a 5% level of significance. State the null and alternative hypothesis, find the p-value, state your conclusion, and identify the Type I and Type II errors.

Because (p < 0.05), we reject the null hypothesis. There is sufficient evidence to conclude that fewer than 92% of American adults own cell phones.

  • Type I Error: To conclude that fewer than 92% of American adults own cell phones when, in fact, 92% of American adults do own cell phones (reject the null hypothesis when the null hypothesis is true).
  • Type II Error: To conclude that 92% of American adults own cell phones when, in fact, fewer than 92% of American adults own cell phones (do not reject the null hypothesis when the null hypothesis is false).

The next example is a poem written by a statistics student named Nicole Hart. The solution to the problem follows the poem. Notice that the hypothesis test is for a single population proportion. This means that the null and alternate hypotheses use the parameter (p). The distribution for the test is normal. The estimated proportion (p&prime) is the proportion of fleas killed to the total fleas found on Fido. This is sample information. The problem gives a preconceived (alpha = 0.01), for comparison, and a 95% confidence interval computation. The poem is clever and humorous, so please enjoy it!

They do not come off with ease.
As for shampoo, I have tried many types
Even one called Bubble Hype,
Which only killed 25% of the fleas,
Unfortunately I was not pleased.

I've used all kinds of soap,
Until I had given up hope
Until one day I saw
An ad that put me in awe.

A shampoo used for dogs
Called GOOD ENOUGH to Clean a Hog
Guaranteed to kill more fleas.

I gave Fido a bath
And after doing the math
His number of fleas
Started dropping by 3's!
Before his shampoo
I counted 42.

At the end of his bath,
I redid the math
And the new shampoo had killed 17 fleas.
So now I was pleased.

Now it is time for you to have some fun
With the level of significance being .01,
You must help me figure out

Use the new shampoo or go without?

Set up the hypothesis test:

Determine the distribution needed:

In words, CLEARLY state what your random variable (ar) or (P&prime) represents.

(P&prime =) The proportion of fleas that are killed by the new shampoo

State the distribution to use for the test.

Test Statistic: (z = 2.3163)

Calculate the (p ext<-value>) using the normal distribution for proportions:

In one to two complete sentences, explain what the p-value means for this problem.

If the null hypothesis is true (the proportion is 0.25), then there is a 0.0103 probability that the sample (estimated) proportion is 0.4048 (left(frac<17><42> ight)) or more.

Use the previous information to sketch a picture of this situation. CLEARLY, label and scale the horizontal axis and shade the region(s) corresponding to the (p ext<-value>).

Figure (PageIndex<14>)

Compare (alpha) and the (p ext<-value>):

Indicate the correct decision (&ldquoreject&rdquo or &ldquodo not reject&rdquo the null hypothesis), the reason for it, and write an appropriate conclusion, using complete sentences.

alpha decision reason for decision
0.01 Do not reject (H_<0>) (alpha < p ext<-value>)

Conclusion: At the 1% level of significance, the sample data do not show sufficient evidence that the percentage of fleas that are killed by the new shampoo is more than 25%.

Construct a 95% confidence interval for the true mean or proportion. Include a sketch of the graph of the situation. Label the point estimate and the lower and upper bounds of the confidence interval.

Figure (PageIndex<15>)

Confidence Interval: (0.26,0.55) We are 95% confident that the true population proportion p of fleas that are killed by the new shampoo is between 26% and 55%.

This test result is not very definitive since the (p ext<-value>) is very close to alpha. In reality, one would probably do more tests by giving the dog another bath after the fleas have had a chance to return.

In a study of 420,019 cell phone users, 172 of the subjects developed brain cancer. Test the claim that cell phone users developed brain cancer at a greater rate than that for non-cell phone users (the rate of brain cancer for non-cell phone users is 0.0340%). Since this is a critical issue, use a 0.005 significance level. Explain why the significance level should be so low in terms of a Type I error.

We will follow the four-step process.

  1. We need to conduct a hypothesis test on the claimed cancer rate. Our hypotheses will be
    1. (H_<0>: p leq 0.00034)
    2. (H_: p > 0.00034)

    If we commit a Type I error, we are essentially accepting a false claim. Since the claim describes cancer-causing environments, we want to minimize the chances of incorrectly identifying causes of cancer.

    Figure 9.6.11.

    Figure 9.6.12.

    According to the US Census there are approximately 268,608,618 residents aged 12 and older. Statistics from the Rape, Abuse, and Incest National Network indicate that, on average, 207,754 rapes occur each year (male and female) for persons aged 12 and older. This translates into a percentage of sexual assaults of 0.078%. In Daviess County, KY, there were reported 11 rapes for a population of 37,937. Conduct an appropriate hypothesis test to determine if there is a statistically significant difference between the local sexual assault percentage and the national sexual assault percentage. Use a significance level of 0.01.

    We will follow the four-step plan.

    1. We need to test whether the proportion of sexual assaults in Daviess County, KY is significantly different from the national average.
    2. Since we are presented with proportions, we will use a one-proportion z-test. The hypotheses for the test will be
      1. (H_<0>: p = 0.00078)
      2. (H_: p eq 0.00078)

      Figure 9.6.13.

      Figure 9.6.14.

      Análise

      O hypothesis test itself has an established process. This can be summarized as follows:


      Assista o vídeo: korelacja liniowa r Pearsona (Outubro 2021).