Artigos

8.2.1: Simulando experimentos de várias etapas


Lição

Vamos simular eventos mais complicados.

Exercício ( PageIndex {1} ): Aviso e maravilha: Ski Business

O que você percebe? O que você imagina?

Exercício ( PageIndex {2} ): Alpine Zoom

A Alpine Zoom é uma empresa de esqui. Para ganhar dinheiro durante as férias de primavera, eles precisam nevar pelo menos 4 em 10 dias. A previsão do tempo diz que há uma chance ( frac {1} {3} ) de nevar todos os dias durante o intervalo.

Use o miniaplicativo para simular o tempo por 10 dias de férias para ver se Alpine Zoom vai ganhar dinheiro.

  1. Descreva um experimento casual que você pode usar para simular se vai nevar no primeiro dia do intervalo.
  2. Como esse experimento casual pode ser usado para determinar se Alpine Zoom vai ganhar dinheiro?
    • Em cada tentativa, gire o botão giratório 10 vezes e, em seguida, registre o número de 1s que apareceu na linha.
    • O miniaplicativo informa se o Alpine Zoom vai ganhar dinheiro ou não na última coluna.
    • Clique em Avançar para obter o botão de rotação de volta para iniciar a próxima simulação.
  3. Com base em suas simulações, estime a probabilidade de o Alpine Zoom ganhar dinheiro.

Exercício ( PageIndex {3} ): Jogo de Kiran

Kiran inventa um jogo que usa um tabuleiro com quadrados pretos e brancos alternados. Uma peça de jogo começa em um quadrado branco e deve avançar 4 quadrados para o outro lado do tabuleiro em 5 turnos para ganhar o jogo.

Para cada jogada, o jogador tira um bloco de um saco contendo 2 blocos pretos e 2 blocos brancos. Se a cor do bloco coincidir com a cor da próxima casa no tabuleiro, a peça do jogo move-se para ela. Se não corresponder, a peça em jogo permanece em sua casa atual.

  1. Jogue à vez até que cada pessoa em seu grupo tenha jogado o jogo duas vezes.
  2. Use os resultados de todos os jogos que seu grupo jogou para estimar a probabilidade de ganhar o jogo de Kiran.
  3. Você acha que sua estimativa da probabilidade de ganhar é uma boa estimativa? Como poderia ser melhorado?

você esta pronto para mais?

Como cada uma dessas mudanças, por si só, afetaria a probabilidade de ganhar o jogo?

  1. Mude as regras para que a peça em jogo se mova 7 espaços em 8 movimentos.
  2. Mude o tabuleiro para que todos os espaços fiquem pretos.
  3. Mude os blocos no saco para 3 blocos pretos e 1 bloco branco.

Exercício ( PageIndex {4} ): Simulation Nation

Combine cada situação com um simulação.

Situações:

  1. Em um pequeno lago, 25% dos peixes são fêmeas. Você captura um peixe, registra se é macho ou fêmea e joga o peixe de volta no lago. Se você repetir este processo 5 vezes, qual é a probabilidade de que pelo menos 3 dos 5 peixes sejam fêmeas?
  2. Elena faz cerca de 80% de seus lances livres. Com base em seus sucessos anteriores com lances livres, qual é a probabilidade de ela fazer exatamente 4 de 5 lances livres em seu próximo jogo de basquete?
  3. Em um game show, um competidor deve escolher uma das três portas. Na primeira rodada, a porta vencedora tem férias. No segundo turno, a porta vencedora tem um carro. Qual é a probabilidade de ganhar férias e um carro?
  4. Seu coro está cantando em 4 concertos. Você e um de seus colegas aprenderam o solo. Antes de cada concerto, há uma chance igual de o diretor do coral selecionar você ou o outro aluno para cantar o solo. Qual é a probabilidade de você ser selecionado para cantar o solo em exatamente 3 dos 4 shows?

Simulações:

  1. Jogue um cubo de número padrão 2 vezes e registre os resultados. Repita esse processo várias vezes e encontre a proporção das simulações em que 1 ou 2 apareceu nas duas vezes para estimar a probabilidade.
  2. Faça um spinner com quatro seções iguais rotuladas 1, 2, 3 e 4. Gire o spinner 5 vezes e registre os resultados. Repita esse processo várias vezes e encontre a proporção das simulações em que um 4 aparece 3 ou mais vezes para estimar a probabilidade.
  3. Jogue uma moeda justa 4 vezes e registre os resultados. Repita esse processo muitas vezes e encontre a proporção das simulações em que exatamente 3 cabeças aparecem para estimar a probabilidade.
  4. Coloque 8 chips azuis e 2 chips vermelhos em um saco. Sacuda a sacola, selecione uma ficha, registre sua cor e coloque a ficha de volta na sacola. Repita o processo mais 4 vezes para obter um resultado simulado. Em seguida, repita esse processo muitas vezes e encontre a proporção das simulações em que exatamente 4 azuis são selecionados para estimar a probabilidade.

Resumo

Quanto mais complexa é uma situação, mais difícil pode ser estimar a probabilidade de um evento específico acontecer. Simulações bem projetadas são uma forma de estimar uma probabilidade em uma situação complexa, especialmente quando seria difícil ou impossível determinar a probabilidade apenas pelo raciocínio.

Para projetar uma boa simulação, precisamos saber algo sobre a situação. Por exemplo, se quisermos estimar a probabilidade de chover todos os dias nos próximos três dias, podemos consultar a previsão do tempo para os próximos três dias. Aqui está uma tabela que mostra a previsão do tempo:

hoje (terça)quarta-feiraquinta-feiraSexta-feira
probabilidade de chuva(0.2)(0.4)(0.5)(0.9)
Tabela ( PageIndex {1} )

Podemos configurar uma simulação para estimar a probabilidade de chuva a cada dia com três sacos.

  • No primeiro saco, colocamos 4 tiras de papel que dizem “chuva” e 6 que dizem “não chove”.
  • Na segunda sacola, colocamos 5 tiras de papel que dizem “chuva” e 5 que dizem “sem chuva”.
  • No terceiro saco, colocamos 9 tiras de papel que dizem “chuva” e 1 que diz “sem chuva”.

Em seguida, podemos selecionar um pedaço de papel de cada saco e registrar se houve ou não chuva nos três dias. Se repetirmos este experimento muitas vezes, podemos estimar a probabilidade de que haverá chuva em todos os três dias, dividindo o número de vezes que todos os três deslizamentos disseram “chuva” pelo número total de vezes que realizamos a simulação.

Prática

Exercício ( PageIndex {5} )

A gata de Priya está grávida de uma ninhada de 5 gatinhos. Cada gatinho tem 30% de chance de ser castanho chocolate. Priya quer saber a probabilidade de que pelo menos dois dos gatinhos sejam castanhos chocolate.

Para simular isso, Priya colocou 3 cubos brancos e 7 cubos verdes em uma bolsa. Para cada tentativa, Priya retirou e devolveu um cubo 5 vezes. Priya conduziu 12 testes.

Aqui está uma tabela com os resultados.

número de testeresultado
1ggggg
2gggwg
3wgwgw
4gwggg
5gggwg
6wwggg
7gwggg
8ggwgw
9wwwgg
10ggggw
11wggwg
12gggwg
Tabela ( PageIndex {2} )
  1. Quantas tentativas bem-sucedidas houve? Descreva como você determinou se um teste foi um sucesso.
  2. Com base nesta simulação, estime a probabilidade de que exatamente dois gatinhos serão castanhos chocolate.
  3. Com base nesta simulação, estime a probabilidade de que pelo menos dois gatinhos serão castanhos chocolate.
  4. Escreva e responda outra pergunta que Priya poderia responder usando esta simulação.
  5. Como Priya poderia aumentar a precisão da simulação?

Exercício ( PageIndex {6} )

Uma equipe tem 75% de chance de vencer cada um dos 3 jogos que disputará nesta semana. Clare simula a semana de jogos colocando 4 folhas de papel em uma sacola, 3 com a etiqueta “ganhar” e 1 com a etiqueta “perder”. Ela desenha um papel, anota o resultado, depois recoloca o papel e repete o processo mais duas vezes. Clare consegue o resultado: ganha, ganha, perde. O que Clare pode fazer para estimar a probabilidade de o time vencer pelo menos 2 jogos?

Exercício ( PageIndex {7} )

  1. Liste o espaço de amostra para selecionar uma letra aleatória da palavra “ABACAXI”.
  2. Uma letra é selecionada aleatoriamente a partir da palavra “ABACAXI”. O que é mais provável, selecionando “E” ou selecionando “P?” Explique seu raciocínio.

(Da Unidade 8.1.5)

Exercício ( PageIndex {8} )

Em um gráfico do comprimento lateral de um quadrado em relação ao seu perímetro, alguns pontos são traçados.

1. Adicione pelo menos mais dois pares ordenados ao gráfico.

2. Existe uma relação proporcional entre o perímetro e o comprimento lateral? Explique como você sabe.

(Da Unidade 2.4.2)


8.2.1: Simulando experimentos multi-etapas

Alvos de aprendizagem

Quanto mais complexa é uma situação, mais difícil pode ser estimar a probabilidade de um evento específico acontecer. Simulações bem projetadas são uma forma de estimar uma probabilidade em uma situação complexa, especialmente quando seria difícil ou impossível determinar a probabilidade apenas pelo raciocínio.

Para projetar uma boa simulação, precisamos saber algo sobre a situação. Por exemplo, se quisermos estimar a probabilidade de que chova todos os dias nos próximos três dias, podemos consultar a previsão do tempo para os próximos três dias. Aqui está uma tabela que mostra a previsão do tempo:

Podemos configurar uma simulação para estimar a probabilidade de chuva a cada dia com três sacos.

    • No primeiro saco, colocamos 4 tiras de papel que dizem “chuva” e 6 que dizem “não chove”.
    • Na segunda sacola, colocamos 5 tiras de papel que dizem “chuva” e 5 que dizem “sem chuva”.
    • No terceiro saco, colocamos 9 tiras de papel que dizem “chuva” e 1 que diz “sem chuva”.

    Em seguida, podemos selecionar um pedaço de papel de cada saco e registrar se houve ou não chuva nos três dias. Se repetirmos este experimento muitas vezes, podemos estimar a probabilidade de que haverá chuva em todos os três dias, dividindo o número de vezes que todos os três deslizamentos disseram “chuva” pelo número total de vezes que realizamos a simulação.


    Lição 7

    Nesta lição, os alunos veem que eventos compostos podem ser simulados usando experimentos de múltiplas probabilidades. Nesse caso, é importante comunicar exatamente o que representa um resultado da simulação (MP6). Por exemplo, se quisermos saber a probabilidade de uma família com três filhos ter pelo menos uma menina, podemos lançar uma moeda para representar cada criança e usar cada conjunto de três lançamentos de moeda para representar uma família. Portanto, se jogarmos uma moeda 30 vezes, teremos executado esta simulação apenas 10 vezes.

    Os alunos continuam a considerar como uma situação do mundo real pode ser representada usando simulação (MP4).

    Metas de aprendizagem

    Vamos simular eventos mais complicados.

    Materiais requeridos

    Preparação Requerida

    Imprima e recorte spinners do master de linha preta Alpine Zoom. Um spinner para cada grupo de 3 alunos.

    Para a atividade do jogo Kiran, um saco de papel contendo 4 cubos de pressão (2 pretos e 2 brancos) é necessário para cada 3 alunos.

    Outras ferramentas de simulação (cubos de números, bolsas com cubos de encaixe coloridos, etc.) devem estar disponíveis.

    Alvos de aprendizagem

    Padrões CCSS

    Imprimir materiais formatados

    Os professores com um endereço de e-mail comercial válido podem clicar aqui para se registrar ou entrar para ter acesso gratuito aos materiais Cool Down, Guia do professor e PowerPoint.

    Recursos adicionais

    IM 6–8 Math foi originalmente desenvolvido pela Open Up Resources e de autoria da Illustrative Mathematics®, e possui direitos autorais 2017-2019 da Open Up Resources. É licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0). O Currículo de Matemática 6–8 do NOSSO está disponível em https://openupresources.org/math-curriculum/.

    As adaptações e atualizações do IM 6–8 Math são copyright 2019 da Illustrative Mathematics e são licenciadas pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

    As adaptações para adicionar suporte adicional ao aluno do idioma inglês são copyright 2019 da Open Up Resources e estão licenciadas sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

    O segundo conjunto de avaliações de inglês (marcado como conjunto "B") é protegido por direitos autorais 2019 da Open Up Resources e está licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0).

    A tradução para o espanhol das avaliações "B" possui copyright 2020 da Illustrative Mathematics e está licenciada sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

    O nome e o logotipo da Illustrative Mathematics não estão sujeitos à licença Creative Commons e não podem ser usados ​​sem o consentimento prévio e expresso por escrito da Illustrative Mathematics.

    Este site inclui imagens de domínio público ou imagens licenciadas abertamente que são protegidas por direitos autorais de seus respectivos proprietários. As imagens com licença aberta permanecem sob os termos de suas respectivas licenças. Veja a seção de atribuição de imagem para mais informações.


    Lição 7

    Nesta lição, os alunos veem que eventos compostos podem ser simulados usando experimentos de múltiplas probabilidades. Nesse caso, é importante comunicar exatamente o que representa um resultado da simulação (MP6). Por exemplo, se quisermos saber a probabilidade de uma família com três filhos ter pelo menos uma menina, podemos lançar uma moeda para representar cada criança e usar cada conjunto de três lançamentos de moeda para representar uma família. Portanto, se jogarmos uma moeda 30 vezes, teremos executado esta simulação apenas 10 vezes.

    Os alunos continuam a considerar como uma situação do mundo real pode ser representada usando simulação (MP4).

    Metas de aprendizagem

    Vamos simular eventos mais complicados.

    Materiais requeridos

    Preparação Requerida

    Imprima e recorte spinners do master de linha preta Alpine Zoom. Um spinner para cada grupo de 3 alunos.

    Para a atividade do jogo Kiran, um saco de papel contendo 4 cubos de pressão (2 pretos e 2 brancos) é necessário para cada 3 alunos.

    Outras ferramentas de simulação (cubos de números, bolsas com cubos de encaixe coloridos, etc.) devem estar disponíveis.

    Alvos de aprendizagem

    Padrões CCSS

    Imprimir materiais formatados

    Para obter acesso, consulte um de nossos Parceiros Certificados de IM.

    Recursos adicionais

    Para obter acesso, consulte um de nossos Parceiros Certificados de IM.

    Para obter acesso, consulte um de nossos Parceiros Certificados de IM.

    IM 6–8 Math foi originalmente desenvolvido pela Open Up Resources e de autoria da Illustrative Mathematics®, e possui direitos autorais 2017-2019 da Open Up Resources. É licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0). O Currículo de Matemática 6–8 do NOSSO está disponível em https://openupresources.org/math-curriculum/.

    As adaptações e atualizações do IM 6–8 Math são copyright 2019 da Illustrative Mathematics e são licenciadas pela Creative Commons Atribuição 4.0 International License (CC BY 4.0).

    As adaptações para adicionar suporte adicional ao aluno do idioma inglês são copyright 2019 da Open Up Resources e estão licenciadas sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

    O segundo conjunto de avaliações de inglês (marcado como conjunto "B") é protegido por direitos autorais 2019 da Open Up Resources e está licenciado sob a Licença Internacional Creative Commons Atribuição 4.0 (CC BY 4.0).

    A tradução para o espanhol das avaliações "B" possui copyright 2020 da Illustrative Mathematics e está licenciada sob a Licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0).

    O nome e o logotipo da Illustrative Mathematics não estão sujeitos à licença Creative Commons e não podem ser usados ​​sem o consentimento prévio e expresso por escrito da Illustrative Mathematics.

    Este site inclui imagens de domínio público ou imagens licenciadas abertamente que são protegidas por direitos autorais de seus respectivos proprietários. As imagens com licença aberta permanecem sob os termos de suas respectivas licenças. Veja a seção de atribuição de imagem para mais informações.


    Problema 1

    A gata de Priya está grávida de uma ninhada de 5 gatinhos. Cada gatinho tem 30% de chance de ser castanho chocolate. Priya quer saber a probabilidade de pelo menos dois dos gatinhos serem castanhos chocolate.

    Para simular isso, Priya colocou 3 cubos brancos e 7 cubos verdes em uma bolsa. Para cada tentativa, Priya retirou e devolveu um cubo 5 vezes. Priya conduziu 12 testes.

    Aqui está uma tabela com os resultados.

    1) Quantas tentativas bem-sucedidas ocorreram?

    2) Descreva como você determinou se um teste foi um sucesso.

    3) Com base nesta simulação, estime a probabilidade de que exatamente dois gatinhos serão castanhos chocolate.

    4) Com base nesta simulação, estime a probabilidade de que pelo menos dois gatinhos serão castanhos chocolate.

    5) Escreva e responda outra pergunta que Priya poderia responder usando esta simulação.

    6) Como o Priya poderia aumentar a precisão da simulação?

    Problema 2

    7) Uma equipe tem 75% de chance de vencer cada um dos 3 jogos que disputará nesta semana. Clare simula a semana de jogos colocando 4 pedaços de papel em uma sacola, 3 com a etiqueta “ganhar” e 1 com a etiqueta “perder”. Ela desenha um papel, anota o resultado, depois recoloca o papel e repete o processo mais duas vezes. Clare consegue o resultado: ganha, ganha, perde. O que Clare pode fazer para estimar a probabilidade de o time vencer pelo menos 2 jogos?


    R-bloggers

    Postado em 31 de dezembro de 2018 por Health Economics com blogueiros do R in R | 0 comentários

    Introdução

    Modelos de multiestado são usados ​​para modelar uma trajetória através de vários estados. Os modelos de sobrevivência são um caso especial em que existem dois estados, vivo e morto. Modelos multiestados são, portanto, úteis em ambientes clínicos porque podem ser usados ​​para prever ou simular a progressão da doença em detalhes. Putter et al. fornecer um tutorial útil.

    Nesta postagem, consideraremos os modelos de "ajuste do relógio" (ou seja, semi-Markov) em vez de modelos de "avanço do relógio" (ou seja, Markov). Em um modelo de “reajuste do relógio”, o tempo refere-se ao tempo desde a entrada no estado mais recente, enquanto em um modelo de “avanço do relógio”, o tempo se refere ao tempo desde a entrada no estado inicial. Ao usar uma abordagem de “reset do relógio”, as probabilidades de ocupação do estado só podem ser calculadas de uma forma geral por meio de simulação.

    A análise será restrita a modelos paramétricos, que são úteis para extrapolar além do horizonte de tempo nos dados existentes. Distribuições de probabilidade de exemplo incluem a exponencial, Weibull, Gompertz, gama, log-logística, lognormal e gama generalizada.

    O pacote flexsurv será usado para estimar os modelos paramétricos e os pacotes mstate e hesim (reconhecidamente desenvolvidos por mim) serão usados ​​para simular os modelos estimados. Iremos comparar a eficiência computacional de diferentes métodos de simulação.

    Um exemplo de modelo de 6 estados

    Para ilustrar, seguiremos Wreede et al. e usar um modelo de 6 estados para pacientes com leucemia após o transplante de medula óssea (veja a figura abaixo). Os seis estados são (1) Transplante (Tx), (2) Recuperação (Rec), (3) Evento Adverso (AE), (4) AE e Rec, (5) Recaída (Rel) e (6) Morte. As seguintes 12 transições são possíveis.

    1. Tx para Rec
    2. Tx para AE
    3. Tx para Rel
    4. Tx to Death
    5. Rec para AE e Rec
    6. Rec para Rel
    7. Rec to Death
    8. AE para AE e Rec
    9. AE para Rel
    10. AE até a morte
    11. AE e Rec to Rel
    12. AE e Rec to Death

    As transições podem ser caracterizadas com uma matriz de transição 6 x 6, que é uma matriz quadrada onde o elemento (i, j) é um número inteiro positivo se uma transição de i para j é possível e NA caso contrário.

    Estimativa

    Modelos paramétricos de múltiplos estados podem ser ajustados usando flexsurv e modelos não paramétricos e semi-paramétricos podem ser ajustados com mstate. Em nossa análise, ajustaremos um modelo paramétrico ao conjunto de dados ebmt4 do pacote mstate. Para obter informações adicionais sobre ajuste de modelo e dados de multiestado além do que é fornecido neste post, eu recomendo os artigos mstate e flexsurv publicados no Journal of Statistical Software.

    O conjunto de dados ebmt4 está em um formato "amplo", o que não é adequado para modelagem multiestado. Felizmente, o pacote mstate contém uma função auxiliar, mstate :: msprep (), que pode converter dados em um formato amplo para um formato “longo” adequado.

    Observe que os dados são configurados de forma que haja um tempo até o evento para cada transição permitida de um determinado estado. No conjunto de dados msebmt, essa variável é o tempo, que mede o tempo decorrido (em dias) de Tstart a Tstop. O conjunto de dados também contém uma variável chamada status, que denota se a transição foi observada (status = 1) ou se foi censurada (status = 0). De um determinado estado, apenas uma transição é observada e todas as outras são censuradas.

    Por exemplo, o paciente 2 começou no estado 1 (Tx) no tempo 0. Do estado 1, existem 4 transições possíveis: a transição 2 (Tx para AE) foi observada no tempo 12, enquanto a transição 1 (Tx para Rec), a transição 3 (Tx para Rel) e a transição 4 (Tx para Morte) foram censuradas. O paciente permaneceu no estado 3 até o momento 29, quando ocorreu a transição para o estado 4 (AE e Rec) e as transições para os estados 5 (Rel) e 6 (Morte) foram censuradas. O paciente 2 subsequentemente permaneceu no estado 4 até entrar no estado 5 (Rel) no tempo 422, momento em que a transição 12 (AE e Rec to Death) foi censurada.

    Apropriado

    Funções de perigo separadas, $ lambda_(t | Z) $ são estimados para cada transição possível do estado $ r $ para o estado $ s $ em função do tempo $ t $ e das covariáveis ​​$ Z $. Em modelos de “redefinição do relógio”, a função de risco depende do tempo decorrido desde a entrada no estado $ r $, ou simplesmente Tstop - Tstart. As funções de risco podem ser estimadas usando um modelo conjunto com os termos de interação do paciente e da transição ou ajustando modelos separados para cada transição.

    Aqui, ilustramos ajustando 12 modelos Weibull específicos de transição com uma escala de tempo anual. O parâmetro de forma para cada modelo não depende de covariáveis, enquanto o parâmetro de escala depende de quatro fatores prognósticos conhecidos na linha de base: (1) um indicador para saber se o doador é uma incompatibilidade de gênero (correspondência), profilaxia (sim ou não) (profilaxia) , (3) o ano do transplante (1985-1989, 1990-1994, 1995-1998) (ano), e (4) idade no transplante em anos (idade).

    Simulação

    Primeiro simulamos o modelo usando as estimativas de máxima verossimilhança dos coeficientes de regressão, ou seja, assumimos que não há incerteza de parâmetro. Os resultados serão simulados para o paciente 2 com o perfil de covariável exibido abaixo.

    As probabilidades de ocupação do estado serão calculadas desde a linha de base até o ano 10.

    Mstate

    Modelos multiestados podem ser simulados usando mstate :: mssample (), que simula probabilidades de ocupação de estado a partir de perigos cumulativos previstos. flexsurv pode ser usado para prever riscos cumulativos para um determinado paciente (ou seja, paciente 2) dado um perfil de covariável. Ao prever os perigos cumulativos, é fundamental que a grade de tempo (o argumento t) não seja muito grosseira. Um intervalo de tempo de .01 é usado para a grade de tempo, que (após tentativa e erro) foi considerada suficientemente precisa - as simulações com grades mais grosseiras diferiam significativamente das simulações baseadas em tempo contínuo usando hesim. Grades mais finas aumentariam ainda mais a precisão, mas ao custo de tempos de simulação mais lentos.

    A função mstate :: mssample () funciona amostrando os tempos de sobrevivência de cada transição possível dos perigos cumulativos. Mais precisamente, os perigos cumulativos são usados ​​para simular os tempos (discretos) em que os pacientes fazem a transição entre os estados de saúde usando a amostra de função R de base (), que é, por sua vez, usada para contar o número de pacientes em cada estado de saúde no tempos especificados pelo argumento tvec.

    A função abaixo usa mstate :: mssample () para simular as probabilidades de ocupação do estado com um modelo de “redefinição do relógio” nos horários especificados em yr_grid.

    Hesim

    A abordagem de hesim para simular modelos multiestado difere da de mstate em alguns aspectos. Em primeiro lugar, se os modelos paramétricos são estimados, então hesim amostra os tempos de sobrevivência diretamente das distribuições de probabilidade paramétrica (por exemplo, a distribuição Weibull). Isso aumenta a precisão (uma vez que nenhuma aproximação de tempo discreta é necessária) e a velocidade (uma vez que é consideravelmente mais rápido amostrar a partir de distribuições de probabilidade com formas funcionais conhecidas do que por amostragem de perigos cumulativos com amostra ()). Em segundo lugar, o código de simulação é vetorizado (ou seja, o código de simulação é escrito em C ++ aproveitando Rcpp) em pacientes heterogêneos e estratégias de tratamento. Em outras palavras, hesim pode ser usado para simular rapidamente vários perfis de covariável e alternativas de tratamento.

    Configuramos dados de entrada para a simulação criando um conjunto de dados de muitos pacientes idênticos, cada um com o perfil de covariável do paciente 2 e uma estratégia de tratamento única (ou seja, transplante de medula óssea). Um exemplo de conjunto de dados de 1.000 pacientes idênticos é exibido. (Observe que hesim usa data.table para aumentar a velocidade.)

    hesim combina os dados de entrada com o ajuste do modelo de flexsurvreg () para configurar um modelo de doença - especificamente, um modelo de transição de estado de tempo contínuo em nível individual (CTSTM). Semelhante a mstate :: mssample, a função $ sim_stateprobs () simula as probabilidades de ocupação do estado, primeiro simulando uma trajetória através do modelo multiestado para cada combinação de paciente e estratégia de tratamento e, em seguida, contando o número de pacientes simulados (para cada estratégia de tratamento) em cada estado ao longo do tempo.

    Comparação

    Simulamos as probabilidades de ocupação do estado usando mstate e hesim e variamos o número de pacientes simulados para examinar o impacto na precisão.

    Conforme mostrado no gráfico abaixo, as diferenças nas probabilidades de ocupação do estado geralmente tornam-se menores à medida que o número de pacientes simulados aumenta. Além disso, (embora não mostrado) os resultados da simulação de mstate tornam-se cada vez mais próximos de hesim à medida que a grade de tempo se torna mais precisa.

    Como 1.000 iterações geram estimativas razoavelmente precisas, avaliaremos a velocidade simulando 1.000 pacientes.

    Os tempos decorridos (em segundos) sugerem que hesim é 671,41 mais rápido do que mstate ao simular um modelo paramétrico de vários estados.

    Análise de sensibilidade probabilística

    Os resultados apresentados até agora ignoraram o impacto da incerteza dos parâmetros. Em contraste, a análise de sensibilidade probabilística (PSA) propaga a incerteza nos parâmetros para as probabilidades de ocupação do estado. Em nosso caso, os coeficientes de regressão do modelo multiestado são extraídos de uma distribuição de probabilidade adequada e a simulação multiestado é executada para cada sorteio dos coeficientes. Existem várias maneiras de simular a distribuição dos coeficientes, incluindo bootstrapping, modelagem bayesiana e aproximação assintótica de Monte Carlo. Usaremos a última abordagem amostrando as estimativas de máxima verossimilhança de uma distribuição multivariada assintótica, que é a opção mais rápida.

    Embora a amostragem de uma distribuição normal multivariada não seja computacionalmente intensiva, executar repetidamente a simulação para cada sorteio dos coeficientes de regressão é. Nesta seção, mostramos como executar PSA usando mstate e hesim e comparar o desempenho.

    Mstate

    O PSA pode ser executado usando mstate :: mssample () fazendo um loop através de uma distribuição de riscos cumulativos para um perfil de covariável e executando mstate :: mssample () para cada iteração do loop. A maneira mais direta de prever uma distribuição de perigos cumulativos é com os CTSTMs do pacote hesim. A função $ cumhazard () prevê riscos cumulativos por número de transição, amostra de parâmetro, estratégia de tratamento, paciente e tempo. Em nosso exemplo, prevemos riscos cumulativos para um único paciente (id = 2) e estratégia de tratamento.

    Uma distribuição de probabilidades de ocupação de estado simulado para o paciente 2 pode então ser simulada fazendo um loop sobre os perigos cumulativos para cada amostra de parâmetro.

    Hesim

    Com hesim, toda a análise é inerentemente bayesiana, portanto o PSA é perfeito. Ao criar um CTSTM a partir de um objeto flexsurvreg, o usuário deve simplesmente definir o argumento point_estimate = FALSE e escolher o número de amostras dos parâmetros a serem desenhados. A distribuição dos coeficientes de regressão é então desenhada por amostragem da distribuição normal multivariada. Além disso, o PSA é vetorizado, uma vez que os loops sobre as amostras de parâmetros são escritos em C ++.

    Comparação

    Em nossas comparações, continuamos simulando 1.000 pacientes. Com hesim, consideramos 100 e 1.000 amostras de parâmetros com mstate, restringimos a análise a 100 amostras de parâmetros porque ela se torna cada vez mais lenta à medida que o número de amostras de parâmetros aumenta.

    hesim é rápido, mesmo ao executar um PSA. Com 1.000 pacientes, 100 iterações de PSA podem ser simuladas em menos de um segundo e 1.000 iterações de PSA em aproximadamente 5 segundos. A eficiência computacional se torna cada vez mais importante à medida que as demandas computacionais aumentam: com 1.000 pacientes e 100 iterações de PSA, o mstate leva cerca de 34 minutos para ser executado e o hesim é 4633,57 vezes mais rápido.

    Conclusão

    Neste artigo, descrevemos alguns dos pacotes R que facilitam a modelagem multiestado. O pacote flexsurv é particularmente útil para estimar modelos paramétricos. Quando os modelos de “redefinição do relógio” são adequados, as probabilidades de ocupação de estado só podem ser previstas para modelos de multiestado gerais usando simulação. Os pacotes hesim e mstate fornecem funcionalidade para executar tais simulações. No entanto, quando os modelos paramétricos são ajustados, hesim é consideravelmente mais rápido e essa vantagem computacional aumenta com o número de iterações necessárias. A vantagem de velocidade pode ser particularmente útil ao executar um PSA, análises de múltiplos subgrupos e / ou simulações usando distribuições de sobrevivência concorrentes.


    Gere o espaço de amostra usando uma tabela para formar o produto cartesiano

    Quando há apenas dois estágios em um experimento, uma maneira comum de listar os resultados possíveis é formar um produto cartesiano. Isso é semelhante a quando você formou conjuntos de pares ordenados em álgebra ao fazer um gráfico em um plano de coordenadas cartesianas. Na álgebra, usamos um eixo horizontal e vertical, onde o eixo horizontal representou os primeiros valores, x, e o eixo vertical representou os segundos valores, y, em pares ordenados, (x, y) Aqui, criamos um tabela para nos ajudar a formar o Produto Cartesiano onde as linhas representam os resultados possíveis para o primeiro experimento (na lateral) e as colunas representam os resultados possíveis para o segundo experimento (na parte superior). Assim:

    Para formar o Produto cartesiano, listamos em cada célula interna da tabela o par ordenado que resulta do resultado listado ao lado, seguido pelos resultados listados no topo.

    O espaço amostral é o conjunto de resultados listados nas células sombreadas,

    Observe que temos doze resultados possíveis neste espaço de amostra para este experimento de dois estágios, que segue do Princípio Fundamental de Contagem 2 & # 183 6 = 12 ..


    Simulando o ambiente de vários estágios para experimentos de compressor de estágio único

    Place, JMM, Howard, MA e Cumpsty, NA. "Simulando o ambiente de vários estágios para experimentos de compressor de um único estágio." Proceedings of the ASME 1995 International Gas Turbine and Aeroengine Congress and Exposition. Volume 1: Turbomaquinaria. Houston, Texas, EUA. 5 a 8 de junho de 1995. V001T01A046. COMO EU. https://doi.org/10.1115/95-GT-187

    O desempenho de um compressor de baixa velocidade de estágio único foi medido antes e depois da introdução de certos recursos do ambiente de fluxo de múltiplos estágios. O objetivo é tornar a plataforma de estágio único mais apropriada para o desenvolvimento de regras de projeto para compressores de múltiplos estágios. O bloqueio da parede final foi gerado por dentes no cubo e no revestimento a montante do rotor. Uma grade instalada a montante produziu turbulência de fluxo livre na entrada do rotor, típica de máquinas de vários estágios, e aumentou a eficiência do estágio em 1,8% no ponto do projeto. O campo potencial que seria gerado por fileiras de lâminas a jusante de um estágio incorporado foi replicado pela introdução de uma tela de perda de pressão na saída do estágio. Isso reduziu a separação do canto do cubo do estator e aumentou o aumento da pressão do rotor em taxas de fluxo abaixo do projeto, mudando a forma da característica de aumento de pressão acentuadamente. Esses resultados destacam a importância dos recursos do ambiente de fluxo que muitas vezes são omitidos nos experimentos de estágio único e oferecem uma melhor compreensão da aerodinâmica do estágio.


    ISHIKAWA, T. (1982): Prevenção contra acidentes com raios no Japão. Nihon Univ. J. Med. 24: 1-14.

    ISHIKAWA, T., MIYAZAWA, T., OHASHI, M., HOSOMI, Y., FUJISHIRO, Y., MUTO, T., KITAGAWA, N., TSURUMI, S. e KINOSHITA, K. (1978): Valor limite de energia letal de descarga de relâmpago artificial aplicada em coelhos. J. Toden Hosp. 8: 89–100 (em japonês).

    ISHIKAWA, T., MIYAZAWA, T., OHASHI, M., MUTO, T., KITAGAWA, N., TAKAGI, K., KINOSHITA, K. and TSURUMI, S. (1981): Experimental studies on the effect of artificial respiration after lightning discharge. Res. Exp. Med. (Berl.) 179: 59–68.

    KITAGAWA, N. (1972): The nature of lightning incidence on the human bodies: Basis for their protection. Proceedings of the Institute of Electrostatics Japan, 17: 239–241.

    KITAGAWA, N., BROOK, M. and WORKMAN, E. J. (1962): Continuing currents in cloud-to-ground lightning discharge. J. Geophysical Research, 67: 637–647.

    KITAGAWA, N., KINOSHITA, K. and ISHIKAWA, T. (1972): Discharge experiments using dummies and rabbits simulating lightning strokes on human bodies. Int. J. Biometeor. 17: 239–241.

    NAGAI, N., ISHIKAWA, T., OHASHI, M. and KITAGAWA, N. (1982): Study of lethal effects of multiple-stroke flash. Research letters on Atmospheric Electricity, 2: 87–90.

    OHASHI, M., HOSOMI, Y., FUJISHIRO, Y. and MUTO, T. (1978): Threshold value of lethal energy of electric discharge to rats. J. Toden Hosp. 8: 71–79 (in Japanese).

    OHASHI, M., HOSOMI, Y. and FUJISHIRO, Y. (1981a): Lethal threshold energy of artificial lightning applied on rats: comparison of lethal energy of rats and rabbits. J. Toden Hosp. 10–11: 41–50 (in Japanese).

    OHASHI, M., HOSOMI, Y., FUJISHIRO, Y., ISHIKAWA, T., MIYAZAWA, T., KITAGAWA, N., TSURUMI, S., KINOSHITA, K., NAGAI, Y. and TAKAGI, K. (1981b): Experimental studies of resuscitation for rabbit after artificial lightning discharge. J. Toden Hosp. 10–11: 51–61.

    OHASHI, M., KIMURA, T. and KIKUCHI, K. (1981c): Autopsies of rabbit subjected by artificial lightning stroke. J. Toden Hosp. 10–11: 63–73 (in Japanese).


    R-bloggers

    Posted on December 31, 2018 by Devin Incerti in R bloggers | 0 Comments

    Introdução

    Multi-state models are used to model a trajectory through multiple states. Survival models are a special case in which there are two states, alive and dead. Multi-state models are therefore useful in clinical settings because they can be used to predict or simulate disease progression in detail. Putter et al. provide a helpful tutorial.

    In this post, we will consider “clock-reset” (i.e., semi-Markov) models rather than “clock-forward” (i.e., Markov) models. In a “clock-reset” model, time refers to time since entering the most recent state, whereas in a “clock-forward” model time refers to time since entering the initial state. When using a “clock-reset” approach, state occupancy probabilities can only be computed in a general fashion via simulation.

    The analysis will be restricted to parametric models, which are useful for extrapolating beyond the the time horizon in the existing data. Example probability distributions include the exponential, Weibull, Gompertz, gamma, log-logistic, lognormal, and generalized gamma.

    The flexsurv package will be used to estimate the parametric models and the mstate and hesim (admittedly developed by me) packages will be used to simulate the estimated models. We will compare the computational efficiency of different simulation methods.

    An example 6-state model

    To illustrate, we will follow Wreede et al. and use a 6-state model for leukemia patients following bone marrow transplantation (see figure below). The six states are (1) Transplant (Tx), (2) Recovery (Rec), (3) Adverse Event (AE), (4) AE and Rec, (5) Relapse (Rel), and (6) Death. The following 12 transitions are possible.

    1. Tx to Rec
    2. Tx to AE
    3. Tx to Rel
    4. Tx to Death
    5. Rec to AE and Rec
    6. Rec to Rel
    7. Rec to Death
    8. AE to AE and Rec
    9. AE to Rel
    10. AE to Death
    11. AE and Rec to Rel
    12. AE and Rec to Death

    The transitions can be characterized with a 6 x 6 transition matrix, which is a square-matrix where the (i,j) element is a positive integer if a transition from i to j is possible and NA otherwise.

    Estimation

    Parametric multi-state models can be fit using flexsurv and both non-parametric and semi-parametric models can be fit with mstate . In our analysis, we will fit a parametric model to the ebmt4 dataset from the mstate package. For additional information on model fitting and multi-state data beyond what is provided in this post, I recommend the mstate and flexsurv articles published in the Journal of Statistical Software.

    The ebmt4 dataset is in a “wide” format, which is not suitable for multi-state modeling. Luckily, the mstate package contains a helper function, mstate::msprep() , which can convert data in wide format to a suitable “long” format.

    Notice that the data is set up so that there is a time-to-event for each permitted transition from a given state. In the msebmt dataset, this variable is time , which measures the time elapsed (in days) from Tstart to Tstop . The dataset also contains a variable named status , which denotes whether the transition is observed ( status = 1 ) or whether it was censored ( status = 0 ). From a given state, only one transition is observed and all others are censored.

    For example, patient 2 began in state 1 (Tx) at time 0 . From state 1, there are 4 possible transitions: transition 2 (Tx to AE) was observed at time 12 while transition 1 (Tx to Rec), transition 3 (Tx to Rel), and transition 4 (Tx to Death) were censored. The patient remained in state 3 until time 29 , when a transition to state 4 (AE and Rec) occurred and the transitions to states 5 (Rel) and 6 (Death) were censored. Patient 2 subsequently remained in state 4 until entering state 5 (Rel) at time 422 , at which time transition 12 (AE and Rec to Death) was censored.

    Fitting

    Separate hazard functions, $lambda_(t|Z)$ are estimated for each possible transition from state $r$ to state $s$ as a function of time $t$ and covariates $Z$. In “clock-reset” models, the hazard function depends on elapsed time since entering state $r$, or simply Tstop - Tstart . The hazard functions can be estimated using a joint model with patient and transition interaction terms or by fitting separate models for each transition.

    Here we illustrate by fitting 12 transition-specific Weibull models with a yearly time scale. The shape parameter for each model does not depend on covariates whereas the scale parameter depends on four prognostic factors known at baseline: (1) an indicator for whether the donor is a gender mismatch ( match ), prophylaxis (yes or no) ( proph ), (3) the year of the transplant (1985-1989, 1990-1994, 1995-1998) ( year ), and (4) age at transplant in years ( agecl ).

    Simulation

    We first simulate the model using the maximum likelihood estimates of the regression coefficients that is, we assume that there is no parameter uncertainty. Outcomes will be simulated for patient 2 with the covariate profile displayed below.

    State occupancy probabilities will be computed from baseline to year 10.

    Mstate

    Multi-state models can be simulated using mstate::mssample() , which simulates state occupancy probabilities from predicted cumulative hazards. flexsurv can be used to predict cumulative hazards for a given patient (i.e., patient 2) given a covariate profile. When predicting the cumulative hazards, it is critical that the time grid (the t argument) is not too coarse. A time step of .01 is used for the time grid, which (after trial and error) was deemed to be sufficiently accurate — simulations with coarser grids differed significantly from simulations based on continuous time using hesim . Finer grids would further increase accuracy but at the cost of slower simulation times.

    The mstate::mssample() function works by sampling survival times from each possible transition from the cumulative hazards. More precisely, the cumulative hazards are used to simulate the (discrete) times at which patients transition between health states using the base R function sample() , which is, in turn, used to count the number of patients in each health state at the times specified by the argument tvec .

    The function below uses mstate::mssample() to simulate state occupancy probabilities with a “clock-reset” model at the times specified in yr_grid .

    Hesim

    hesim's approach to simulating multi-state models differs from mstate's in a couple of ways. First, if parametric models are estimated, then hesim samples survival times directly from parametric probability distributions (e.g., the Weibull distribution). This increases accuracy (since no discrete time approximation is required) and speed (since it is considerably faster to sample from probability distributions with known functional forms than by sampling from cumulative hazards with sample() ). Second, the simulation code is vectorized (i.e., the simulation code is written in C++ by leveraging Rcpp) across heterogeneous patients and treatment strategies. In other words, hesim can be used to quickly simulate multiple covariate profiles and treatment alternatives.

    We set up input data for the simulation by creating a dataset of many identical patients each with the covariate profile of patient 2 and a single treatment strategy (i.e., bone marrow transplantation). An example dataset of 1,000 identical patients is displayed. (Note that hesim uses data.table to increase speed.)

    hesim combines the input data with the model fit from flexsurvreg() to set up a disease model—specifically, an individual-level continuous time state transition model (CTSTM). Similar to mstate::mssample , the $sim_stateprobs() function simulates state occupancy probabilities by first simulating a trajectory through the multi-state model for each patient and treatment strategy combination and then counting the number of simulated patients (for each treatment strategy) in each state over time.

    Comparison

    We simulate state occupancy probabilities using both mstate and hesim and vary the number of simulated patients to examine the impact on precision.

    As shown in the plot below, the differences in state occupancy probabilities generally become smaller as the number of simulated patients increases. Further, (although not shown) the simulation results from mstate become increasingly close to hesim as the time grid becomes finer.

    Since 1,000 iterations generate reasonably accurate estimates, we will assess speed by simulating 1,000 patients.

    The elapsed times (in seconds) suggest that hesim is 671.41 times faster than mstate when simulating a parametric multi-state model.

    Probabilistic sensitivity analysis

    The results presented so far have ignored the impact of parameter uncertainty. In contrast, probabilistic sensitivity analysis (PSA) propagates uncertainty in the parameters to the state occupancy probabilities. In our case, the regression coefficients from the multi-state model are drawn from a suitable probability distribution and the multi-state simulation is run for each draw of the coefficients. There are a number of ways to simulate the distribution of the coefficients including bootstrapping, Bayesian modeling, and asymptotic Monte Carlo approximation. We will take the latter approach by sampling the maximum likelihood estimates from an asymptotic multivariate distribution, which is the fastest option.

    Although sampling from a multivariate normal distribution is not computationally intensive, repeatedly rerunning the simulation for each draw of the regression coefficients is. In this section, we show how to perform PSA using both mstate and hesim and compare performance.

    Mstate

    PSA can be performed using mstate::mssample() by looping through a distribution of cumulative hazards for a covariate profile and running mstate::mssample() for each iteration of the loop. The most straightforward way to predict a distribution of cumulative hazards is with the CTSTMs from the hesim package. The $cumhazard() function predicts cumulative hazards by transition number, parameter sample, treatment strategy, patient, and time. In our example, we predict cumulative hazards for a single patient (id = 2) and treatment strategy.

    A distribution of simulated state occupancy probabilities for patient 2 can then be simulated by looping over the cumulative hazards for each parameter sample.

    Hesim

    With hesim , the entire analysis is inherently Bayesian so PSA is seamless. When creating a CTSTM from a flexsurvreg object, the user must simply set the argument point_estimate = FALSE and choose the number of samples of the parameters to draw. The distribution of the regression coefficients is then drawn by sampling from the multivariate normal distribution. Furthermore, the PSA is vectorized since the loops over the parameter samples are written in C++.

    Comparison

    In our comparisons, we continue to simulate 1,000 patients. With hesim , we consider both 100 and 1,000 parameter samples with mstate we restrict the analysis to 100 parameter samples because it becomes increasingly slow as the number of parameter samples increases.

    hesim is fast, even when performing a PSA. With 1,000 patients, 100 PSA iterations can be simulated in less than a second and 1,000 PSA iterations in approximately 5 seconds. Computational efficiency becomes increasingly important as the computational demands grow: with 1,000 patients and 100 PSA iterations, mstate takes around 34 minutes to run and hesim is 4633.57 times faster.

    Conclusão

    In this post, we describe some of the R packages that facilitate multi-state modeling. The flexsurv package is particularly useful for estimating parametric models. When “clock-reset” models are fit, state occupancy probabilities can only be predicted for general multi-state models using simulation. Both the hesim and mstate packages provide functionality for running such simulations. However, when parametric models are fit, hesim is considerably faster and this computational advantage grows with the number of required iterations. The speed advantage may be particularly useful when running a PSA, multiple subgroup analyses, and/or simulations using competing survival distributions.


    Multi-step forming simulation and experiment of swing arms for torsion beam

    Numerical simulations of bending, performing, and hydroforming processes of automotive swing arms for torsion beam were conducted using finite element analysis. The process parameters such as bending radius, mandrels, loading paths, and calibration pressure were optimized in the simulation. In addition, closing force was predicted by die stress&ndashstrain analysis using the elastic finite element method. Subsequently, the bending, performing, and hydroforming experiments were performed based on the simulation results. The experimental results indicated that swing arms could be fabricated when the bending radius, calibration pressure, and closing force would be of 120 mm, 150 MPa, and 15,000 kN, respectively. Finally, swing arms with high thickness uniformity were obtained and the thickness distribution between numerical and experimental results was well consistent.

    Journal

    The International Journal of Advanced Manufacturing Technology &ndash Springer Journals


    Assista o vídeo: Introduction to XCTU (Outubro 2021).