Padronizar variáveis no stata forex


Embora a terminologia seja um tema controverso, prefiro chamar variáveis ​​explicativas, variáveis ​​preditoras. Quando padronizar os preditores: muitos softwares para realizar regressão linear múltipla fornecerão coeficientes padronizados que são equivalentes a coeficientes não padronizados, onde você padroniza os preditores e a variável de resposta (é claro, parece que você está falando apenas de preditores de padronização). Minha opinião é que a padronização é uma ferramenta útil para tornar as equações de regressão mais significativas. Isto é particularmente verdadeiro nos casos em que a métrica da variável não tem significado para a pessoa que interpreta a equação de regressão (por exemplo, uma escala psicológica em uma métrica arbitrária). Ele também pode ser usado para facilitar a comparabilidade da importância relativa das variáveis ​​preditoras (embora existam outras abordagens mais sofisticadas para avaliar a importância relativa, veja minha postagem para uma discussão). Nos casos em que a métrica tem significado para a pessoa que interpreta a equação de regressão, os coeficientes não padronizados são geralmente mais informativos. Eu também acho que depender de variáveis ​​padronizadas pode tirar atenção do fato de que não pensamos sobre como tornar a métrica de uma variável mais significativa para o leitor. Andrew Gelman tem um pouco a dizer sobre o assunto. Veja sua página sobre padronização, por exemplo, e Gelman (2008, Stats Med, PDF GRATUITO) em particular. Previsão baseada em standarisation: eu não usaria coeficientes de regressão padronizados para predição. Você sempre pode converter coeficientes padronizados em coeficientes não padronizados se você conhecer a média e desvio padrão da variável preditor na amostra original. MichaelBishop I39m pensando em contextos onde você leva seu modelo de regressão e aplica-o para prever os dados da amostra. Em geral, você deseja predições não padronizadas. Além disso, os meios e os desvios padrão podem mudar em amostras usando preditores não padronizados, portanto, devem dar resultados mais significativos. Ndash Jeromy Anglim 2 de dezembro 11 às 4:06 Deixe-me responder com uma resposta curta, pois pode se sobrepor com a excelente resposta escrita antes. Sempre padronizado, isso permite que você interprete a regressão, especialmente os coeficientes da regressão melhor. Para os novos dados que não são padronizados, recomendo que você armazene os valores que você usou para cada variável para ser padronizado, como o máximo e o mínimo, e então faça a mesma transformação que você fez no conjunto de dados do buraco antes, mas apenas para isso Instância única. A padronização é sobre os pesos de diferentes variáveis ​​para o modelo. Se você fizer a padronização apenas por causa da estabilidade numérica, pode haver transformações que produzam propriedades numéricas muito semelhantes, mas diferentes significados físicos que poderiam ser muito mais apropriados para a interpretação. O mesmo é verdadeiro para a centralização, que geralmente é parte da padronização. Situações em que você provavelmente deseja padronizar: as variáveis ​​são quantidades físicas diferentes e os valores numéricos estão em diferentes escalas de magnitude e não há conhecimento externo de que as variáveis ​​com variação alta (numérica) devem ser consideradas mais importantes. Situações onde você pode não querer padronizar: se as variáveis ​​são a mesma quantidade física, e são (grosso modo) da mesma magnitude, e. Concentrações relativas de diferentes absorvências de espécies químicas em diferentes intensidades de emissão de comprimentos de onda (caso contrário, condições de medição) em diferentes comprimentos de onda você definitivamente não deseja padronizar variáveis ​​que não mudam entre as amostras (canais de linha de base) - você apenas explodiu o ruído de medição (você pode Quer excluí-los do modelo em vez disso) se você tiver essas variáveis ​​fisicamente relacionadas, seu ruído de medição pode ser aproximadamente o mesmo para todas as variáveis, mas a intensidade do sinal varia muito mais. Isto é, As variáveis ​​com valores baixos têm maior ruído relativo. A padronização explodiria o ruído. Em outras palavras, você pode ter que decidir se deseja que o ruído relativo ou absoluto seja padronizado. Pode haver valores fisicamente significativos que você pode usar para relacionar o seu valor medido, p. Ex. Em vez da intensidade transmitida, use a porcentagem de intensidade transmitida (transmitância T). Você pode fazer algo intermediário e transformar as variáveis ​​ou escolher a unidade para que as novas variáveis ​​ainda tenham significado físico, mas a variação no valor numérico não é diferente, por exemplo, Se você trabalha com camundongos, use o peso corporal g e o comprimento em cm (alcance esperado de variação de aproximadamente 5 para ambos) em vez das unidades base kg e m (intervalo esperado de variação 0,005 kg e 0,05 m - uma ordem de grandeza diferente). Para a transmitância T acima, você pode considerar usar a absorvência A - log T Similar para a centralização: Pode haver (fisicamente mecânica) valores de linha de base válidos disponíveis (por exemplo, controles, persianas, etc.) O significado realmente significativo (O médio humano tem Um ovário e um testículo) sarikan: dê uma olhada na fig. 1 neste artigo: americanlaboratory913-Technical-Articleshellip por razões biológicas e físico-químicas, na faixa entre 2000 e 2700 cm, não são esperados sinais. Esta região pode ser usada para estimar a linha de base (de efeitos físicos que não são Raman), que é então subtraída. Essas variações serão então aproximadamente zero mais algum ruído. Ndash cbeleites 7 de dezembro às 21:32 Eu questiono sua afirmação de que os preditores padronizadores geralmente não são recomendados, especialmente quando as interações estão envolvidas. Nem Gelman e Hill, nem o Bryn Raudenbush Bryk mencionam essa preocupação em seus textos. Mas quando eu tiver uma chance, eu vou olhar para as referências que você menciona com interesse. Ndash Michael Bishop Dec 1 11 às 20:16 Se usarmos o universo de calibração como variável de escala, a escala não é estocástica. Ndash adam Jan 28 15 às 21:33 Sua resposta 2017 Stack Exchange, Inc

Comments

Popular Posts