Tratamento de valores omissos num conjunto de dados

Wilson, Fátima Bin A.A.

DSpace at My University FC - Faculdade de Ciências FC - Estatística

Use este identificador para citar ou linkar para este item: http://monografias.uem.mz/handle/123456789/1809

Tipo:	Trabalho de Conclusão de Curso
Título:	Tratamento de valores omissos num conjunto de dados
Autor(es):	Wilson, Fátima Bin A.A.
Primeiro Orientador:	Mulenga, Alberto
Resumo:	Qualquer estudo feito por amostragem está sujeito a vários erros. Os erros provenientes do próprio mecanismo de aleatorização utilizado, ditos erros de amostragem, sendo amostra apenas uma parte da população e os resultados obtidos destas amostras são apenas estimativas dos parâmetros da população, existirão provavelmente diferenças entre os dois valores e os erros de não – amostragem, que incluem todos restantes erros que podem surgir em qualquer dos passos do processo de estudo como por exemplo na definição do objectivo do estudo, no desenho do questionário ou mesmo por recusas ou não respostas, etc. O presente trabalho tem como objectivo ilustrar o uso adequado de técnicas estatísticas para tratamento de informação com dados omissos, e para o efeito foram usadas duas bases de dados cujos tamanhos das amostras foram obtidos em função da informação disponível na base de dados. Para o tratamento dos valores omissos foram usados os métodos de Imputação múltipla, Expectativa máxima e vários testes em particular o teste MCAR de Little para identificar o mecanismo de aleatoriedade da omissão de dados. Os resultados mostram que o erro padrão obtido da média da amostra jornal depois da imputação é menor que o erro padrão da média antes da imputação dos valores omissos indicando assim que a amostra depois da imputação é mais representativa da população que provém. Os resultados mostram também que o modelo obtido da amostra agregado familiar classifica apenas 153 casos no universo de 613 observações enquanto que depois da imputação classifica todas observações. O grau de ajustamento do modelo depois da imputação é menor que o grau de ajustamento antes da imputação. Concluindo-se que os valores omissos não só têm um impacto acentuado nos resultados, mas também pelo seu impacto prático na diminuição do tamanho da amostra disponível para análise, e quando atitudes correctivas não são aplicadas os resultados obtidos podem levar a uma conclusão errada sobre o comportamento do fenómeno na população
Abstract:	Any study done by sampling is subject to several errors. Errors arising from the own randomization mechanism used, said sampling errors, being sample only a part of the population and the results obtained from these samples are only estimates of the population parameters, there are likely to be differences between the two values and the errors of no - sampling, which include all other errors that may arise in any of the steps of the study process, for example in defining the purpose of the study, in the design of the questionnaire or even by refusals or non-answers, etc. The present work aims to illustrate the proper use of statistical techniques for processing information with missing data, and for this purpose two databases were used whose sample sizes were obtained as a function of the information available in the database. Dice. For the treatment of missing values, the Multiple Imputation methods were used, Maximum expectation and several tests in particular Little's MCAR test to identify the randomness mechanism of data omission. The results show that the standard error obtained from the newspaper sample mean after imputation is less than the standard error of the mean before imputation of missing values, thus indicating that the sample after imputation is more representative of the population it comes from. The results also show that the model obtained from the household sample classifies only 153 cases. in the universe of 613 observations while after imputation it classifies all observations. The degree of adjustment of the model after imputation is less than the degree of adjustment before of imputation. Concluding that the missing values not only have a marked impact on the results, but also for its practical impact in reducing the size of the sample available for analysis, and when corrective attitudes are not applied, the results obtained can lead to a wrong conclusion about the behavior of the phenomenon in the population. Keywords: Omission, Imputation, Randomness.
Palavras-chave:	Omissão Aleatoriedade Imputação
CNPq:	Ciências Exactas e da Terra Probabilidade e Estatίstica
Idioma:	por
País:	Moçambique
Editor:	Universidade Eduardo Mondlane
Sigla da Instituição:	UEM
metadata.dc.publisher.department:	Departamento de Matemática e Informática
Tipo de Acesso:	Acesso Aberto
URI:	http://monografias.uem.mz/handle/123456789/1809
Data do documento:	15-Jul-2010
Aparece nas coleções:	FC - Estatística

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2010 - Wilson, Fátima Bin A.A .pdf		898.84 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas