EXTENSÕES DO ALGORÍTMO DE ÁRVORES DE CLASSIFICAÇÃO PARA A ANÁLISE DE DADOS CATEGORIZADOS MULTIVARIADOS UTILIZANDO COEFICIENTES DE DISSIMILARIDADE E ENTROPIA

Cesar Augusto TACONELI[1]

Silvio Sandoval ZOCCHI[2]

Carlos Tadeu dos Santos DIAS2

§     RESUMO: A análise estatística de grandes bancos de dados requer a utilização de metodologias flexíveis, capazes de produzir resultados esclarecedores e facilmente compreensíveis frente a dificuldades como a presença de números elevados de variáveis, diferentes graus de associações entre as mesmas e dados ausentes. A utilização de árvores de classificação e regressão proporciona a modelagem de uma variável resposta, categorizada ou numérica, com base em um conjunto de covariáveis, sem esbarrar nas dificuldades mencionadas. A extensão multivariada de técnicas de classificação e regressão por árvores tem sido estudada de maneira mais acentuada para situações em que se têm múltiplas variáveis resposta numéricas. Propõe-se neste trabalho metodologias fundamentadas em árvores de classificação multivariadas aplicadas à análise de múltiplas variáveis resposta categorizadas, com base em coeficientes de dissimilaridade e entropia. Por meio de um estudo de simulação, verificou-se que os resultados produzidos pelos métodos propostos são melhores quanto maiores as entropias e correlações das variáveis sob estudo. A análise de dados de consumo de álcool e fumo dos habitantes do município de Botucatu-SP complementa o presente estudo, indicando, dentre outras coisas, o grau de escolaridade, a ocupação profissional e a possibilidade de compartilhar problemas com amigos como fatores que influenciam o perfil de consumo de álcool e fumo dos habitantes.

§     PALAVRAS CHAVE: Árvores de classificação; dissimilaridade; entropia; álcool e fumo; simulação multivariada.

 



[1] Departamento de Estatística, Universidade Federal do Paraná – UFPR, CEP 81531-990, Curitiba, PR, Brasil. E-mail: taconeli@ufpr.br

[2] Departamento de Ciências Exatas, Escola Superior de Agricultura Luiz de Queiroz – ESALQ, Universidade de São Paulo ­ USP, CEP 13418-900, Piracicaba, SP, Brasil. E-mail: sszocchi@esalq.usp.br / ctsdias@esalq.usp.br