Browsing by Author "Bacelar-Nicolau, Helena"
Now showing 1 - 10 of 34
Results Per Page
Sort Options
- Análise Classificatória de Dados de Natureza Complexa: Uma aplicação do Coeficiente de AfinidadePublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoA Análise de Dados Simbólicos (ADS) é um domínio recente na área da descoberta do conhecimento e da gestão de dados. O seu primeiro passo consiste na extracção de informações úteis a partir de bases de dados de elevada dimensão, como em Data Mining, de modo a sumariar esses dados em termos dos seus conceitos mais relevantes. O segundo passo em ADS é aplicar novas ferramentas às informações extraídas, visando estender o Data Mining ao Knowledge Mining.O coeficiente de afinidade generalizado ponderado é uma medida de semelhança apropriada à Análise Classificatória (Cluster Analysis) de dados de natureza complexa (dados simbólicos), mesmo no caso de dados heterogéneos e de elevada dimensão. Neste trabalho, é dada uma atenção especial às medidas de proximidade entre objectos simbólicos, entre as quais o coeficiente de afinidade generalizado ponderado. É ilustrada a aplicação da Análise Classificatória Hierárquica Ascendente (ACHA) a dados de natureza complexa, retirados da literatura, com base no coeficiente de afinidade generalizado ponderado e em critérios de agregação clássicos e probabilísticos, estes últimos no âmbito da metodologia VL. Os resultados obtidos são comparados com os de outros autores.
- Análise dos perfis de consumo de cannabis pelos adolescentes de Ponta DelgadaPublication . Sousa, Áurea; Pereira, Hélder Rocha; Raposo, Sara; Silva, Osvaldo; Bacelar-Nicolau, HelenaA cannabis é a droga ilícita mais produzida e consumida na Europa e, embora seja uma “droga leve”, é reconhecido o seu impacto nas alterações de memória, nas sensações e nos comportamentos. Apresentam-se as principais conclusões obtidas, com base num questionário e em métodos de Análise de Dados (do univariado ao multivariado), com o objetivo de estimar a prevalência e determinar os perfis de consumo de cannabis por parte dos estudantes do Ensino Secundário do concelho de Ponta Delgada (Açores).
- Aplicação do Coeficiente de Afinidade a Dados de Natureza ComplexaPublication . Sousa, Áurea; Silva, Osvaldo; Bacelar-Nicolau, Helena; Nicolau, FernandoÉ ilustrada a aplicação da Análise Classificatória Hierárquica Ascendente a dados de natureza complexa, com base no coeficiente de afinidade generalizado ponderado e em critérios de agregação clássicos e probabilísticos, estes últimos no âmbito da metodologia VL.
- Avaliação e comparação de partições numa perspectiva global dos resultadosPublication . Silva, Osvaldo; Bacelar-Nicolau, Helena; Nicolau, Fernando C.Neste trabalho, trata-se de uma metodologia global que tem vindo a ser desenvolvida para avaliar a qualidade dos resultados de uma Análise Classificatória, com base em índices de estabilidade, isolamento e homogeneidade das classes, entre outros. Em complemento, desenvolvemos também um método de visualização, que permite realçar as semelhanças e as diferenças entre as partições e entre os elementos pertencentes a essas partições. A aplicação da metodologia é ilustrada com base num conjunto de dados heterogéneos e de natureza complexa.
- Classes de objectos simbólicos: dados da indústria automóvelPublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoNeste trabalho, é abordada a Análise Classificatória Hierárquica Ascendente (ACHA) de dados simbólicos ou complexos (generalizações de dados clássicos), com base no coeficiente de afinidade generalizado ponderado e em critérios de agregação clássicos e probabilísticos, estes últimos no âmbito da metodologia VL. São apresentados os principais resultados obtidos com a ACHA de 33 modelos de carros (dados simbólicos na área da indústria automóvel), com base no coeficiente de afinidade generalizado ponderado, centrado e reduzido pelo método de Wald e Wolfowitz, comparando-se os resultados obtidos com os de outros autores e com a partição definida a priori pelas categorias ("Utilitário", "Berlina", "Desportivo", "Luxo") a que os modelos de carros pertencem.
- Classificação de dados de natureza complexa no contexto da Avaliação 360ºPublication . Sousa, Áurea; Batista, Maria da Graça Câmara; Medeiros, Marina do Couto; Bacelar-Nicolau, HelenaOs indivíduos no seu ambiente organizacional têm um papel preponderante nas empresas. Apresentam-se os principais resultados relativos à Avaliação 360º dos trabalhadores de uma empresa do setor da Medicina Dentária, a qual congrega a visão dos diferentes indivíduos envolvidos no trabalho de cada colaborador. Os resultados obtidos apontam para um desempenho satisfatório, permitiram identificar grupos / clusters de indivíduos associados a tipos de desempenho distintos e mostraram aspetos que poderão ser melhorados mediante a adoção de um conjunto de ações, no âmbito de uma intervenção estratégica fundada sobre o conhecimento, e que potenciem o melhoramento contínuo do desempenho de cada colaborador.
- Classificação hierárquica de dados intervalares da indústria automóvel com o coeficiente de afinidadePublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Silva, Osvaldo; Nicolau, Fernando C.São mostradas as estruturas classificatórias mais relevantes, obtidas com a Análise Classificatória Hierárquica de um conjunto de dados retirado da literatura da análise de dados complexos, referentes a modelos de carros (Car data set), com base no coeficiente de afinidade generalizado, ponderado, centrado e reduzido pelo método de Wald e Wolfowitz, e em critérios de agregação probabilísticos no âmbito da Metodologia VL. Comparam-se os resultados obtidos com os de outros autores e diferentes métodos, bem como com uma partição definida a priori. Os métodos utilizados foram capazes de detetar classes consistentes e consonantes de macro-dados, quer com a partição a priori quer com os resultados de outros autores, e enquadram-se nas metodologias de Análise de Dados Simbólicos (ADS), sendo de salientar que as agregações implícitas nessas abordagens permitem o tratamento de bases de micro-dados (dados não agregados) de grande dimensão.
- Cluster Analysis of Business DataPublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Silva, OsvaldoIn this work, classical as well as probabilistic hierarchical clustering models are used to look for typologies of variables in classical data, typologies of groups of individuals in a classical three-way data table, and typologies of groups of individuals in a symbolic data table. The data are issued from a questionnaire on business area in order to evaluate the quality and satisfaction with the services provided to customers by an automobile company. The Ascendant Hierarchical Cluster Analysis (AHCA) is based, respectively, on the basic affinity coefficient and on extensions of this coefficient for the cases of a classical three-way data table and a symbolic data table, obtained from the weighted generalized affinity coefficient. The probabilistic aggregation criteria used, under the probabilistic approach named VL methodology (V for Validity, L for Linkage), resort essentially to probabilistic notions for the definition of the comparative functions. The validation of the obtained partitions is based on the global statistics of levels (STAT).
- Cluster analysis using affinity aoefficient in order to identify religious beliefs profilesPublication . Sousa, Áurea; Nicolau, Fernando C.; Bacelar-Nicolau, Helena; Silva, OsvaldoWe present an application of Ascendant Hierarchical Cluster Analysis (AHCA) to a dataset related to religion, in order to find a typology of religious beliefs profiles of individuals who live on São Miguel island (Azores) according to the frequency they go to the Mass. AHCA was based on the weighted generalized affinity coefficient for symbolic or complex data, and on classical and probabilistic aggregation criteria; the probabilistic ones belong to a parametric family of methods in the scope of the VL methodology. Additionally, we applied some validation measures (based on the values of the proximity matrix and adapted for the case of similarity measures) to evaluate the obtained results (clusters and partitions).
- Clustering an interval data set : are the main partitions similar to a priori partition?Publication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoIn this paper we compare the best partitions of data units (cities) obtained from different algorithms of Ascendant Hierarchical Cluster Analysis (AHCA) of a well-known data set of the literature on symbolic data analysis (“city temperature interval data set”) with a priori partition of cities given by a panel of human observers. The AHCA was based on the weighted generalised affinity with equal weights, and on the probabilistic coefficient associated with the asymptotic standardized weighted generalized affinity coefficient by the method of Wald and Wolfowitz. These similarity coefficients between elements were combined with three aggregation criteria, one classical, Single Linkage (SL), and the other ones probabilistic, AV1 and AVB, the last ones in the scope of the VL methodology. The evaluation of the partitions in order to find the partitioning that best fits the underlying data was carried out using some validation measures based on the similarity matrices. In general, global satisfactory results have been obtained using our methods, being the best partitions quite close (or even coinciding) with the a priori partition provided by the panel of human observers.