Browsing by Author "Nicolau, Fernando C."
Now showing 1 - 10 of 22
Results Per Page
Sort Options
- Análise Classificatória de Dados de Natureza Complexa: Uma aplicação do Coeficiente de AfinidadePublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoA Análise de Dados Simbólicos (ADS) é um domínio recente na área da descoberta do conhecimento e da gestão de dados. O seu primeiro passo consiste na extracção de informações úteis a partir de bases de dados de elevada dimensão, como em Data Mining, de modo a sumariar esses dados em termos dos seus conceitos mais relevantes. O segundo passo em ADS é aplicar novas ferramentas às informações extraídas, visando estender o Data Mining ao Knowledge Mining.O coeficiente de afinidade generalizado ponderado é uma medida de semelhança apropriada à Análise Classificatória (Cluster Analysis) de dados de natureza complexa (dados simbólicos), mesmo no caso de dados heterogéneos e de elevada dimensão. Neste trabalho, é dada uma atenção especial às medidas de proximidade entre objectos simbólicos, entre as quais o coeficiente de afinidade generalizado ponderado. É ilustrada a aplicação da Análise Classificatória Hierárquica Ascendente (ACHA) a dados de natureza complexa, retirados da literatura, com base no coeficiente de afinidade generalizado ponderado e em critérios de agregação clássicos e probabilísticos, estes últimos no âmbito da metodologia VL. Os resultados obtidos são comparados com os de outros autores.
- Análise de dados: do exercício da cidadania à sociedade do conhecimento.Publication . Mendes, Armando B.; Silva, Osvaldo; Nicolau, Fernando C."[…]. As metodologias estatísticas e de análise de dados apoiadas em aplicações informáticas, como os pacotes estatísticos e as aplicações de pesquisa de informação e conhecimento (data mining ), tornam possível a análise das situações cada vez mais complexas com que nos deparamos nas organizações. Por outro lado, existe um volume crescente de dados e informação que necessita de ser devidamente trabalhado, de forma a ser possível extrair o conhecimento, conduzindo ao objectivo de acrescentar valor ao serviço ou produto comercializado. […]".
- Avaliação e comparação de partições numa perspectiva global dos resultadosPublication . Silva, Osvaldo; Bacelar-Nicolau, Helena; Nicolau, Fernando C.Neste trabalho, trata-se de uma metodologia global que tem vindo a ser desenvolvida para avaliar a qualidade dos resultados de uma Análise Classificatória, com base em índices de estabilidade, isolamento e homogeneidade das classes, entre outros. Em complemento, desenvolvemos também um método de visualização, que permite realçar as semelhanças e as diferenças entre as partições e entre os elementos pertencentes a essas partições. A aplicação da metodologia é ilustrada com base num conjunto de dados heterogéneos e de natureza complexa.
- Classes de objectos simbólicos: dados da indústria automóvelPublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoNeste trabalho, é abordada a Análise Classificatória Hierárquica Ascendente (ACHA) de dados simbólicos ou complexos (generalizações de dados clássicos), com base no coeficiente de afinidade generalizado ponderado e em critérios de agregação clássicos e probabilísticos, estes últimos no âmbito da metodologia VL. São apresentados os principais resultados obtidos com a ACHA de 33 modelos de carros (dados simbólicos na área da indústria automóvel), com base no coeficiente de afinidade generalizado ponderado, centrado e reduzido pelo método de Wald e Wolfowitz, comparando-se os resultados obtidos com os de outros autores e com a partição definida a priori pelas categorias ("Utilitário", "Berlina", "Desportivo", "Luxo") a que os modelos de carros pertencem.
- Classificação hierárquica de dados intervalares da indústria automóvel com o coeficiente de afinidadePublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Silva, Osvaldo; Nicolau, Fernando C.São mostradas as estruturas classificatórias mais relevantes, obtidas com a Análise Classificatória Hierárquica de um conjunto de dados retirado da literatura da análise de dados complexos, referentes a modelos de carros (Car data set), com base no coeficiente de afinidade generalizado, ponderado, centrado e reduzido pelo método de Wald e Wolfowitz, e em critérios de agregação probabilísticos no âmbito da Metodologia VL. Comparam-se os resultados obtidos com os de outros autores e diferentes métodos, bem como com uma partição definida a priori. Os métodos utilizados foram capazes de detetar classes consistentes e consonantes de macro-dados, quer com a partição a priori quer com os resultados de outros autores, e enquadram-se nas metodologias de Análise de Dados Simbólicos (ADS), sendo de salientar que as agregações implícitas nessas abordagens permitem o tratamento de bases de micro-dados (dados não agregados) de grande dimensão.
- Cluster analysis using affinity aoefficient in order to identify religious beliefs profilesPublication . Sousa, Áurea; Nicolau, Fernando C.; Bacelar-Nicolau, Helena; Silva, OsvaldoWe present an application of Ascendant Hierarchical Cluster Analysis (AHCA) to a dataset related to religion, in order to find a typology of religious beliefs profiles of individuals who live on São Miguel island (Azores) according to the frequency they go to the Mass. AHCA was based on the weighted generalized affinity coefficient for symbolic or complex data, and on classical and probabilistic aggregation criteria; the probabilistic ones belong to a parametric family of methods in the scope of the VL methodology. Additionally, we applied some validation measures (based on the values of the proximity matrix and adapted for the case of similarity measures) to evaluate the obtained results (clusters and partitions).
- Clustering an interval data set : are the main partitions similar to a priori partition?Publication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoIn this paper we compare the best partitions of data units (cities) obtained from different algorithms of Ascendant Hierarchical Cluster Analysis (AHCA) of a well-known data set of the literature on symbolic data analysis (“city temperature interval data set”) with a priori partition of cities given by a panel of human observers. The AHCA was based on the weighted generalised affinity with equal weights, and on the probabilistic coefficient associated with the asymptotic standardized weighted generalized affinity coefficient by the method of Wald and Wolfowitz. These similarity coefficients between elements were combined with three aggregation criteria, one classical, Single Linkage (SL), and the other ones probabilistic, AV1 and AVB, the last ones in the scope of the VL methodology. The evaluation of the partitions in order to find the partitioning that best fits the underlying data was carried out using some validation measures based on the similarity matrices. In general, global satisfactory results have been obtained using our methods, being the best partitions quite close (or even coinciding) with the a priori partition provided by the panel of human observers.
- Clustering of Symbolic Data based on Affinity Coefficient: Application to a Real Data SetPublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoIn this paper, we illustrate an application of Ascendant Hierarchical Cluster Analysis (AHCA) to complex data taken from the literature (interval data), based on the standardized weighted generalized affinity coefficient, by the method of Wald and Wolfowitz. The probabilistic aggregation criteria used belong to a parametric family of methods under the probabilistic approach of AHCA, named VL methodology. Finally, we compare the results achieved using our approach with those obtained by other authors.
- Clustering of Symbolic Data based on Affinity Coefficient: Application to real data setsPublication . Sousa, Áurea; Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Silva, OsvaldoThe increasing use of databases, often large ones, in diverse areas of study makes it pertinent to summarise data in terms of their most relevant concepts. These concepts may be described by types of complex data, also known as symbolic data […]. We present some results from the Ascendant Hierarchical Cluster Analysis (AHCA) of symbolic objects described by interval data, in order to illustrate the effectiveness of the Ascendent Hierarchical Cluster Analysis based on the weighted generalized affinity coefficient, for symbolic data. The measure of comparison between the elements was combined with classical aggregation criteria and probabilistic ones. The probabilistic aggregation criteria used in this study belong to a parametric family of methods in the scope of the probabilistic approach of AHCA, named VL methodology and the validation of the clustering results is based on some validation measures. Finally, we compare the results achieved by our approach with the ones obtained by other authors.
- Clustering of variables with a three-way approach for health sciencesPublication . Bacelar-Nicolau, Helena; Nicolau, Fernando C.; Sousa, Áurea; Bacelar-Nicolau, LeonorCluster analysis or classification usually concerns a set of exploratory multivariate data analysis methods and techniques for grouping either a set of statistical data units or the associated set of descriptive variables, into clusters of similar and, hopefully, well separated elements. In this work we refer to an extension of this paradigm to generalized three-way data representations and particularly to classification of interval variables. Such approach appears to be especially useful in large data bases, mostly in a data mining context. A health sciences case study is partially discussed.
- «
- 1 (current)
- 2
- 3
- »