Mendes, Armando B.Funk, GabrielaFunk, MatthiasSousa, Áurea2013-07-242013-07-242007Mendes, Armando B.; Funk, Gabriela & Matthias e Sousa, Áurea (2007). "O uso de provérbios: uma abordagem estatística". In Funk, Gabriela (coordenação), «Estudos sobre Património Oral», Encontro de Cultura Popular 4ª ed., Câmara Municipal de Ponta Delgada, pp. 217-241.http://hdl.handle.net/10400.3/21584º Encontro de Cultura Popular, Ponta Delgada, 18 e 19 de Maio de 2006.Neste artigo, apresentam-se os resultados, ainda parciais, do projecto de análise de uma base de dados construída para identificação de provérbios. Esta base de dados integra informação sobre 25.000 expressões idiomáticas e mais de um milhar de respostas válidas a inquéritos de reconhecimento de provérbios. Os objectivos do projecto incluem várias actividades desde a compreensão do domínio e dos dados até à extracção de conhecimento que permita caracterizar utilizadores de grupos de provérbios e prever a região geográfica onde estes têm vivido. A metodologia CRISP-DM é utilizada e ilustrada, de acordo com estes objectivos. Dá-se especial ênfase às fases de preparação e pré-processamento, limpeza de dados e à modelação e análise de dados. Utilizam-se métodos de análise de dados como as árvores de regressão e classificação e a análise de clusters. Utilizam-se igualmente dados simbólicos tendo em conta a estrutura complexa e a existência de variabilidade interna. Os resultados já obtidos são comparados com o conhecimento de domínio paremiológico.porExtracção de ConhecimentoMetodologia CRISP_DMPreparação de Dados e Pré-ProcessamentoProvérbiosAnálise de Dados SimbólicosO uso de provérbios: uma abordagem estatística.book part2013-07-19