CEEAplA Working Paper Series 2009
Permanent URI for this collection
Browse
Browsing CEEAplA Working Paper Series 2009 by Author "Funk, Matthias"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
- Extrair conhecimento de bases de dados: o caso dos provérbios.Publication . Mendes, Armando B.; Funk, Matthias; Funk, GabrielaPara apoiar actividades de gestão de dados de um projecto para identificação de provérbios, tem vindo a ser construída uma base de dados ao longo de vários anos. No momento da presente análise, esta base de dados integrava informação sobre 25.000 expressões idiomáticas, incluindo mais de um milhar de respostas válidas a inquéritos de reconhecimento de provérbios. Neste artigo, descreve-se um projecto em curso com o objectivo de extrair conhecimento desta base de dados, de modo a conhecer melhor os inquiridos, o seu grau de reconhecimento de provérbios e a relação com os locais onde têm vivido. De modo a alcançar os objectivos delineados, propõe-se a utilização de metodologias de prospecção de dados (data mining), com passos como: preparação e pré-processamento, limpeza (data cleansing) e técnicas de redução de dados. A fase de preparação é cuidadosamente trabalhada, uma vez que nem sempre é descrita em estudos de prospecção de dados, apesar de constituir um passo fundamental na análise de dados provenientes de bases de dados. Para a descoberta de conhecimento, após a produção de uma tabela de dados desnormalizada, utilizam-se modelos de regressão linear múltipla e árvores de regressão segundo dois algoritmos distintos. Os resultados são comparados com o conhecimento de domínio paremiológico, com algumas conclusões inesperadas.