Browsing by Author "Funk, Matthias"
Now showing 1 - 10 of 10
Results Per Page
Sort Options
- Extrair conhecimento de bases de dados: o caso dos provérbios.Publication . Mendes, Armando B.; Funk, Matthias; Funk, GabrielaPara apoiar actividades de gestão de dados de um projecto para identificação de provérbios, tem vindo a ser construída uma base de dados ao longo de vários anos. No momento da presente análise, esta base de dados integrava informação sobre 25.000 expressões idiomáticas, incluindo mais de um milhar de respostas válidas a inquéritos de reconhecimento de provérbios. Neste artigo, descreve-se um projecto em curso com o objectivo de extrair conhecimento desta base de dados, de modo a conhecer melhor os inquiridos, o seu grau de reconhecimento de provérbios e a relação com os locais onde têm vivido. De modo a alcançar os objectivos delineados, propõe-se a utilização de metodologias de prospecção de dados (data mining), com passos como: preparação e pré-processamento, limpeza (data cleansing) e técnicas de redução de dados. A fase de preparação é cuidadosamente trabalhada, uma vez que nem sempre é descrita em estudos de prospecção de dados, apesar de constituir um passo fundamental na análise de dados provenientes de bases de dados. Para a descoberta de conhecimento, após a produção de uma tabela de dados desnormalizada, utilizam-se modelos de regressão linear múltipla e árvores de regressão segundo dois algoritmos distintos. Os resultados são comparados com o conhecimento de domínio paremiológico, com algumas conclusões inesperadas.
- Extrair conhecimento de provérbiosPublication . Mendes, Armando B.; Funk, Matthias; Funk, GabrielaCom base no "Adagiário Popular Açoriano" de Armando Côrtes-Rodrigues e muitas outras colectâneas portuguesas deste século foram recolhidos cerca de 25.000 frases idiomáticas. Em pré-testes para filtragem de frases idiomáticas menos usadas, foram inquiridos indivíduos com idades superiores a 40 anos, residentes em diferentes localidades da ilha de São Miguel, tendo sido a recolha efectuada em lares de idosos e centros paroquiais de convívio. Estes inquéritos de reconhecimento passivo (apenas indicar os que conhece) foram posteriormente comparados com alguns resultados de reconhecimento activo (completar um provérbio niciado), tendo-se concluído da proximidade de resultados entre reconhecido activo e passivo. Observou-se igualmente o reconhecimento activo e passivo de inquiridos sem saber ler ou escrever, concluindo-se novamente não existir diferenças significativas para diferentes extractos sociais, ainda que existissem expectativas de que os iletrados tivessem mais apetência por provérbios. Após esta primeira fase verificou-se que cerca de dois quintos dos exemplares testados não tinham sido reconhecidos por nenhum dos inquiridos, tendo sido excluídos de inquéritos subsequentes. No projecto de maior envergadura que englobou todas as ilhas dos Açores e algumas localidades dos EUA com forte componente de imigração açoriana, utilizou-se uma base de dados com cerca de 5.000 provérbios conhecidos em diferentes ilhas dos Açores e com índice de reconhecimento superior a 10% no pré-teste. Utilizou-se um processo de amostragem por quotas, controlando os factores: sexo, três classes de idade e 2 classes do grau de habilitações. Verificando-se posteriormente que a amostra era representativa da população para as faixas de idade consideradas, género e profissões. O cruzamento entre os inquiridos e os provérbios resultou numa tabela com cerca de 250.000 registos. Sobre estes dados foram já realizados diferentes trabalhos de estatística descritiva resultando na publicação de três livros pelos dois últimos autores deste artigo: "Pérolas da Sabedoria Popular Portuguesa: Provérbios de São Miguel", "Provérbios das Ilhas do Grupo Central dos Açores” e “Provérbios Açorianos nos EUA". Com o objectivo de extracção de conhecimento por análise de dados é, agora, necessário construir uma tabela de dados a analisar. No caso presente, entre outros objectivos, pretende-se identificar grupos de indivíduos com maior capacidade de reconhecer provérbios e, em simultâneo, caracterizar esses grupos. Partindo de bases de dados normalizadas a construção da tabela de dados de indivíduos com o máximo de atributos passa por um processo de desnormalização, por fazes de agregação de valores de atributos discretos e por um rigoroso controlo da qualidade dos dados obtidos. Nesta comunicação apresentam-se alguns exemplos de problemas que podem surgir em cada uma das fazes referidas. Utilizam-se algoritmos de machine learning como árvores de regressão e modelos discriminantes lógicos como CHAID e CART. Verificou-se nomeadamente uma redução significativa do conhecimento dos provérbios por parte de inquiridos com menos de 40 anos. Tal facto constitui um padrão normal em qualquer cultura se considerarmos que o processo de familiarização com os textos proverbiais necessita de um mínimo de experiência de vida. No entanto, verificou-se igualmente uma diminuição na percentagem de provérbios reconhecidos em inquiridos com idades superiores a 65 anos. De referir que a densidade proverbial respeitante ao conjunto dos informantes luso-americanos cabe perfeitamente dentro do espectro das taxas homólogas registadas no arquipélago, pelo que se conclui que a cultura açoriana se mantém ainda viva nessas zonas de emigração. No entanto, identificaram-se importantes diferenças entre os EUA e o Canadá, observando-se um grau de reconhecimento de provérbios acima da média no primeiro e abaixo no segundo.
- Finding the region of origin for users of proverbs.Publication . Mendes, Armando B.; Funk, Matthias; Sousa, ÁureaProverbs are a form of popular knowledge present in every culture and society. During a long project for proverbial sentences identification a data base was being constructed. This data base collects, today, information about 25.000 idiomatic sentences including more than one thousand valid answers for proverbial sentences recognition surveys. In this work a project is described aimed to extract knowledge from this data base in order to comprehend better the inquiries about their level of proverbial recognition and the influence of the locations they have been living. [Introduction]
- Fourierentwicklung gewisser EisensteinreihenPublication . Funk, MatthiasEisenstein desenvolveu, no século XIX, uma via alternativa para descrever as funções trigonométricas, que geralmente são explicadas através da função exponencial. As funções alternativas aí usadas foram designadas como Séries de Eisenstein. Hoje em dia, estas servem como ferramenta importante na teoria das funções modulares, que, por sua vez, tiveram um papel central na demonstração do último teorema de Fermat. Encontramos as Séries de Eisenstein no método de Selberg-Rankin e no espectro de certas funções. Em 1940, Selberg conseguiu descrever os coeficientes de Fourier de uma Série de Eisenstein, que forma uma função periódica no plano superior complexo. Quando generalizamos este plano superior complexo numa dimensão n (conhecida como plano de Siegel), obtemos n+1 classes diferentes de Séries de Eisenstein, que também são periódicas e possuem, portanto, um desenvolvimento numa Série de Fourier, cujos coeficientes foram totalmente desconhecidos até que Krieg encontrou uma solução para o caso de n=2. Mas o caminho utilizado não funciona para n2. No âmbito da tese de doutoramento, conseguiu-se encontrar uma descrição em funções conhecidas para todos os coeficientes de uma destas n+1 classes da Série de Eisenstein. Parte dos coeficientes são nulos. Entre alguns dos restantes existem uma correlação funcional.
- Hierarchical clique analysis in social networks due to common knowledge of proverbs.Publication . Mendes, Armando B.; Funk, MatthiasWe present the Hierarchical Clique Analysis, a new algorithm for social networks analysis. The algorithm is exemplified with data about the recognition of proverbs collected in interviews in all Azorean islands and also in three Azorean emigration locations in the USA. Interpreting the set of this data as an incidence matrix of a graph, we obtain 8 oriented and isolated sub-graphs which distinguish the society in a kind of different families of proverbial users. The Hierarchical Clique Analysis finds distinct clusters with a high inner homogeneity.
- Logical Analysis of Inconsistent Data (LAID) for a Paremiologic StudyPublication . Cavique, Luís; Mendes, Armando B.; Funk, MatthiasA paremiologic (study of proverbs) case is presented as a part of a wider project, based on data collected by thousands of interviews made to people from Azores, and involving a set of twenty-two thousand Portuguese proverbs, where we searched for the minimum information needed to identify the birthplace island of an interviewee. The concept of birthplace was extended for all respondents that have lived in any locations more than 5 years, unintentionally introducing inconsistencies in the data classification task. The rough sets differ from classical sets by their ability to deal with inconsistent data. A parallel approach to data reduction is given by the logical analysis of data (LAD). LAD handicaps, like the inability to cope with the contradiction and the limited number of classification classes, will be overcome in this version of Logical Analysis of Inconsistent Data (LAID).
- Prever a origem do utilizador de um conjunto de provérbios.Publication . Mendes, Armando B.; Funk, Matthias; Funk, GabrielaEm geral, salienta-se o aspecto de os provérbios representarem uma matriz conceptual dos diversos esquemas de pensamento do povo português. Parece promissor estudar os Adagiários para adquirir um conhecimento básico das correntes de pensamento colectivo. Partindo de três colectâneas regionais baseadas em métodos quantitativos (Funk e Funk 2001a, 2001b e 2002), este artigo explora as diversidades regionais. Um estudo preliminar (Mendes, et al. 2006) confirmou as hipóteses dos autores dos adagiários açorianos da existência de uma relação significativa e positiva entre o conhecimento quantitativo de provérbios e a idade, nomeadamente o maior grau de reconhecimento de provérbios para inquiridos com idades superiores a 40 anos. Verificou-se que, nas ilhas do arquipélago dos Açores, se encontra uma taxa de reconhecimento superior às zonas de emigração açoriana. Esta observação pode reflectir o facto de, nestes últimos locais, a assimilação de uma cultura anglo-saxónica reduzir o repertório proverbial em Português, apesar de ser evidente que alguns provérbios são preservados como relíquias culturais. Registou-se que, em algumas ilhas pequenas, a quantidade dos provérbios era reduzida. (da Introdução)
- Os provérbios também emigramPublication . Funk, Gabriela; Funk, MatthiasAo compararmos o tesouro imaterial de uma comunidade de emigrantes com o património cultural da sua localidade de origem, podemos observar os efeitos da interculturalidade no ambiente do país da imigração. Desta forma, não só o emigrante transpõe a fronteira de um novo mundo, mas também as suas tradições, que aí se transformam.
- The Social Network Induced by the Common Knowledge of Proverbs.Publication . Mendes, Armando B.; Funk, MatthiasIn a series of interviews, we collected a heterogeneous set of several million relations of positive and negative knowledge that a group of thousands of people has about a set of circa twenty-two thousand Portuguese proverbs. One of the interesting questions was if we could find a minimum base of proverbs as an indicator to decide from which place a person came due to their specific profile of proverbial knowledge. Before trying this challenge, we will analyse, in this article, the probability of achieving such an idea by trying to find out if a homomorphism between the proverbial knowledge and the geographical location of a person could exist. To solve this question, we chose an approach based on the analysis of social networks where the broadcast of oral culture, at least historically, could be interpreted as a trace of direct social contact between some of their users. We found, in the present pilot-project based on small data sets, that there are clusters where the neighbourhood relation inducted by the minimum Hamming distance could be a reflex of the geographical distribution and of some migration flux of the population.
- O uso de provérbios: uma abordagem estatística.Publication . Mendes, Armando B.; Funk, Gabriela; Funk, Matthias; Sousa, ÁureaNeste artigo, apresentam-se os resultados, ainda parciais, do projecto de análise de uma base de dados construída para identificação de provérbios. Esta base de dados integra informação sobre 25.000 expressões idiomáticas e mais de um milhar de respostas válidas a inquéritos de reconhecimento de provérbios. Os objectivos do projecto incluem várias actividades desde a compreensão do domínio e dos dados até à extracção de conhecimento que permita caracterizar utilizadores de grupos de provérbios e prever a região geográfica onde estes têm vivido. A metodologia CRISP-DM é utilizada e ilustrada, de acordo com estes objectivos. Dá-se especial ênfase às fases de preparação e pré-processamento, limpeza de dados e à modelação e análise de dados. Utilizam-se métodos de análise de dados como as árvores de regressão e classificação e a análise de clusters. Utilizam-se igualmente dados simbólicos tendo em conta a estrutura complexa e a existência de variabilidade interna. Os resultados já obtidos são comparados com o conhecimento de domínio paremiológico.