[en] DESCRIPTION AND FORMALIZATION OF COMPOUND WORD IN BRAZILIAN PORTUGUESE FOR AN ELECTRONIC DICTIONARY
[fr] DESCRIPTION ET FORMALISATION DE MOTS COMPOSÉS DU BRÉSILIEN EN VUE DE L´ÉLABORATION D´UN DICTIONNAIRE ÉLECTRONIQUE;
[pt] DESCRIÇÃO E FORMALIZAÇÃO DE PALAVRAS COMPOSTAS DO PORTUGUÊS DO BRASIL PARA ELABORAÇÃO DE UM DICIONÁRIO ELETRÔNICO
Descripción
[pt] Neste trabalho estudam-se os nomes com a estrutura NdeN que podem ser descritos como nomes compostos por justaposição. São observadas 1.500 seqüências de palavras, com o objetivo de contribuir na descrição formal do léxico do português do Brasil e de definir os critérios de identificação de um nome composto com essa estrutura. O critério geral está baseado no conceito da nãocomposicionalidade semântica. Os testes são feitos a partir das propriedades sintáticas e semânticas que há na relação entre os elementos que constituem o grupo nominal, mostrando as distinções entre um grupo nominal livre e um grupo nominal composto. Entre as propriedades, podem ser destacadas: o bloqueio distribucional, a inseparabilidade, a inserção lexical, o apagamento de N2, a substituição de N2 e as variações em gênero e número. Essa descrição mostra-se útil na medida em que um conjunto de regras e critérios de delimitação de unidades lexicais foi definido, constituindo uma base para a incorporação de novos itens ao léxico. Por fim, as propriedades das entradas incorporadas receberam uma representação formal, resultando na criação de um dicionário eletrônico utilizável em processos eletrônicos.[en] This paper is a study of the NofN structure nouns, which may be described as compound nouns by juxtaposition. 1500 word sequences are observed, aiming at contributing to the formal description of the Brazilian Portuguese lexicon, and defining the identification criteria of a compound noun with such a structure. The general criterion is based on the concept of semantic non- compositionality. The tests are made from the syntactic and semantic properties existing in the relationship between the elements that constitute the nominal group, showing the differences between a free nominal group and a compound nominal group. Among such properties, the following can be pointed out: distributional blockage, inseparability, lexical insertion, N2 erasing, N2 substitution, and gender and number variations. Such description proves to be useful in the sense that a set of lexical units delimitation rules and criteria has been defined, constituting a basis for the incorporation of new items to the lexicon. Finally, the incorporated entries` properties received a formal representation, which resulted in the creation of an electronic dictionary that can be used in electronic processes.
[fr] On étudie dans ce travail les noms formés par la structure NdeN qui caractérise un nom composé par juxtaposition. On a observé 1.500 séquences de mots, pour définir les critères d`identification d`un nom composé par cette structure. Le critère general est fondé sur le concept de la non compositionalité sémantique. Les tests ont été faits à partir des propriétés syntaxiques et sémantiques qu`il y a dans la relation existante entre les éléments qui constituent le groupe nominal, en démontrant les distinctions entre un groupe nominal libre et un groupe nominal composé. Parmi ces propriétés, on peut remarquer le bloquement distributionnel, l`inséparabilité, l`insertion lexical, l`effacement de N2, le remplacement de N2 et les variations en genre et en nombre. En examinant ces propriétés, on a pu observer qu`il y a des irrégularités dans la formation de ce procès. Cette description devient utile dans la mesure que cette reconnaissance peut être formulée et qu`un ensemble de règles et de critères de délimitation d`unités lexicales peut être defini, et que, par là, on peut aboutir à l`incorporation de nouveaux items lexicaux. Au bout, en tenant compte de la possibilité de formalisation, les mots composés peuvent être processés automatiquement dans les diccionnaires électroniques.