Un modelo de procesamiento de lenguaje natural para la detección de errores en requisitos de software
Abstract
Resumen
La ambigüedad semántica polisémica, inherente al lenguaje natural, afecta la interpretación de los requisitos de software, generando errores en su especificación por los múltiples significados que puede tener una palabra. Algunos de los errores generados debido a una mala interpretación de los requisitos de software son: inconsistencia, duplicidad y falta de unicidad. En este artículo, se presenta un modelo de procesamiento de lenguaje natural que permite detectar estos errores automáticamente en requisitos de software desde el idioma español. La metodología usada corresponde a la definición e implementación de un conjunto de reglas que ayudan a detectar dichos errores usando una técnica de desambiguación semántica polisémica llamada filtrado de coeficientes. Se realizaron un conjunto de pruebas sobre siete casos de estudio diferentes para valorar el modelo y se obtuvo, en promedio, una eficiencia en la detección de dichos errores del 85%.
Palabras clave
Ambigüedad semántica polisémica, Desambiguación de los sentidos de las palabras, Ingeniería de requisitos, Ingeniería de software.
Abstract
The semantic polysemic ambiguity, inherent to natural language affects the interpretation of software requirements, producing errors in its specification because of the multiple meanings a word can have. Some of the errors generated by a bad interpretation of software requirements are: inconsistency, duplicity and lack of uniqueness. This article presents a model for processing natural language that allows automatically detecting this errors in software requirements from Spanish language. The used methodology is related to the definition and implementation of a set of rules that help to detect such errors by using a polysemic semantic disambiguation technique called coefficient filtering. A set of tests were performed with seven case studies in order to assess the model, it was obtained, on average, an 85% efficiency when detecting this errors.
Keywords
Polysemic semantic ambiguity, Disambiguation of the meaning of words, Requirement engineering, Software engineering.
Résumé
L´ambiguïté sémantique polysémique, qui est inhérent au langage naturel, affecte l´interprétation des spécifications du logiciel, en produisant des erreurs dans les spécifications à cause des multiples significations qui peuvent avoir un mot. Quelques des erreurs produits à cause d´une mauvaise interprétation des spécifications du logiciel sont: inconsistance, duplicité et manque d´unicité. Dans cet article on présente un modèle de traitement du langage naturel qui permet de détecter ces erreurs de manière automatique dans spécifications du logiciel dans l´espagnol. La méthodologie utilisée se base sur la définition et implémentation d´un ensemble de règles qui aident à détecter tels erreurs en utilisant une technique de désambigüation sémantique polysémique appelé filtrage de coefficients. On a réalisé un ensemble de tests avec sept cas d´étude différents pour évaluer le modèle et on a obtenu, comme moyenne, une efficacité dans la détection d´erreurs de 85%.
Mots-clés
Ambiguïté sémantique polysémique, Désambigüation des significations des mots, Ingénierie des exigences, Génie logiciel.