Un modelo de procesamiento de lenguaje natural para la detección de errores en requisitos de software

Jaime Alberto Guzmán Luna; Sebastián Alonso Gómez Arias; Carlos Andrés Vélez Carvajal

Authors

Jaime Alberto Guzmán Luna Ingeniero Civil Magister en Ingeniería de Sistemas Doctor en Ingeniería Docente Asociado Universidad Nacional de Colombia Director Grupo Investigación SINTELWEB
Sebastián Alonso Gómez Arias Ingeniero de Sistemas Magíster en Ingeniería de Sistemas Integrante Grupo de Investigación SINTELWEB
Carlos Andrés Vélez Carvajal Ingeniero de Sistemas Integrante Grupo de Investigación SINTELWEB

Abstract

Resumen

La ambigüedad semántica polisémica, inherente al lenguaje natural, afecta la interpretación de los requisitos de software, generando errores en su especificación por los múltiples significados que puede tener una palabra. Algunos de los errores generados debido a una mala interpretación de los requisitos de software son: inconsistencia, duplicidad y falta de unicidad. En este artículo, se presenta un modelo de procesamiento de lenguaje natural que permite detectar estos errores automáticamente en requisitos de software desde el idioma español. La metodología usada corresponde a la definición e implementación de un conjunto de reglas que ayudan a detectar dichos errores usando una técnica de desambiguación semántica polisémica llamada filtrado de coeficientes. Se realizaron un conjunto de pruebas sobre siete casos de estudio diferentes para valorar el modelo y se obtuvo, en promedio, una eficiencia en la detección de dichos errores del 85%.

Palabras clave

Ambigüedad semántica polisémica, Desambiguación de los sentidos de las palabras, Ingeniería de requisitos, Ingeniería de software.

Abstract

The semantic polysemic ambiguity, inherent to natural language affects the interpretation of software requirements, producing errors in its specification because of the multiple meanings a word can have. Some of the errors generated by a bad interpretation of software requirements are: inconsistency, duplicity and lack of uniqueness. This article presents a model for processing natural language that allows automatically detecting this errors in software requirements from Spanish language. The used methodology is related to the definition and implementation of a set of rules that help to detect such errors by using a polysemic semantic disambiguation technique called coefficient filtering. A set of tests were performed with seven case studies in order to assess the model, it was obtained, on average, an 85% efficiency when detecting this errors.

Keywords

Polysemic semantic ambiguity, Disambiguation of the meaning of words, Requirement engineering, Software engineering.

Résumé

L´ambiguïté sémantique polysémique, qui est inhérent au langage naturel, affecte l´interprétation des spécifications du logiciel, en produisant des erreurs dans les spécifications à cause des multiples significations qui peuvent avoir un mot. Quelques des erreurs produits à cause d´une mauvaise interprétation des spécifications du logiciel sont: inconsistance, duplicité et manque d´unicité. Dans cet article on présente un modèle de traitement du langage naturel qui permet de détecter ces erreurs de manière automatique dans spécifications du logiciel dans l´espagnol. La méthodologie utilisée se base sur la définition et implémentation d´un ensemble de règles qui aident à détecter tels erreurs en utilisant une technique de désambigüation sémantique polysémique appelé filtrage de coefficients. On a réalisé un ensemble de tests avec sept cas d´étude différents pour évaluer le modèle et on a obtenu, comme moyenne, une efficacité dans la détection d´erreurs de 85%.

Mots-clés

Ambiguïté sémantique polysémique, Désambigüation des significations des mots, Ingénierie des exigences, Génie logiciel.

Downloads

Download data is not yet available.

Revista Virtual Católica del Norte ISSN-0124-5821(En línea)
Sergio Gomez-Molina Editor Correo: editorialucn@ucn.edu.co	Diego Alejandro Pérez Múnera Asistente editorial Correo: dalejandrop@ucn.edu.co
Fundación Universitaria Católica del Norte Calle 52 No 47 – 42 Edificio Coltejer- Medellin (Colombia) Teléfono: (057) (4) 605 15 35 Ext. 4063 - FAX (057) (4) 605 42 20 Portal Web Institucional: www.ucn.edu.co

Un modelo de procesamiento de lenguaje natural para la detección de errores en requisitos de software

Authors

Abstract

Downloads

Downloads

Published

How to Cite

Issue

Section

Most read articles by the same author(s)

Make a Submission

Language

Información