La información digital está creciendo de forma exponencial con respecto a los datos que se recogen y almacenan. Los enfoques clásicos que intentan obtener conocimiento sobre los mismos consisten en análisis manuales que se están haciendo impracticables en muchos dominios debido al elevado volumen de los datos manejados. Esto implica que es necesario automatizar, al menos parcialmente, el trabajo de análisis mediante herramientas de extracción de conocimiento [HRF04], las que se denomina generalmente técnicas de extracción de conocimiento en grandes bases de datos [FPS96].
Las técnicas de extracción de conocimiento en grandes bases de datos son un conjunto de métodos y herramientas cuyo objetivo es asistir a los usuarios a una extracción eficiente de información útil. La extracción del conocimiento puede ser abordada desde diferentes perspectivas, la predictiva capaz de predecir información futura, la descriptiva capaz de describir información de interés de esos datos o mediante hibridación de ambas.
El descubrimiento de información en bases de datos se reconoce como KDD (Knowledge Discovery in Databases), que fue definido como [FPS96]; proceso no trivial de extracción de patrones válidos, novedosos, potencialmente útiles y comprensible en los datos.
La tesis llevará al desarrollo de nuevos algoritmos que permitan la obtención de reglas difusas para la tarea de descubrimiento de reglas mediante aprendizaje supervisado. Los algoritmos están basados es sistemas evolutivos difusos, que obtendrán reglas con estadísticas inusuales sobre propiedades de interés para el usuario, abarcando la mayor parte posible de los conjuntos de datos.