Etiqueta: sistemas de base de datos

Sistemas de bases de datos difusas (segunda parte)

Sistemas de bases de datos difusas (segunda parte)

En la tesis de grado de Sanchis, publicado el año 2015 con el título “Bases de datos relacionales difusas”, se señala que las bases de datos tradicionales son bastante limitadas, no permiten almacenar ni tratar con datos imprecisos, sin embargo las personas manejan datos imprecisos muy a menudo y de manera muy eficiente. A la definición del formato interno de una base de datos difusa, y su esquema global de implementación, se le denomina “Interface difusa para sistemas relacionales”. En la tesis doctoral de Martínez, publicada el año 2008 con el título “Sistema de gestión de bases de datos relacionales difusas multipropósito: Una ontología para la representación del conocimiento difuso”, se menciona que los elementos que forman parte del tratamiento impreciso pueden ser representados de diversas maneras. De ese modo, una distribución de posibilidad normalizada puede representarse mediante parábolas, hipérbolas, etc. Sin embargo, la implementación de la “Interface difusa para sistemas relacionales”, propuesta en la tesis doctoral de Galindo del año 1999 titulada “Tratamiento de la imprecisión en bases de datos relacionales: Extensión del modelo y adaptación de los sistemas de gestión de bases de datos actuales”, y su servidor de consultas imprecisas, construidos sobre el “Modelo generalizado para bases de datos relacionales difusas”, propuesto en la tesis doctoral de Medina del año 1994 titulada “Bases de datos relacionales difusas: Modelo teórico y aspectos de su implementación”, asume la representación trapezoidal descrita por cuatro puntos. Esta simplificación se explica en función de la contradicción que supone representar datos intrínsecamente imprecisos mediante distribuciones de posibilidad definidas de forma altamente precisa, que además añaden el factor del incremento asociado al costo computacional. Los valores que pueden formar parte de un dominio generalizado difuso pueden dividirse en dos grupos: (1) Datos precisos. También llamados crisp o clásicos. Dado que lo que se almacena son datos clásicos, el almacenamiento dependerá directamente de la capacidad de representación del sistema de gestión de la base de datos relacional difusa, sobre el que se aplique la implementación. (2) Datos imprecisos. También llamados difusos, se corresponden con datos de dos subtipos, datos imprecisos sobre un referencial ordenado, que engloban a todos aquellos datos descritos mediante una distribución de posibilidad construida sobre un conjunto referencial discreto o continúo ordenado, con una relación de orden definida.

Sanchis, en la tesis doctoral citada, menciona que para la representación y el tratamiento de información imprecisa en el ámbito de las bases de datos relacionales, se han presentado varios modelos a lo largo de los años. Entre ellos, destacan: (1) Aproximaciones que no emplean la lógica difusa, y que se basan en el modelo original de Codd, descrito en el artículo publicado el año 1979 con el título “Extendiendo el modelo de base de datos relacional para capturar mayor significado”. (2) Aproximaciones que usan distribuciones de posibilidad para representar la información difusa a nivel de tuplas, como la de Raju y Majumdar, descritas en el artículo del año 1988 titulado “Dependencias funcionales difusas y descomposición sin pérdidas de sistemas de bases de datos relacionales difusas”. Este modelo también se ha denominado “Modelo básico de bases de datos”. (3) Aproximaciones que utilizan las relaciones de similitud para representar la información difusa, son aquellos desarrollados por Buckles y Petri, en el artículo publicado el año 1982 con el título “Una representación difusa de los datos para bases de datos relacionales”, Shenoi y Melton, en el artículo del año 1989 titulado “Relaciones de proximidad en bases de datos relacionales difusas” y Rundensteiner y sus colegas, en el artículo publicado el año 1989 con el título “Sobre las medidas de proximidad en los modelos de datos relacionales difusos”. (4) Aproximaciones que usan distribuciones de posibilidad para representar la información difusa a nivel de atributo. Algunas de estas son las de Prade y Testemale, descritas en el artículo publicado el año 1987 con el título “Base de datos relacional difusa: cuestiones de representación y reducción utilizando medidas de similaridad”, Umano y sus colegas, en el artículo de 1980 titulado “Proceso de recuperación de bases de datos difusas”, además de Zemankova y Kaendel, en el artículo del año 1985 titulado “Implementación de imprecisión en los sistemas de información”. (5) Aproximaciones mixtas que combinan diferentes técnicas para representar la información imprecisa y conseguir representar el máximo de información posible. Estas aproximaciones se basan en la propuesta de un modelo difuso que combina distribuciones de posibilidad y relaciones de similitud a la vez, como la base de datos difusa extendida basada en posibilidad propuesta en el artículo de Ma y sus colegas, publicado el año 2000 con el título “Medida semántica de datos difusos en bases de datos relacionales difusas extendidas basadas en posibilidad”, Rundensteiner y sus colegas en el artículo del año 1989 titulado “Sobre las medidas de proximidad en los modelos de datos relacionales difusos”, además de Chen y sus colegas, en el artículo de 1992 titulado “Tratamiento general de redundancia de datos en un modelo de datos relacional difuso”, o la extensión hecha por Medina y sus colegas denominada “Modelo generalizado para bases de datos relacionales difusas”, descrita en la tesis doctoral citada anteriormente.

El modelo generalizado para bases de datos relacionales difusas surge como una integración de algunas tendencias para resolver el problema de la representación y consulta de información imprecisa en el seno del modelo relacional. Dicho modelo define formalmente una base de datos relacional difusa a través de las definiciones de los siguientes conceptos: (1) Dominio difuso generalizado. Se trata de una extensión del concepto de dominio relacional que amplía el rango de valores que un atributo puede tomar. Entre algunos de estos valores se encuentran: El valor nulo, el valor no aplicable, el valor desconocido, un conjunto de asignaciones escalares o numéricas posibles, distribuciones de posibilidad construidas sobre dominios escalares o numéricos, etc. (2) Relación difusa generalizada. Define una relación incluyendo el concepto de dominio difuso generalizado. (3) Comparadores difusos generalizados. Extienden el concepto de comparador para incluir las comparaciones entre valores que existen en el dominio difuso generalizado. (4) Operaciones de bases de datos. Proyección y selección difusa.

 

Guillermo Choque Aspiazu
www.eldiario.net
05 de Septiembre de 2016

Sistemas de bases de datos difusas

Sistemas de bases de datos difusas

En la tesis doctoral de Cadenas, publicada el año 2015 con el título “Sistemas de bases de datos difusas sensibles al contexto”, se menciona que los sistemas gestores de bases de datos se han extendido para almacenar nuevos tipos de datos tales como imágenes, sonidos, texto de gran tamaño, video interactivo, objetos multimedia y están preparados para responder consultas más complejas; se han creado almacenes que pueden consolidar una gran cantidad de datos provenientes de diversas fuentes, tal como los almacenes de datos, y se logran llevar a cabo análisis especializados mediante técnicas como procesos analíticos en línea o la extracción de conocimiento utilizando minería de datos. También se están utilizando técnicas, que incluyen diversas áreas científicas, que permiten desarrollar proyectos para manipular gran cantidad de información tales como bancos de datos de genes humanos y sistemas de observación de señales del espacio; además se está trabajando con paradigmas como bases de datos distribuidas heterogéneas, donde los datos provienen de múltiples fuentes que pueden estar en diferentes esquemas y provenir de diversos gestores de bases de datos y la Web semántica relacionando áreas de bases de datos con la inteligencia artificial.

Cadenas, en la tesis doctoral mencionada, recalca que además, en los sistemas informáticos actuales se incluye el desarrollo de aplicaciones que utilizan bases de datos tradicionales, bases de conocimiento o bases de datos móviles, con herramientas tales como modelos de datos semi-estructurados, tal como el lenguaje de marcado extendido, sistemas gestores de bases de datos objeto relacionales o sistemas distribuidos. Debido a paradigmas emergentes como Internet de las cosas, la Web dos y el amplio uso de las redes sociales, se produce un gran volumen de datos, por lo que a estos tiempos diversos autores los denominan la era de los grades datos o big data; en esencia, la computación móvil y distribuida, los sistemas abiertos y las tecnologías basadas en la Web han cambiado radicalmente el modo de desarrollar aplicaciones de bases de datos. Es por estas razones que cada vez con mayor frecuencia existe una gran cantidad de datos proporcionados por el mundo real que son imperfectos, vagos o flexibles, los cuales no son manejados adecuadamente por los sistemas de bases de datos tradicionales. Aunado a ello la incorporación en la vida cotidiana de las personas, dispositivos o sensores para recolectar datos de video, sonido, iluminación, movimiento, flujos de datos y geolocalización, proveniente de instrumentos de sistemas de posicionamiento global, ha resultado en el incremento de la necesidad de gestionar estos tipos de datos.

Por su parte, la lógica difusa fue formulada en el año 1965 por el ingeniero y matemático Lotfi A. Zadeh, en el artículo titulado “Conjuntos difusos”; esta lógica se basa en lo relativo de lo observado como posición diferencial. Este tipo de lógica toma dos valores aleatorios, pero contextualizados y referidos entre sí. La lógica difusa se adapta mejor al mundo real en el que habitan las personas, e incluso puede comprender y funcionar con expresiones del tipo “hace mucho calor”, “es muy atractivo”, “el ritmo del corazón está un poco acelerado”, etc. La clave de esta adaptación al lenguaje se basa en comprender los cuantificadores de cualidad para las inferencias. En la teoría de conjuntos difusos se definen también las operaciones de unión, intersección, diferencia, negación o complemento, y otras operaciones sobre conjuntos en los que se basa esta lógica. Para cada conjunto difuso, existe asociada una función de pertenencia para sus elementos, que indica en qué medida el elemento forma parte de ese conjunto difuso. Las formas de las funciones de pertenencia más típicas son: Lineal, trapezoidal y curva.

En la tesis de grado de Sanchis, publicado el año 2015 con el título “Bases de datos relacionales difusas”, se menciona que las bases de datos difusas intentan aplicar una forma más humana de pensar en la programación de computadoras usando lógica difusa. Por tanto se menciona que es una metodología que proporciona una manera simple y elegante de obtener una conclusión a partir de información de entrada vaga, ambigua, imprecisa, con ruido o incompleta. En general la lógica difusa imita cómo una persona toma decisiones basada en información con las características mencionadas. Una de las ventajas de la lógica difusa es la posibilidad de implementar sistemas basados en ella tanto en hardware como en software o en combinación de ambos. Esta lógica es una lógica multivaluada y sus características principales, presentadas por Zadeh son: (1) En la lógica difusa, el razonamiento exacto es considerado como un caso particular del razonamiento aproximado. (2) Cualquier sistema lógico puede ser trasladado a términos de lógica difusa. (3) En lógica difusa, el conocimiento es interpretado como un conjunto de restricciones flexibles, es decir, difusas, sobre un conjunto de variables. (4) La inferencia es considerada como un proceso de propagación de dichas restricciones. (5) En lógica difusa, todo problema es un problema de grados. Las bases de datos difusas nacen de unir la teoría de bases de datos, principalmente del modelo relacional con la teoría de conjuntos difusos, para permitir, básicamente dos objetivos: (1) El almacenamiento de información difusa. (2) El tratamiento y consulta de esta información de forma difusa o flexible. Las bases de datos tradicionales son muy limitadas: No permiten ni almacenar ni tratar con datos imprecisos. Sin embargo las personas manejan datos imprecisos muy a menudo y muy eficientemente.

 

Guillermo Choque Aspiazu
www.eldiario.net
29 de Agosto de 2016

Translate »