|
|
 |
 |
MÉTODOS PROBABILISTAS EN IA
Profesorado
| Coordinador: Francisco Javier Díez Vegas (Dpto. Inteligencia Artificial,
UNED) |
| Profesores: |
| Manuel Arias Calleja (Dpto. Inteligencia Artificial, UNED) |
|
|
|
|
Ficha técnica:
| Tipo | Optativa |
|
| Cuatrimestre | Primero |
| Créditos/horas totales | 6/150 |
| Horas de estudio teórico | 60 |
| Horas de prácticas | 50 |
| Horas complementarias | 40 |
DESCRIPCIÓN DE LA ASIGNATURA
Prerrequisitos recomendables
No se requiere ningún conocimiento que no se haya adquirido previamente
en los estudios de informática: matemática discreta, programación
(especialmente en Java), estructuras de datos y algoritmos, complejidad
de problemas y de algoritmos, etc.
Aunque el material básico de la asignatura está en castellano, para
las actividades complementarias es necesario leer con fluidez en inglés.
Objetivos generales de la materia
El objetivo de este módulo es que el alumno/a conozca los modelos
gráficos probabilistas, principalmente las redes bayesianas y los
diagramas de influencia, desde los fundamentos teóricos hasta los
algoritmos para el cálculo de probabilidades, y que sea capaz de construir
modelos que resuelvan problemas del mundo real.
Destrezas y competencias
-Conocer las semejanzas y diferencias entre los diferentes tipos de
modelos gráficos probabilistas (redes bayesianas, diagramas de influencia,
etc.) y en qué tipo de problemas debe utilizarse cada uno de ellos.
-Determinar las relaciones de dependencia e independencia de un grafo
dirigido o no-dirigido, es decir, distinguir cuándo dos subconjuntos
de nodos de un grafo están conectados o desconectados dado un tercer
subconjunto de nodos.
-Conocer los principales algoritmos exactos y aproximados para redes
bayesianas y ser capaz de implementarlos en algún lenguaje de programación.
Analizar la complejidad de cada uno de esos algoritmos.
-Construir redes bayesianas causales a partir de conocimiento experto.
-Construir redes bayesianas a partir de bases de datos.
-Determinar los valores y las utilidades involucrados en un problema
de decisión.
-Transformar un diagrama de influencia en un árbol de decisión y evaluarlo.
-Conocer algoritmos eficientes de evaluación de diagramas de influencia,
tales como la eliminación de variables y la inversión de arcos.
-Construir diagramas de influencia y árboles de decisión.
-Aplicar las técnicas y algoritmos anteriores mediante herramientas
informáticas, como Elvira y otras.
Contextualización de la materia en el conjunto del Master
Esta asignatura, dedicada a los métodos probabilistas, es una de las
seis que en el módulo "Sistemas inteligentes de diagnóstico,
planificación y control" se dedican a los métodos de la IA:
las otras cinco estudian los métodos lógicos, simbólicos, neuronales,
evolutivos y los de aprendizaje. Estos son los métodos básicos que
se utilizan en las distintas ramas de la IA, tales como la visión
artificial, robótica, lenguaje natural, minería de datos, etc.
Naturalmente, estos métodos no son compartimentos estancos, sino que
interactúan entre sí. Por ejemplo, algunos problemas de inferencia
en modelos probabilistas pueden resolverse mediante algoritmos evolutivos,
muchos de los métodos de aprendizaje simbólico utilizan técnicas probabilistas,
existen formalismos que combinan la lógica y la probabilidad, etc.
1 Medios de estudio
1.1 Metodología docente
La asignatura no tiene clases presenciales. Los contenidos teóricos
se impartirán a distancia, de acuerdo con las normas y los medios
telemáticos de la enseñanza en la UNED.
El alumno debe estudiar el material escrito y audiovisual (vídeos
docentes) y realizar prácticas de ordenador con el programa Elvira,
que está disponible en Internet.
1.2 Material de estudio
Bibliografía Básica
F. J. Díez y M. Arias. Apuntes sobre Métodos Probabilistas
en IA. Dpto. Inteligencia Artificial, UNED, 2006.
Un material diseñado específicamente para esta asignatura de posgrado.
Se complementa con los dos libros siguientes.
E. Castillo, J. M. Gutiérrez y A. S. Hadi. Sistemas Expertos
y Modelos de Redes Probabilísticas. Academia de Ingeniería, Madrid,
1997.
Un libro excelente sobre sistemas basados en reglas y redes bayesianas,
que fue publicado en español y en inglés. La versión española puede
obtenerse de forma gratuita en Internet.
S. Ríos, C. Bielza y A. Mateos. Fundamentos de los Sistemas
de Ayuda a la Decisión. Ra-Ma, Madrid, 2002.
Un libro excelente sobre análisis de decisiones. Además de los diagramas
de influencia, explica la obtención de utilidades y otros métodos
de toma de decisiones relacionados con los diagramas de influencia.
Vídeos docentes:
Existen varios vídeos docentes, de unos 15 o 20 minutos cada uno,
sobre Probabilidad y Teoría de la Decisión, disponibles en www.ia.uned.es/fjdiez/docencia/videos-prob-dec.
Software recomendado:
Las actividades prácticas recomendadas utilizan el programa Elvira
(www.ia.uned.es/elvira), desarrollado por varias
universidades españolas, incluida la UNED.
En la actualidad Elvira admite dos tipos de modelos, las redes bayesianas
y los diagramas de influencia, y está previsto añadir otros modelos
en el futuro. Elvira cuenta con un formato propio para la codificación
de los modelos, un lector-intérprete para los modelos codificados,
una interfaz gráfica para la construcción de redes, con opciones específicas
para modelos canónicos (puertas OR, AND, MAX, etc.), algoritmos exactos
y aproximados (estocásticos) de razonamiento, tanto para variables
discretas como continuas, métodos de explicación del razonamiento,
algoritmos de toma de decisiones, aprendizaje de modelos a partir
de bases de datos, fusión de redes, etc.
Elvira está escrito y compilado en Java, lo cual permite que pueda
funcionar en diferentes plataformas y sistemas operativos (linux,
Windows, etc.).
1.3 Materiales y recursos de apoyo
La plataforma de enseñanza a distancia aLF (cf. www.innova.uned.es),
proporcionará la interfaz de interacción entre el alumno y sus profesores.
aLF permite impartir y recibir formación, gestionar y compartir documentos,
crear y participar en comunidades temáticas, así como realizar proyectos
en línea.
1.4 BIbliografia general de consulta
F. V. Jensen. Bayesian Networks and Decision Graphs. Springer-Verlag,
Nueva York, 2001.
Trata las redes bayesianas y los diagramas de influencia. Un libro
excelente y fácil de leer.
R. E. Neapolitan. Learning Bayesian Networks. Prentice-Hall,
Upper Saddle River, NJ, 2003. (Versión en PDF, 1'97 MB)
Explica la construcción de redes bayesianas a partir de bases de datos.
Un libro muy completo, al alcance de todo alumno de posgrado.
J. A. Gámez y J. M. Puerta (Eds.). Sistemas Expertos Probabilísticos.
Universidad de Castilla-La Mancha, Cuenca, 1998.
Una exposición clara y completa de casi todos los aspectos de los
modelos gráficos probabilistas.
R. G. Cowell, A. P. Dawid, S. L. Lauritzen y D. J. Spiegelhalter. Probabilistic
Networks and Expert Systems. Springer-Verlag, Nueva York, 1999.
Un libro muy completo, pero difícil de leer por su formalismo matemático.
Para estudiantes avanzados.
J. Pearl. Probabilistic Reasoning in Intelligent Systems:
Networks of Plausible Inference. Morgan Kaufmann, San Mateo, CA, 1988.
Es el libro más famoso sobre redes bayesianas, aunque resulta difícil
de leer para el principiante.
Los Apuntes sobre Métodos Probabilistas en IA mencionados en la bibliografía
básica contienen una amplia selección de bibliografía al final de
cada tema.
1.5 Tutorización
La tutorización de los alumnos se llevará a cabo a través de la plataforma
de enseñanza a distancia aLF (cf. www.innova.uned.es).
2 Estructura del curso
2.1 Estructura y contenido teórico
Tema 1.Fundamentos de redes bayesianas
1.1.Repaso de teoría de la probabilidad
1.2.Método bayesiano ingenuo
1.3.Repaso de teoría de grafos
1.4.Definición de red bayesiana
1.5.Grafos de dependencias e independencias
1.6.Interpretación probabilista e interpretación causal de un grafo
Tema 2.Inferencia en redes bayesianas
2.1.Métodos exactos
2.2.Métodos estocásticos
Tema 3.Construcción de redes bayesianas
3.1.Construcción de redes causales con conocimiento experto
3.2.Aprendizaje automático a partir de bases de datos
Tema 4.Análisis de decisiones
4.1.Fundamentos de teoría de la decisión
4.2.Diagramas de influencia y árboles de decisión
4.3.Otros métodos de evaluación de diagramas de influencia
4.4.Construcción de diagramas de influencia
Tema 5.Aplicaciones
5.1.Aplicaciones en medicina
5.2.Aplicaciones en informática educativa e interfaces inteligentes
5.3.Aplicaciones en seguridad informática y vigilancia
5.4.Aplicaciones en ingeniería y visión artificial
5.5.Otras aplicaciones
2.2 Objetivos por tema y orientaciones breves
Tema 1.Fundamentos de redes bayesianas
El objetivo de este tema es exponer los fundamentos axiomáticos de
las redes bayesianas. Para ello se hace un repaso de los conceptos
fundamentales de la teoría de la probabilidad y la teoría de grafos
y se introduce el método bayesiano ingenuo. El alumno debe comprender
la definición matemática de red matemática y las implicaciones que
ésta tiene en cuanto representación de independencias probabilistas
y en cuanto representación causal del mundo real.
Los objetivos concretos son:
O.1.1.Recordar las definiciones y teoremas básicos de la
teoría de la probabilidad
O.1.2.Comprender el método bayesiano ingenuo, conocer sus
ventajas y sus limitaciones y saber en qué casos puede ser aplicado
y en cuáles no.
O.1.3.Recordar los conceptos básicos de la teoría de grafos,
especialmente los grafos dirigidos acíclicos, que constituyen la base
de los modelos gráficos probabilistas.
O.1.4.Aprender la definición axiomática de red bayesiana,
que se basa en la factorización de la probabilidad.
O.1.5.Comprender el significado de los grafos de dependencias
e independencias y sus propiedades básicas, que son la separación
direccional y la propiedad de Markov, y cómo éstas se relacionan con
la factorización de la probabilidad en redes bayesianas.
O.1.6.Distinguir entre la interpretación probabilista de
un grafo y su interpretación causal, y la relación que existe entre
ambas.
Orientaciones: conviene realizar los ejercicios propuestos, tanto
los de cálculo como los de utilización del programa Elvira, con el
fin de llegar a tener una visión intuitiva de los conceptos expuestos
en este tema.
Tema 2.Inferencia en redes bayesianas
El objetivo de este tema es conocer los principales algoritmos de
inferencia en redes bayesianas, que permiten calcular la probabilidad
a posteriori de cada variable o de un conjunto de variables dada cierta
evidencia.
Los objetivos concretos son:
O.2.1.Conocer los métodos exactos de inferencia en redes
bayesianas más utilizados, principalmente la eliminación de variables,
los métodos de agrupamiento y la inversión de arcos.
O.2.2.Conocer algunos de los métodos estocásticos de inferencia
en redes bayesianas más relevantes, tales como el muestreo lógico,
la ponderación por verosimilitud y el muestreo por importancia.
Orientaciones: a medida que el alumno/a estudia los diferentes algoritmos,
conviene que piense cómo los implementaría en su lenguaje de programación
preferido (por ejemplo, Java) y trate de analizar cuál es la complejidad
espacial y temporal de cada uno de ellos para distintos tipos de redes.
Tema 3.Construcción de redes bayesianas
El objetivo de este tema es conocer los dos métodos principales de
construcción de redes bayesianas. El primero de ellos, que se aplica
cuando no existe una base de datos de suficiente tamaño o calidad,
consiste en construir primero el grafo de la red con la ayuda de un
experto humano y luego añadir las probabilidades numéricas. El segundo
consiste en aplicar un algoritmo de aprendizaje a una base de datos,
con lo cual se obtiene de forma automática la red completa, es decir,
el grafo y las probabilidades.
Los objetivos concretos son:
O.3.1.Ser capaz de (1) construir un grafo causal a partir
de una descripción de un problema, (2) determinar en qué nodos pueden
aplicarse modelos canónicos que simplifican la obtención de las probabilidades
y (3) interrogar a un experto humano con el fin de obtener estimaciones
de las probabilidades numéricas.
O.3.2.Conocer los principales algoritmos de aprendizaje automático
de redes bayesianas y ser capaz de aplicarlos a una base de datos
mediante el programa Elvira.
Orientaciones: conviene realizar los ejercicios propuestos, tanto
los de construcción manual de redes bayesianas como los de construcción
a partir de bases de datos mediante Elvira.
Tema 4.Análisis de decisiones
El objetivo de este tema es aprender a resolver problemas de decisiones
mediante modelos gráficos probabilistas. De forma más específica,
se trata de que el alumno/a aprenda a construir diagramas de influencia
y a evaluarlos mediante la expansión de un árbol de decisión equivalente,
mediante el método de eliminación de variables o mediante inversión
de arcos.
Los objetivos concretos son:
O.4.1.Comprender los fundamentos de teoría de la decisión,
especialmente los conceptos de valor esperado y utilidad esperada.
O.4.2.Comprender qué es un diagrama de influencia (DI) y
un árbol de decisión (AD), cómo construir un AD para un DI dado y
cómo evaluar el AD.
O.4.3.Conocer otros métodos de evaluación DI's más eficientes
que la conversión en AD, tales como la eliminación de variables y
la inversión de arcos.
O.4.4.Ser capaz de construir DI?s para aplicaciones reales:
medicina, seguridad informática, etc.
Orientaciones: conviene construir con el programa Elvira los DI's
propuestos en los ejemplos de este tema y expandir el árbol de decisión
asociado a cada uno de ellos, para comprobar la equivalencia de ambas
representaciones.
Tema 5. Aplicaciones
El objetivo de este tema es conocer cómo los modelos gráficos probabilistas
(MGPs) se están utilizando para resolver algunos problemas del mundo
real.
Los objetivos concretos son:
O.4.5.Comprender cómo los MGPs resuelven problemas de diagnóstico
y planificación terapéutica en medicina
O.4.6.Comprender cómo los MGPs se utilizan en informática
educativa y en la construcción de interfaces inteligentes, especialmente
como modelos del usuario.
O.4.7.Comprender cómo los MGPs se aplican en seguridad informática
y vigilancia: filtrado de correo basura, detección de intrusos, etc.
O.4.8.Comprender cómo los MGPs se aplican en ingeniería (diagnóstico
y reparación de averías) y en visión artificial.
O.4.9.Comprender cómo los MGPs se aplican en otros campos,
tales como la recuperación de información, el comercio electrónico,
el análisis de riesgos financieros, etc.
Orientaciones: conviene que el alumno/a lea varios de los artículos
recomendados en la bibliografía de este tema, especialmente aquellos
más relaciones con el área en que esté más interesado/a, con el fin
de que en el futuro pueda construir MGPs aplicados a los problemas
que encuentre en su práctica profesional.
3 Actividades y plan de trabajo
3.1 Actividades prácticas programadas
Las actividades propuestas son principalmente de tres tipos:
-Ejercicios de desarrollo, que el alumno debe resolver con papel y
calculadora.
-Construcción de redes bayesianas y diagramas de influencia en Elvira,
bien a partir de conocimiento experto, bien a partir de bases de datos.
-Lecturas recomendadas, orientadas a ampliar alguno de los puntos
expuestos en el temario: por ejemplo, algoritmos más eficientes, aplicaciones
de los MGPs, etc.
3.2 Otras actividades prácticas programadas
A lo largo del desarrollo del curso, el equipo docente y los alumnos
podrán proponer otras actividades orientadas a ampliar algunos de
los aspectos teóricos o algorítmicos expuestos en el temario, o a
implementar mediante ordenador los métodos aprendidos.
3.3 Plan de trabajo
La dedicación que requiere cada uno de los temas es aproximadamente
la siguiente:
| Tema | H. teoría | H.práctica | H.actividades | Total tema |
|
| Tema 1. Fundamentos de redes bayesianas | 10 | 10 | 5 | 25 |
| Tema 2. Inferencia de redes bayesianas | 15 | 10 | 5 | 30 |
| Tema 3. Construcción de redes bayesianas | 15 | 10 | 5 | 30 |
| Tema 4. Análisis de decisiones | 15 | 10 | 5 | 30 |
| Tema 5. Aplicaciones | 5 | 10 | 20 | 35 |
| TOTAL | 60 | 50 | 40 | 150 |
4 Evaluación
La evaluación se realizará esencialmente mediante una serie de ejercicios
que el alumno deberá resolver y enviar al equipo docente.
Reseña del profesorado
Arias Calleja, Manuel:
Desde hace seis años viene compaginando su actividad docente e investigadora
con el desarrollo del proyecto Carmen sobre redes bayesianas. Su actividad
docente se centra en modelos gráficos probabilistas (redes bayesianas,
diagramas de influencia...), especialmente en optimización y
concurrencia. Ha participado en varios proyectos nacionales.
Correo-e: marias@dia.uned.es
Web personal: http://www.ia.uned.es/marias
Díez Vegas, Francisco Javier:
Es investigador de la UNED desde 1989 y profesor desde 1992. Fue alumno
de la UNED en Física y en Psicología y tutor durante un curso en el
Centro Asociado de Madrid. Su actividad docente e investigadora se
centra en los modelos gráficos probabilistas (redes bayesianas, diagramas
de influencia, modelos markovianos...), especialmente en su aplicación
a la medicina. Ha participado como investigador principal en varios
proyectos nacionales y uno internacional, y ha publicado artículos
en las revistas más relevantes de su especialidad. En la actualidad
es director del Centro de Investigación sobre Sistemas Inteligentes
de Ayuda a la Decisión (CISIAD).
e.mail: fjdiez@dia.uned.es
Web personal: http://www.ia.uned.es/fjdiez
|  |
 |
|