martes, 23 de junio de 2009

Pantallazos de la práctica de Prometheus

Pantalla 1:


Pantalla 2:


Pantalla 3:


Pantalla 4:

Pantalla 5:

Pantalla 6:


Pantalla 7:


Pantalla 8:


Pantalla 9:


Pantalla 10:

Máquinas de Soporte Vectorial

Las Máquinas de Vectores Soporte son en la actualidad los algoritmos que más se están utilizando para todo tipo de tareas de inducción. Su sólido fundamento teórico y sus muchas y manejables implementaciones hacen que estén siendo muy utilizadas y constituyan el núcleo más numeroso de publicaciones en los foros más importantes del mundo sobre aprendizaje automático como el Journal of Machine Learning Research (JMLR), NIPS, ICML, ECML.



Sus orígenes...

Las SVM son clasificadores derivados de la teoría de aprendizaje estadístico postulada por Vapnik y Chervonenkis.

Fueron presentadas en 1992 y adquirieron fama cuando dieron resultados muy superiores a las redes neuronales en el reconocimiento de letra manuscrita, usando como entrada pixeles.

"Pretenden predecir a partir de lo ya conocido".

La máquina de vectores de soporte es un clasificador lineal que emplea la siguiente metodología:
  • Mapear los puntos de entrenamiento a un espacio vectorial mayor.
  • Construir un hiperplano que separe los puntos en sus clases respectivas.
  • Clasificar un punto nuevo de acuerdo a su ubicación con respecto al hiperplano de separación.
De esta manera se construye un hiplano de separación:



Hiperplano de separación

Dado que varios vectores w pueden generar el mismo hiperplano de separación, entonces, por cuestiones de estandarización, dicho vector debe escalarse de manera que la distancia entre el hiperplano y el patrón má cercano a este sea 1. Esto es lo que ilustra en la próxima figura:


Forma canónica del hiperplano

El propósito del entrenamiento es maximizar la distancia entre los patrones y el hiperplano de separación (para obtener un clasificador más confiable). Pero dado que w es inversamente proporcional a dicha distancia, este mismo problema se puede expresar como la minimización de w. Para esta operación se usan los multiplicadores de Lagrange:

Multiplicadores de Lagrange
El método más usado para entrenar SVM solucionando el problema dual es utilizando SMO (Sequential Minimum Optimization).

En el siguiente link se puede hallar una implementación en Java de SMO:
http://dm.hwanjoyu.org/svm-java/

domingo, 17 de mayo de 2009

Hipótesis de GAIA (Resumen)

A principios de los años setenta Lynn Margulis (una eminente bióloga, conocida por ser la primera esposa de Carl Sagan) y James Lovelock postularon la hipótesis Gaia, según la cual la Tierra es un sistema de control activo y adaptable, capaz de autorregularse y mantener así las condiciones adecuadas para la vida. Gaia tendría ciertas características de un macro-organismo (como algo vivo). Esta hipótesis fue adoptada con entusiasmo por los ecologistas, los hippies y los amantes de lo alternativo; pero, sin embargo, encontró un fuerte rechazo por parte de la mayor parte de los científicos, en especial los biólogos.

Imagen1: Planeta Tierra (fdecomite)

Lovelock reconoce que, en sus intensos debates con Richard Dawkins (brillante pensador y divulgador de la evolución), éste le demostró que la teoría Gaia era necesariamente errónea e incompatible con la evolución darwinista. En consecuencia, Lovelock nos presenta ahora una teoría, que según él, no debemos entender literalmente, sino más bien como una metáfora. Pero lo dice con la boca chica. A lo largo del libro vemos innumerables pasajes en los que el autor demuestra que sigue creyendo, a pies juntillas, que Gaia es y se comporta como un macro-organismo, que tiene una especie de conciencia e incluso puede tomar decisiones.

Gaia incluye la litosfera, la biosfera y la atmósfera, por lo que es fácil adivinar su gran complejidad. Pero Lovelock va más allá: nos quiere convencer de que es imposible comprender Gaia, pues forma parte de los entes emergentes, inherentemente incomprensibles e irreductibles a conceptos más sencillos. Así, todo esfuerzo de la razón o la ciencia por entender Gaia estaría condenado al fracaso. Es más, peca de frío reduccionista quien lo intente. Cuando en un mismo párrafo aparecen las palabras emergente y reduccionista a mí se me pone (más) cara de bobo, se me frunce el ceño y me entra la terrible sospecha de que me están vendiendo crece-pelo.

Curiosamente Lovelock no aporta ninguna prueba del carácter emergente de Gaia, ni siquiera descubrimos por qué dice que es tan tremendamente compleja que "no puede ser comprendida en el limitado espacio de nuestras mentes conscientes" ni aunque esté descrita con palabras. Nos enteramos de que "nuestros pensamientos inconscientes profundos no se construyen de forma racional, sino que emergen plenamente formados" (¡Uffff!, yo de esos no debo tener); y con esos sí, con esos podemos intuir lo que es Gaia.

La argumentación que nos presenta para clasificar a Gaia de esta guisa es un claro ejemplo de falacia. Nos dice que en Física Cuántica aparecen fenómenos que no pueden ser entendidos por los científicos, pero que éstos son capaces de usar: en el estudio de estos temas falla la razón; la intuición, sin embargo, es capaz de manejarlos. Pero lo que ocurre, querido James, es exactamente lo opuesto: nuestra intuición, entrenada en el análisis del mundo macroscópico es incapaz de predecir y comprender el mundo subatómico; en cambio, la razón sí es capaz de describirlo adecuadamente.

Lovelock acude también a otro ejemplo emblemático: la conciencia. Según él la conciencia es un fenómeno emergente, es decir, que no puede ser entendido en términos de sus componentes, que no puede ser reducido a conceptos más simples, ni descrita con palabras ni comprendida. Sin embargo no es esta la opinión de importantes neurólogos actuales (léanse por ejemplo el maravilloso "La Conciencia: cómo la materia se convierte en imaginación" de Edelman y Tononi o el fabuloso "La tabla rasa" de Pinker).

Pero, aunque se diera el caso de que en Física Cuántica existieran fenómenos emergentes, aunque nuestras mentes conscientes no pudieran llegar a entender la consciencia ¿significaría eso que Gaia tiene que pertenecer a tan selecto club?

Según Lovelock en Gaia aparecen mecanismos de autorregulación y estos, incluso los más simples, "caen fuera de las fronteras estrictamente definidas del pensamiento cartesiano de causa y efecto". Pone incluso el ejemplo del sistema de autorregulación, inexplicable en profundidad según él, de una máquina de vapor. Se ve claramente que Lovelock no es un físico, yo diría que ni siquiera un científico, pues en otro caso no es posible entender que diga tales majaderías.

En el libro de Lovelock encontramos también cosas muy interesantes: por ejemplo una defensa entusiasta de la energía nuclear de fisión (que comparto) y un montón de esperanza en la energía de fusión. Lovelock analiza los costes y riesgos de la fisión, la enorme abundancia de combustible, (pues aduce que parece sencillo extraer uranio del granito) y, sobre todo, el problema de los residuos. Llega a ofrecer el jardín de su casa para almacenar los residuos generados durante un año por una central de fisión típica. Ciertamente muy convincente.

Cuando analiza el futuro de la fusión, es decir la obtención de energía emulando al Sol, a partir de la diferencia de masa entre cuatro núcleos de hidrógeno y uno de helio, Lovelock comete un error de bulto: dice que la temperatura en el interior del Sol es de 100 millones de grados, en vez del valor real de sólo 15 millones. No tiene importancia, pero lo dice un par de veces. ¿Por qué comete este error? Muy fácil, en un laboratorio necesitamos al menos 100 millones de grados para que la fusión sea efectiva, debido a que a esa temperatura la energía cinética de la mayoría de los protones es tal que estos pueden acercarse entre sí, venciendo la repulsión culombiana, hasta distancias a las que la fuerza fuerte empieza a actuar. A 15 millones sólo un porcentaje infinitesimal de los protones tiene tal velocidad. La cantidad de protones en el interior de una estrella es tan alta que las reacciones de fusión ocurren, aunque, evidentemente a un ritmo muy bajo. Para que se hagan una idea, el calor que están ustedes disipando ahora mismo, por kilo de persona, es entre 10 y 100 veces mayor del que generarían si estuviesen constituidos del material del interior solar a sus 15 millones de grados.

Lovelock revisa concienzudamente otras fuentes de energía y presenta un débil ataque a la eólica. Los principales argumentos contra ésta no dejan de ser algo peregrinos: que no es realmente barata porque sólo es efectiva cuando hay viento; que los propios aerogeneradores pueden llegar a modificar el régimen de vientos; que los molinos son fabricados por empresas alemanas; o que estropean el paisaje. Así nos enteramos de que James disfruta enormemente de los paseos con su mujer por las agrestes costas de Cornualles. Paisajes idílicos, sobrecogedores y desiertos, que empiezan a llenarse de molinos de viento. Útiles sólo para que los millones de urbanitas londinenses disfruten de energía a cambio de destrozar el idilio de unos pocos. Y la verdad es que no le falta parte de razón. Aunque personalmente yo pienso que la principal solución, la única viable a largo plazo, al problema del calentamiento global no pasa ni por fuentes de energía limpia ni por ahorro ecológico: pasa por disminuir la población de la Tierra. No podemos ser tantos. No podemos ser más. Y no podemos, eso seguro, ser muchísimos más.

Lovelock habla de muchas otras cosas interesantes, que no caben aquí, y acaba diciéndonos que el concepto de Gaia es enormemente útil si se difunde a las masas pues, sólo así, opina, la vida de los seres humanos será posible a largo plazo. Resumiendo: Gaia debe entenderse como una metáfora, es incognoscible pero al mismo tiempo muy útil para regir el comportamiento de las masas. ¿A qué les recuerda? Efectivamente ¿es Gaia ciencia o religión?

La ciencia no necesita emergentes ni inherentemente incomprensibles Gaias para explicar el Universo. Hay por supuesto muchos fenómenos que aún no entendemos, pero eso no nos habilita para explicarlos, como hacen las religiones, de un plumazo, introduciendo términos incognoscibles. Si analizamos el comportamiento del clima, o de la evolución de las especies, o de la proporción de oxígeno en el aire, enseguida nos damos cuenta de que se superponen muchas causas que generan fenómenos complejos. La ciencia usa una palabra para describir esto: caos. Un sistema caótico con fuertes componentes retroactivos pasa necesariamente por muchos estados de equilibrio más o menos estables. En dichos sistemas tienen que aparecer, necesariamente, fenómenos que se autorregulen. Es más, serán precisamente dichos procesos los que pervivan durante un cierto tiempo. Por eso no es que sea incomprensible encontrarnos con autorregulación, lo realmente difícil sería no hallarla.

Lovelock parece no haber descubierto el caos. Los griegos antiguos llamaron Cosmos al Universo. Cosmos, la raíz de cosmético, significa hermoso y ordenado. Porque así veían ellos el mundo, con dioses para explicar lo que no entendían y esferas perfectas y planetas en órbitas precisas y eternas. En cambio los astrofísicos actuales ven el Universo preñado de caos; rebosando de galaxias caníbales y estrellas que explotan; planetas que colisionan y cometas que caen sobre soles. Pero han descubierto también al hijo primogénito del caos: la evolución.

Y así percibimos, no un universo estático, autorregulado o regido por dioses, sino un universo en continua evolución: vemos nacer estrellas y envejecer galaxias; aparecer elementos químicos y moléculas complejas; y extrañas y dinámicas estructuras como las manchas solares, o la tormenta permanente en forma de gran mancha roja sobre Júpiter. Y hemos descubierto, de momento sólo aquí, en nuestro planeta, a la hija más hermosa de la evolución: la vida. Y también a dos de los vigorosos hijos de la vida: el sexo y la muerte. Los dos hijos que han permitido a la vida avanzar a pasos de gigante y poblar la Tierra de variadísimos y complejos organismos; y modificar el entorno e incluso ponerse en peligro a sí mismos. Para poder acabar glosando a Miguel Hernández tengo que citar aquí al hijo más guapo, aunque no precisamente el más divertido, del sexo: el amor. Pues bien, tal como yo lo veo, estamos destrozando el medio ambiente y puede que esto nos pase factura. Pero no porque ninguna Gaia se vaya a vengar sino porque somos hijos del caos y la evolución, de la vida y de la muerte, y del amor. Y precisamente por eso arrastramos no tres sino cinco heridas: la del caos, la de la evolución, la de la vida, la del amor, la de la muerte.