domingo, 27 de febrero de 2011

Movimientos de los ojos durante la lectura distraída

No eres sólo tú ... todo el mundo cae alguna vez en la lectura distraída. ¿Qué pasa en el cerebro y en los ojos cuando esto sucede? Un nuevo estudio publicado en Psychological Science  dice que los ojos se mantienen en movimiento cuando la mente vaga, pero no lo hacen de la misma manera que cuando se está prestando atención.

Durante una docena de sesiones de lectura de una hora, se registró el movimiento de los ojos de unos estudiantes. Al principio se les dio a leer El Proceso de Kafka, pero les enganchaba demasiado. Luego usaron Sentido y Sensibilidad de Jane Austen porque es bastante fácil. Mientras los estudiantes leían en una pantalla, un ordenador seguía sus movimientos oculares. Se pidió a los estudiantes que presionaran un botón cuando se dieran cuenta de que se habían distraído. El ordenador también preguntaba cada pocos minutos si estaban atentos o en las nubes.

En la lectura normal, los ojos se fijan en una palabra y luego pasan rápidamente a otra, empleando más tiempo en las palabras que son menos comunes. Pero cuando la mente vaga, los ojos no siguen ese patrón. El ojo se fija durante más tiempo en cada palabra individual. "Es como si los ojos se movieran mecánicamente". La investigación sugiere que la opinión de que los ojos captan la información de la página y la mente la coge sin dar muchas directrices de vuelta a los ojos es errónea. De hecho, cuando la gente lee, los movimientos oculares están estrechamente relacionados con el procesamiento del lenguaje que ocurre en el cerebro.

martes, 22 de febrero de 2011

La organización espacial de las neuronas nos diferencia de los simios además de la cantidad

El cortex del hombre tiene mayor extensión y mayor número de neuronas que el de nuestros parientes los simios. En un nuevo estudio se comprueba que la organización espacial (densidad) de neuronas también varía.
Menor densidad de neuronas en el área 10 en humanos (dcha) que en chimpancés (izqda) permite mayor número de conexiones
El estudio examinó humanos además de chimpancés, bonobos, gorilas, orangutanes, y gibones. Se midió la densidad de cuerpos celulares en distintas áreas: corteza frontal (área Brodmann [BA] 10) y cortezas motora primaria (BA 4), somatosensorial primaria (BA 3), y visual primaria (BA 17).
El área 10 de Brodmann se sitúa en el lóbulo frontal, encima de los ojos. Se supone que tiene relación con el pensamiento más abstracto y sofisticado. Es en este área donde las diferencias de organización (además de número) son más significativas entre hombres y simios. Las neuronas humanas están más espaciadas permitiendo un mayor número de conexiones por cada neurona. El resto de las áreas no presenta diferencias notables de organización entre humanos y simios.
Esto sugiere que el cerebro humano evolucionó hacia un mayor número y anchura de columnas cerebrales así como hacia un mayor espacio de interconexiones neuronales en el lóbulo frontal.

domingo, 20 de febrero de 2011

¿Existe el libre albedrío? Cuando tomas una decisión ¿podrías haber hecho algo distinto? Resultados de la encuesta

En la encuesta ¿Existe el libre albedrío? Cuando tomas una decisión ¿podrías haber hecho algo distinto? habéis respondido 44 personas.
Para eliminar la ambigüedad en lo posible, la pregunta incorpora la definición del filósofo John Searle que describe el libre albedrío como la creencia de que 
" a menudo podríamos haber hecho algo distinto de lo que hicimos"
El resultado es claro. Dos de cada tres participantes opináis que SÍ existe el libre albedrío.
También es notable que una de cada tres personas que habéis respondido opináis que NO existe.
Gracias por vuestra participación. 

Resultados de la encuesta



Entrada relacionada: Libre albedrío

lunes, 14 de febrero de 2011

¿Cómo funciona Watson de IBM?


Un equipo de 20 investigadores de IBM lleva 3 años construyendo a Watson, el ordenador que se enfrenta con éxito a humanos en el juego de televisión Jeopardy. ¿Cómo funciona Watson?
Watson está compuesto por un centenar de algoritmos. No se espera que ninguno resuelva por sí solo el problema. La pregunta se analiza y se buscan múltiples respuestas candidatas que generan hipótesis. Estas hipótesis se confrontan con las evidencias disponibles y se les asigna una puntuación de confianza. Se establece una clasificación y la mejor situada es la respuesta elegida. Cada uno de los algoritmos merece una publicación separada.
Hace unos tres años, la división de investigación de IBM, IBM Research estaba buscando un desafío de investigación para competir con el interés científico y popular que supuso Deep Blue cuando  hace 14 años derrotó al ajedrez al campeón mundial Gary Kasparov. Era una ocasión magnífica para celebrar el 100 aniversario con un logro de repercusión mundial. Una parte mayoritaria del conocimiento mundial ha sido digitalizado y se encuentra disponible en múltiple formatos: bases de datos, datos no estructurados, documentos de texto... ¿Es posible acceder a ellos mediante lenguaje natural? La respuesta de IBM ha sido la tecnología de pregunta-respuesta QA.
Los avances en la tecnología de pregunta-respuesta (QA) pueden servir de apoyo a los profesionales en la toma oportuna de decisiones críticas en áreas como la atención de la salud, la integridad de negocios, inteligencia de negocios, el descubrimiento del conocimiento, gestión del conocimiento empresarial, seguridad y atención al cliente.
Nuestros resultados sugieren que DeepQA es una arquitectura eficaz y extensible que se puede utilizar como base para la combinación, la implementación, evaluación y la promoción de una amplia gama de técnicas algorítmicas para avanzar rápidamente en el campo de preguntas y respuestas (QA).
El reto de Jeopardy
Jeopardy proporciona todos los elementos para este desafío.
Se trata de un dominio abierto en el que caben todo tipo de preguntas.
Es una síntesis de recuperación de información, procesamiento del lenguaje natural, la representación del conocimiento y el razonamiento, máquinas  que aprenden, y las interfaces hombre-máquina.
Jeopardy requiere responder a preguntas en lenguaje natural rico en un dominio muy amplio de temas, con penalizaciones para las respuestas erróneas.
Los concursantes disponen de alrededor de 3 segundos para responder cada pregunta. Hay que responder a aproximadamente el 70 por ciento de las preguntas con una precisión superior al 80 por ciento en 3 segundos o menos.
Las categorías. 
En Jeopardy, el nombre de la categoría puede proporcionar información que Watson debe evaluar. Aunque en ocasiones despista más que ayuda.
Las preguntas. 
Hay muchas formas de categorizar la pregunta: Por tema, por la dificultad, por la construcción gramatical, según el tipo de respuesta, y así sucesivamente.
Una parte importante son las preguntas factoide: preguntas cuyas respuestas se basan en información objetiva acerca de una o varias entidades individuales contenidas en la pregunta.
Descomposición. Algunas pistas más complejas contienen múltiples hechos. No se espera encontrar las dos sub-pistas en una sola frase en las fuentes de información.
Rompecabezas. Aunque los rompecabezas constituyen sólo alrededor de 3 o 2 por ciento de todas las pistas no se puede ignorar.
Tipos de preguntas excluidas. Por acuerdo con los patrocinadores, las preguntas visuales y auditivas están excluidas. Ambos desafíos resultan muy interesantes desde el punto de vista de AI, pero se excluyeron del alcance de este concurso y la evaluación.
El dominio
Para analizar la amplitud del dominio Jeopardy Challenge se usan los tipos de respuesta léxica (LAT).
Se define una LAT como una palabra en la pista que indica el tipo de la respuesta, independientemente de la asignación de la semántica de esa palabra. Alrededor del 12 por ciento de las pistas no indican un tipo de respuesta explícita léxica, sino que se refieren a la respuesta con los pronombres como "él", "estos", o "esto". La distribución de LAT tiene una cola muy larga, como se muestra en la figura. Se han encontrado 2.500 LAT distintas y explícitas.
Frecuencia de las LAT
La Métrica
Además de la precisión de preguntas y respuestas, la victoria dependerá de la velocidad, la estimación de la confianza, la selección de la pista, y la estrategia de apuestas.
El obejtivo es medir la exactitud, la confianza, y la velocidad. Para ello se usó la precisión y el tanto por ciento respondido. El umbral controla el equilibrio entre la precisión y el porcentaje de respuestas. La exactitud se refiere a la precisión si todas las preguntas son respondidas.
El desafío:
Rendimiento de los campeones humanos
Rendimiento en Jeopardy. Los puntos corresponden a humanos registrados en más de 2.000 juegos. Los puntos oscuros son el resultado de Ken Jennings, el mejor jugador de la historia. Las líneas indican el rendimiento de las distintas versiones de Watson
Se basa en el análisis histórico de casi 2000 encuentros de Jeopardy.
El centro de la llamada "Nube de Ganadores" (el conjunto de puntos grises en la gráfica) revela que los campeones de Jeopardy son seguros y lo suficientemente rápidos para adquirir (apretar el pulsador buzz), en promedio entre el 40 y 50 por ciento de todas las preguntas a sus competidores y para tener una precisión de entre el 85 por ciento y 95. Los puntos más oscuros en la gráfica representan los juegos de Ken Jennings. Ken Jennings tuvo una racha ganadora sin igual en el año 2004, en los que ganó 74 partidas seguidas.
Línea de base de rendimiento
IBM usó como referencia antes de empezar con Watson dos programas llamados Practical Intelligent Question Answering Technology (PIQUANT) y OpenEphyra. Ambos obtenían buenas puntuaciones en entornos de manejo de textos Text Retrieval Conference (TREC).
Se tardararon unas 4 semanas en adaptarlos al entorno de Jeopardy. Resultó evidente que la precisión y la estimación de la confianza estaban muy por debajo de los requisitos del Desafío Jeopardy con apenas un 15% de exactitud. Lo que si demostraron es que varias técnicas eran posibles: análisis sintáctico profundo pero también búsquedas superficiales, bases de datos estructuradas y no estructuradas.
El enfoque DeepQA

martes, 8 de febrero de 2011

Los cerebros jóvenes se recablean con más facilidad que los adultos

Un estudio del MIT en colaboración con Alvaro Pascual-Leone y Rebecca Saxe ha descubierto que es más fácil recablear el cerebro en jóvenes que en personas de más edad.
Hace una década se descubrió que la parte del cerebro dedicada al procesamiento visual en personas ciegas se había recableado para trabajar con información táctil como la procedente de los dedos para leer Braille. Otros descubrimientos revelaron que esto ocurría también en otras zonas. Ahora sabemos que esto es más fácil de que ocurra en edades tempranas.En los 50 se comenzó a pensar que ciertas funciones cerebrales, como el lenguaje o la vista,  solo se desarrollaban si recibían información durante una edad temprana. Es decir, existe una ventana de edad en la que necesitamos estimulación para desarrollarnos normalmente. Es el caso de Gaspar Hauser o los niños lobo que no han estado expuestos al lenguaje en los primeros años y posteriormente no pueden adquirir un lenguaje completo. Es también el caso de la fonética que solo aprendemos en los primeros años y por lo que existe una diferencia tan grande entre la lengua materna y la aprendida de adultos. Lo demuestran los estudios con gatos a los que se venda los ojos durante los primeros meses de vida y cuando se les quita la venda ya no son capaces de ver con normalidad, mientras que si la venda se les pone de adultos, no tiene efecto alguno. En los primeros meses o años el cerebro necesita estimulación para desarrollarse y una vez que esto ha ocurrido, es una habilidad que no se pierde..
En esta investigación se estudió un área del cerebro llamada complejo temporal medial MT. Esta zona responde al movimiento visual. En el caso de que este dañada en ambos hemisferios, el paciente ve imágenes congeladas.
Se eligieron tres grupos de personas: ciegos de nacimiento, personas que habían perdido la vista con 9 o más años de edad y personas con vista. Se estudió su respuesta con resonancia funcional magnética fMRI a los sonidos en movimiento (como pasos que se aproximan).
Este área reaccionaba a los sonidos en movimiento en personas ciegas de nacimiento, pero no en las personas con vista ni en los ciegos tardíos. Es decir, las personas que habían visto hasta los 9 años habían cableado el cerebro con normalidad y esta área responsable del movimiento visual se dedicaba a procesar información visual. Por el contrario, en los ciegos de nacimiento, este área se había transformado para procesar información auditiva. Los 9 años constituían una frontera para el recableado del cerebro.
Aunque es infrecuente, cada vez se dan más casos de recuperación de la visión como en el caso de los chips implantados en la retina. Las personas ciegas de nacimiento tienen una ventaja sobre los ciegos tardíos en el procesamiento de la información auditiva. Pero esto se convertiría en una desventaja si se recuperara la vista.
Algunas regiones de la corteza visual (en verde) pueden ser recableadas para procesar sonidos en el cerebro de las personas que nacieron ciegas.

domingo, 6 de febrero de 2011

Chip implantado en la retina permite leer letras y palabras a ciegos

La tecnología BCI (interfaz cerebro máquina) avanza con rapidez. En este estudio, se implantó un chip en la retina de pacientes ciegos. Los resultados son esperanzadores y les han permitido leer letras y combinarlas en palabras así como reconocer formas y objetos.
La retinitis pigmentosa y la degeneración macular son enfermedades que afectan a los fotoreceptores de la retina y que afectan a 15 millones de personas en el mundo. El estudio se realizó con pacientes de retinitis pigmentosa y choroideraemia. Estos comenzaron a perder la vista entre los 6 y los 16 años pero habían tenido buena visión central (es decir, las áreas cerebrales de la visión estaban en buen estado). En el  momento del estudio hacía más de 5 años que no podían leer y aunque percibían algo de luz, no reconocían forma alguna. La operación sirve en principio para mejorar la visión de forma suficiente y que afecte a la vidad diaria.
El chip MPDA (del tamaño de este cuadrado ■) consiste en una retícula de 1500 (38x40) elementos independientes. Cada uno equivale a un pixel y consta de un fotodiodo, un amplificador y un electrodo. El chip se coloca en el interior de la retina y sustituye a los fotoreceptores naturales dañados. Cuando cada uno de los 1500 fotodiodos recibe luz, excita mediante su electrodo a las neuronas bipolares de la retina estableciendo el interfaz hombre-máquina. Las neuronas bipolares continúan la secuencia natural de estimulación nerviosa a través del resto de la retina, nervio óptico y cerebro.
Haz clic para agrandar
La corriente con la que cada electrodo excita a las´neuronas bipolares depende de la luminosidad que capte su fotodiodo..
El chip cubre u ángulo visual de 11º x 11º (1º es 288 µm de retina) La distancia entre dos electrodos del MPDA se corresponde a un ángulo visual de 15 minutos de arco.
EL chip dispone también de una retícula de 4 x 4 de estimulación directa para pruebas. Estos puntos no son dependientes de la luz sino que se estimulan directamente desde el exterior y sirven para calibrar el aparato.
Finalmente el chip está conectado a un cable que sale por detrás de la oreja y que sirve para la alimentación eléctrica y las pruebas.
Pruebas realizadas y resultados.
Las pruebas se realizaron en dos condiciones experimentales: con chip en Power ON y Power OFF. Comenzaron 7 días después de la operación.
Usando la retícula de prueba, todos los pacientes vieron con corrección puntos redondeados de color blancuzco. Reconocieron las formas presentadas como por ejemplo la forma de U.
Usando los fotodiodos del chip, la variación entre los pacientes fue alta. Uno de ellos realizó notables reconocimientos. No sólo reconoció formas, y barras en distintas orientaciones. Frente a una mesa, pudo reconocer una cuchara, un cuchillo, una copa, un plátano y una manzana. También pudo distinguir entre 16 letras (de un tamaño entre 5 y 8 cm). Pudo señalar un error en la escritura de su nombre MIIKKA (faltaban una I y una K).
La respuesta de contracción pupilar también funcionó correctamente.
Discusión.
Los implantes fuera de la retina obligan a realizar externamente todo el procesamiento óptico que esta realiza. Por el contrario este enfoque sólo reemplaza la parte dañada (los fotoreceptores) permitiendo que todo el resto del ojo trabaje normalmente (el ojo se mueve con normalidad proporcionando al cerebro una información consistente entre la dirección de la mirada y lo que ve, algo importante y que no ocurre con una cámara externa).
El problema del espacio. A pesar de que el campo visual 11º x 11º es pequeño, es suficiente para la orientación y la localización de objetos. Se estima que el campo visual necesario para leer es de 3º x 5º.
El problema del tiempo. Cuando se aplica un estímulo eléctrico continuo con la matriz de pruebas, la percepción se desvanece pasados 1-15 s. Aparentemente las neuronas de la retina sufren una inhibición prolongada. Para restaurar la visión es necesario mover los ojos o la cabeza.
Esto no ocurre con la matriz de fotodiodos ya que el paciente mueve los ojos con normalidad (microsacadas de hasta 50 min de arco entre 1 y 3 Hz) y la imagen se refresca constantemente.
Un hecho notable es que apenas requiere entrenamiento, más allá de una mejora oculomotora.
Conclusión.
El estudio demuestra que es posible la restauración parcial de la visión con una implantación de microelectrodos retinianos en pacientes que han sufrido una degeneración retiniana hasta un nivel que varía desde la localización y reconocimiento de objetos hasta la lectura.