El papel de la corteza prefrontal medial en el mantenimiento de la memoria de trabajo de las propias respuestas emocionales

Participantes

Reclutamos a veintiséis adultos (13 mujeres; edad media = 23,12 ± 4,03) de la población general (mediante folletos y anuncios en Internet) para participar en el presente estudio. Los criterios de exclusión incluían cualquier antecedente de trastornos psiquiátricos o neurológicos (evaluados mediante un cuestionario de detección telefónica basado en los criterios del Manual diagnóstico y estadístico de los trastornos mentales, 4ª edición; DSM-IV-TR). Todos los participantes dieron su consentimiento informado por escrito antes de participar en cualquier actividad relacionada con el estudio. Todos los participantes también recibieron una compensación económica por su participación. La Junta de Revisión Institucional de la Universidad de Arizona revisó y aprobó el protocolo de investigación del presente estudio, y todos los métodos se llevaron a cabo de acuerdo con las directrices y reglamentos pertinentes.

Tarea de memoria de trabajo

Al completar el consentimiento informado, se presentaron a los participantes instrucciones escritas (en un ordenador portátil) sobre cómo realizar la tarea de WM (esta tarea se ilustra en la Fig. 1). Estas instrucciones decían «se les mostrará una serie de imágenes que suelen desencadenar reacciones emocionales» y «en cada ensayo se les mostrará una imagen y se les darán instrucciones para que presten atención a algo específico». A continuación, las instrucciones informaban a los participantes de que habría una pausa después de ver la imagen (en la que sólo se mostraba una pantalla negra), durante la cual se les pediría que mantuvieran el elemento atendido en la memoria. A continuación, se decía a los participantes que, tras la pausa, aparecerían tres opciones en la pantalla y que se les pediría que pulsaran uno de los tres botones correspondientes para comprobar su memoria.

Antes de cada ensayo, aparecía una instrucción (en orden pseudoaleatorio) que decía «Emoción», «Imagen», «Cuerpo» o «Descanso». Se les dijo que la instrucción «Emoción» significaba que «debían prestar atención a su propia reacción emocional a la imagen y mantener este sentimiento emocional en mente» durante la pausa. Se informó a los participantes de que, cuando aparecieran las tres opciones en la pantalla después de la pausa, dos de ellas serían palabras de emoción (incluyendo: enfadado, disgustado, feliz, neutro, asustado o triste). La tercera opción sería «ninguna». Se les indicaba que eligieran la opción (pulsando un botón) que mejor se correspondiera con la respuesta emocional que tenían en la memoria. Se les dijo que la instrucción «Imagen» significaba «debes prestar atención a las cosas de la imagen y mantener la imagen en la mente» durante la pausa. Se informó a los participantes de que, cuando aparecieran las tres opciones en la pantalla después de la pausa, dos opciones serían palabras de categoría (incluyendo: humano, animal, niño, adulto, hombre, mujer, vivo o no vivo solamente). La tercera opción sería «ninguno». Se les indicó que eligieran la opción (pulsando el botón) que mejor se correspondiera con su recuerdo de lo que había en la imagen. Se les dijo que la instrucción «Cuerpo» significaba que «debían prestar atención a su propia reacción corporal ante la imagen y tener presente esta sensación corporal» durante la pausa. Se informó a los participantes de que, cuando aparecieran las tres opciones en la pantalla tras la pausa, dos de ellas corresponderían a lugares de su cuerpo en los que podrían haber sentido un cambio (incluyendo: corazón, estómago, brazos, cara, garganta o ningún cambio). La tercera opción sería «ninguno». Se les indicó que eligieran la opción (pulsando el botón) que mejor se correspondiera con su recuerdo de la región más prominente en la que sintieron un cambio en su cuerpo. Por último, se les dijo que la instrucción «Descanso» significaba que «no es necesario recordar nada» durante la pausa. Se informó a los participantes de que, cuando aparecieran las tres opciones en la pantalla después de la pausa, dos opciones dirían «no empuje» y la tercera opción diría «Empuje». Se les indicó que eligieran la opción (pulsando el botón) que decía «Empujar» en cada ensayo. Esta condición actuaba como una condición de control en la que no se mantenía nada en la WM durante el periodo de mantenimiento, pero en la que todas las condiciones de estímulo eran idénticas.

Por último, se les indicaba que utilizaran estrategias particulares durante el periodo de pausa para cada tipo de ensayo. Para la condición «Emoción», se les pidió que «mantuvieran el sentimiento emocional en la mente para recordar qué emoción era». Para la condición «Imagen», se les pidió que «mantuvieran en mente la imagen visual de la fotografía para recordar lo que había en ella». Para la condición «Cuerpo», se les pidió que «mantuvieran la sensación corporal en la mente para recordar dónde sentían que su cuerpo reaccionaba». También se les dijo que «hicieran lo posible por NO retener simplemente una palabra en la mente» (como repetir «animal, animal, animal», o «triste, triste, triste», o «estómago, estómago, estómago» para recordar). Esto se hizo para evitar el uso de una estrategia de WM auditiva en cada condición (por ejemplo, para que los participantes realmente tuvieran en mente un concepto de emoción en la condición «Emoción», una imagen visual en la condición «Imagen», etc.). Después de leer estas instrucciones, se ofreció a los participantes la oportunidad de hacer preguntas, y luego se les permitió practicar la tarea durante varios ensayos en el ordenador portátil. Este periodo de práctica proporcionó dos exposiciones a cada tipo de instrucción. Después de este periodo de práctica, los participantes podían volver a hacer cualquier pregunta aclaratoria si algo todavía no se entendía del todo.

Los participantes fueron llevados al escáner de resonancia magnética (MRI) de la Universidad de Arizona, donde se sometieron a un escaneo de MRI funcional (ver Métodos de Neuroimagen más adelante) mientras completaban la tarea de WM. Antes de comenzar la exploración, también se les dio un pequeño número de ensayos de práctica para que se acostumbraran a realizar la tarea dentro del entorno del escáner.

La tarea utilizó estímulos emocionales normativos adquiridos del Sistema Internacional de Imágenes Afectivas (IAPS). Sobre la base de los datos normativos del IAPS (tanto masculinos como femeninos) proporcionados por Lang et al.38 utilizando una escala de valoración de 9 puntos, se seleccionaron imágenes para cada valencia (desagradable (U) = Mvalencia < 4,0, neutral (N) = 4,0 < Mvalencia < 6,0, agradable (P) = Mvalencia > 6,0). La tarea fue contrabalanceada en la mayor medida posible con respecto a todas las variables de estímulo y condición. Esto incluía garantizar que cada opción de respuesta se mostrara un número aproximadamente equivalente de veces. También se garantizó que cada condición de la tarea tuviera un número equivalente de imágenes en cada categoría de valencia (es decir, cada una de las cuatro condiciones de atención/memoria incluía la presentación de 10 imágenes desagradables, 5 imágenes agradables y 5 imágenes neutras en orden pseudoaleatorio), y que estas imágenes coincidieran en su contenido en todas las condiciones en la mayor medida posible. Se incluyó un mayor número de imágenes normativamente desagradables porque hay un mayor número de categorías de emociones básicas desagradables (es decir, «triste», «miedo», «enfado» y «asco» frente a sólo «feliz» y «neutro»). También se crearon dos versiones de tareas contrabalanceadas, intercambiando las imágenes utilizadas entre las condiciones «Emoción» e «Imagen» y entre las condiciones «Cuerpo» y «Descanso». Cada participante realizó una de estas versiones equivalentes de la tarea (es decir, la mitad de los participantes recibieron la versión 1 y la mitad la versión 2). Por lo tanto, se espera que cualquier influencia potencial de las diferentes imágenes vistas dentro de cada condición se anule dentro de los análisis de grupo.

La duración de la tarea (20 minutos) permitió realizar 20 ensayos dentro de cada una de las 4 condiciones. En cada ensayo, el tiempo era el siguiente: Instrucción del ensayo = 3 s, Imagen = 2 s, Periodo de mantenimiento = 5 s, Periodo de decisión (mostrando las tres opciones) = 3 s. Después del periodo de decisión, había también un intervalo inter-ensayo de longitud variable (mostrando una cruz), que se alternaba para que durara o bien 0,5 s, 2 s, o 3.5 s.

Después de completar la exploración, los participantes fueron acompañados de vuelta al laboratorio, sentados ante un ordenador portátil, y se les pidió que completaran algunas medidas adicionales.

Medidas secundarias

Medidas de conciencia emocional

Se tomaron dos medidas de EA. En primer lugar, los participantes completaron una versión en línea de la escala de niveles de conciencia emocional (LEAS) (www.eleastest.net) que hace uso de un programa de puntuación automática validado39. La LEAS incluye la presentación de descripciones de 2 a 4 frases de 20 situaciones sociales en las que participan dos personas. Las descripciones de las situaciones están diseñadas para provocar cuatro categorías de emociones (tristeza, felicidad, ira y miedo) en 5 niveles de complejidad. En cada página presentada electrónicamente se presenta una situación, seguida de dos preguntas: «¿Cómo se sentiría usted?» y «¿Cómo se sentiría la otra persona?». Se proporcionan recuadros de respuesta separados para teclear las respuestas a cada pregunta. Se pide a los participantes que escriban sus respuestas utilizando tanto o tan poco espacio como sea necesario para responder. También se les dice que deben utilizar la palabra «sentir» en sus respuestas.

Las puntuaciones del nivel EA se asignan en función de las palabras que los participantes escriben en sus respuestas. La puntuación más baja posible se otorga a las palabras no relacionadas con las sensaciones (nivel 0). Las palabras relacionadas con sensaciones fisiológicas (por ejemplo, «cansado») reciben una puntuación de nivel 1, mientras que las puntuaciones de nivel 2 reflejan, en cambio, acciones relacionadas con los sentimientos (por ejemplo, «golpear») o simples discriminaciones de valencia (por ejemplo, «malo», «bueno») que tienen un contenido inherente relacionado con la evitación o el acercamiento. Las puntuaciones de nivel 3 se otorgan a los términos de concepto de emoción simple (por ejemplo, «feliz», «triste»). Las puntuaciones del nivel 4 se dan cuando se utilizan al menos dos palabras del nivel 3 en el mismo ítem (es decir, que transmiten una mayor diferenciación emocional que cualquiera de las palabras por separado). Las respuestas propias y ajenas se puntúan por separado para cada ítem como se ha descrito anteriormente (es decir, con un valor de 0 a 4). También se da una puntuación «total» para cada uno de los 20 ítems del LEAS; esta puntuación representa la mayor de las puntuaciones relacionadas con uno mismo y con los demás, a menos que se dé una puntuación de 4 para ambos. Cuando esto ocurre, se da una puntuación total de 5 para el ítem, siempre que las respuestas propias y ajenas puedan diferenciarse (para más detalles, véase ref.29). (Nota: Las puntuaciones del LEAS de este conjunto de datos han sido publicadas previamente junto con otros datos de neuroimagen21,40,41. Sin embargo, su relación con los datos de imágenes de esta tarea EWM es nueva para el presente manuscrito).

Como segunda medida de la EA, los participantes también completaron la tarea Frith-Happé-Animations (AT;42). Esta tarea se diseñó originalmente para medir la teoría de la mente de forma más general; sin embargo, también se ha utilizado recientemente en algunos estudios, junto con el sistema de puntuación LEAS, para proporcionar una medida complementaria de la EA que no depende de indicaciones basadas en el lenguaje ni requiere que los participantes imaginen escenarios detallados (por ejemplo, ver refs43,44,45). Tal y como se utilizó en este estudio, la TA consistió en 12 animaciones de formas simples en movimiento (por ejemplo, 2 triángulos) que se presentaron en una pantalla de ordenador (cada una de ellas con una duración de entre 34 y 45 segundos). Estos 12 clips de animación se dividían en 3 categorías que incluían 4 animaciones cada una: 1) una categoría de «pensamientos/sentimientos» (TF), con animaciones que promovían la percepción de creencias, deseos y emociones dentro de los triángulos; 2) una categoría de «interacciones simples» (SI), con animaciones que promovían la percepción de un movimiento simple dirigido a un objetivo (por ejemplo, un triángulo «siguiendo» a otro); y 3) una categoría de «movimiento aleatorio» (RM), que incluía animaciones de los triángulos a la deriva por la pantalla sin ningún patrón significativo. Antes de ver las animaciones (presentadas en orden contrapesado entre los participantes), se informó a los participantes sobre las tres categorías de animaciones y se les mostró un ejemplo de animación de cada tipo. A continuación, se les pidió que se relajaran y vieran cada animación y que «describieran lo que ocurría en la animación» escribiendo una descripción en un cuadro de texto proporcionado en el ordenador directamente después de ver cada clip. La mitad de las animaciones (dos de cada categoría) iban precedidas de una señal verbal que informaba del tipo de animación (es decir, TF, SI o RM), mientras que la otra mitad no iba precedida de esta información.

Para evaluar la EA, cada una de las descripciones escritas de la animación se codificó y puntuó de acuerdo con los criterios de puntuación del LEAS (por ejemplo, como también se hizo en las refs43,44), utilizando el programa de puntuación automática del LEAS previamente validado39. Un asistente de investigación también examinó posteriormente las descripciones escritas y las puntuaciones automáticas, y corrigió cualquier falso positivo o falso negativo en el resultado del programa automático (de acuerdo con el manual de puntuación del LEAS). Sin embargo, como no había «yo» y «otro» en las animaciones, no se proporcionó una puntuación de nivel 5 para cada descripción escrita. Por lo tanto, cada descripción de animación recibió una puntuación de nivel de EA de 0 a 4, y estas puntuaciones se sumaron a las 12 descripciones de animación de cada individuo. Este segundo método de evaluación de la conciencia emocional utilizó estímulos visuales en contraposición a los estímulos basados en el lenguaje que describen escenarios sociales utilizados por el LEAS, y por lo tanto puede ser menos confundido por las diferencias individuales en las capacidades lingüísticas o relacionadas con la imaginación.

Métodos de neuroimagen

Un escáner Siemens Skyra de 3T (Siemens, Erlangen, Alemania), con una bobina de cabeza de 32 canales, se utilizó para realizar la neuroimagen. Se adquirieron imágenes estructurales 3D MPRAGE ponderadas en T1 (TR/TE/ángulo de giro = 2,1 s/2,33 ms/12 grados) que cubrían 176 cortes sagitales (256 × 256) y tenían un grosor de corte de 1 mm (tamaño de vóxel = 1 × 1 × 1). Las exploraciones funcionales ponderadas en T2* se adquirieron en 32 cortes transversales (2,5 mm de grosor). Cada volumen se recogió utilizando una secuencia intercalada (TR/TE/ángulo de inclinación = 2,0 s/25 ms/90 grados). El tamaño del vóxel de la secuencia T2* fue de 2,5 × 2,5 × 3,5 mm. El campo de visión (FOV) era de 240 mm.

Procesamiento de imágenes

Los pasos de preprocesamiento, así como los análisis estadísticos posteriores, se realizaron utilizando SPM12 (Departamento de Neurología Cognitiva de Wellcome, Londres, Reino Unido; http://www.fil.ion.ucl.ac.uk/spm) para todas las exploraciones de RMN. Utilizando algoritmos estándar, las imágenes funcionales sin procesar se realinearon, no se deformaron y se registraron en la imagen MPRAGE de cada sujeto. A continuación, las imágenes se normalizaron en el espacio de coordenadas del Instituto Neurológico de Montreal (MNI), se suavizaron espacialmente a 6 mm (ancho completo a la mitad del máximo) y se reajustaron en vóxeles de 2 × 2 × 2 mm. Se utilizó la función de respuesta hemodinámica canónica estándar en SPM y se minimizaron las confusiones de baja frecuencia con un filtro de paso alto de 128 segundos. La autocorrelación serial se corrigió además con la función AR(1). También se utilizó la herramienta de detección de artefactos (ART; http://www.nitrc.org/projects/artifact_detect/) para eliminar las exploraciones como covariables molestas en el análisis de primer nivel (umbral: 3 SD en la intensidad global media y movimiento de escaneo a escaneo que excedía 1,0 mm).

Análisis estadístico

Para cada participante, se especificó un modelo lineal general para contrastar la activación durante el período de mantenimiento entre las condiciones de «Emoción», «Imagen» y «Descanso». Los contrastes que involucran la condición «Cuerpo» serán reportados en un manuscrito separado (en preparación). Cada prueba se modeló como un intervalo de 5 segundos. También se añadieron regresores de movimiento (generados por ART – véase el procesamiento de imágenes más arriba) a cada uno de estos diseños de primer nivel. Estas imágenes de contraste se introdujeron en los análisis SPM de segundo nivel (pruebas T de una muestra) para evaluar el efecto principal de cada contraste de interés. El primer contraste fue «Emoción > Imagen», que debería destacar todas las regiones activadas por el mantenimiento de las emociones que no se activan también por el mantenimiento de la información visual. El segundo contraste fue «Emoción > Descanso», que debería resaltar todas las regiones activadas por el mantenimiento de las propias emociones (es decir, en relación con un período que no implica el mantenimiento de la WM). El tercer contraste fue «Imagen > Descanso», que debería resaltar todas las regiones activadas por el mantenimiento de las imágenes visuales (es decir, en relación con el no mantenimiento de la WM). Los dos últimos contrastes, y sus inversos, se analizaron para permitir una interpretación más exhaustiva del contraste primario «Emoción > Imagen», que en sí mismo replica los contrastes realizados entre la atención centrada en la emoción y la atención centrada en la visión (por ejemplo, ref.13) y la WM20 en estudios anteriores. Finalmente, se realizaron análisis de conjunción (dentro de un modelo Factorial Flexible en SPM12) para confirmar las regiones de activación comunes a (1) los contrastes «Emoción > Descanso» e «Imagen > Descanso», y (2) los contrastes «Descanso > Emoción» y «Descanso > Imagen». Estos análisis de conjunción se llevaron a cabo utilizando la función de «conjunción nula «46 de SPM12.

Para estos análisis establecimos un umbral de significación del pico de todo el cerebro de p < 0,001 (sin corregir), y un umbral de extensión del clúster de p < 0,05 (tasa de falso descubrimiento corregida). La primera eigenvariable a través de los sujetos también se extrajo del clúster dACC encontrado en el contraste «Emoción > Imagen» (utilizando la herramienta de extracción de series temporales de volumen de interés incorporada en SPM12; véase la sección de resultados) que estaba más cerca de la región observada en estudios previos de EA32,33, y esto se correlacionó con nuestras dos medidas de EA (descritas más adelante). La identificación/etiquetado de grupos se realizó junto con el atlas de Etiquetado Anatómico Automatizado (AAL) dentro de SPM1247.