Frontiere în psihologie

McGurk și MacDonald (1976) au raportat o iluzie multisenzorială puternică care apare în timpul discursului audiovizual. Ei au înregistrat o voce care articula o consoană și au dublat-o cu o față care articula o altă consoană. Chiar dacă semnalul acustic de vorbire a fost bine recunoscut singur, acesta a fost auzit ca o altă consoană după dublarea cu un discurs vizual incongruent. Iluzia a fost denumită efectul McGurk. A fost reprodusă de mai multe ori și a stârnit o mulțime de cercetări. Motivul pentru marele impact este că este o demonstrație izbitoare a integrării multisenzoriale. Arată că informațiile auditive și vizuale se contopesc într-un percept unificat, integrat. Este un instrument de cercetare foarte util, deoarece puterea efectului McGurk poate fi considerată ca reflectând puterea integrării audiovizuale.

Aici voi face două afirmații principale cu privire la definirea și interpretarea efectului McGurk, deoarece acestea au relevanță pentru utilizarea sa ca măsură a integrării multisenzoriale. În primul rând, efectul McGurk ar trebui definit ca o schimbare categorială în percepția auditivă indusă de un discurs vizual incongruent, având ca rezultat o singură percepție de a auzi altceva decât ceea ce spune vocea. În al doilea rând, atunci când se interpretează efectul McGurk, este esențial să se ia în considerare percepția componentelor unisenzoriale ale stimulilor acustici și vizuali.

Există multe variante ale efectului McGurk (McGurk și MacDonald, 1976; MacDonald și McGurk, 1978)1. Cel mai cunoscut caz este cel în care dublarea unei voci care spune pe o față articulată are ca rezultat audierea . Acesta se numește efect de fuziune, deoarece perceptul diferă de componentele acustice și vizuale. Mulți cercetători au definit efectul McGurk exclusiv ca efect de fuziune, deoarece aici integrarea are ca rezultat percepția unei a treia consoane, fuzionând în mod evident informațiile din audiție și vedere (van Wassenhove et al., 2007; Keil et al., 2012; Setti et al., 2013). Această definiție ignoră faptul că alți stimuli audiovizuali incongruenți produc diferite tipuri de percepții. De exemplu, o combinație inversă a acestor consoane, AV, este auzită ca , adică, componentele vizuală și auditivă una după alta. Există și alte împerecheri, care au ca rezultat audierea în funcție de componenta vizuală, de exemplu, acustica prezentată cu vizualul este auzită ca . Aici, prima mea afirmație este că definiția efectului McGurk ar trebui să fie aceea că un enunț acustic este auzit ca un alt enunț atunci când este prezentat cu o articulare vizuală discrepantă. Această definiție include toate variantele iluziei și a fost utilizată chiar de MacDonald și McGurk (1978), precum și de mai mulți alții (de exemplu, Rosenblum și Saldaña, 1996; Brancazio et al., 2003). Diferitele variante ale efectului McGurk reprezintă rezultatul integrării audiovizuale. Atunci când are loc integrarea, aceasta are ca rezultat un percept unificat, fără acces la componentele individuale care au contribuit la acest percept. Astfel, atunci când are loc efectul McGurk, observatorul are experiența subiectivă de a auzi un anumit enunț, chiar dacă un alt enunț este prezentat acustic.

O provocare cu această interpretare a efectului McGurk este că este imposibil să fim siguri că răspunsurile pe care le dă observatorul corespund percepțiilor reale. Adevăratul efect McGurk apare datorită integrării multisenzoriale, rezultând într-o percepție auditivă alterată. Cu toate acestea, dacă nu are loc integrarea, observatorul poate percepe componentele separat și poate alege să răspundă fie în funcție de ceea ce a auzit, fie în funcție de ceea ce a văzut. Acesta este unul dintre motivele pentru care efectul de fuziune este atât de atractiv: Dacă observatorul raportează o percepție care diferă de ambele componente ale stimulilor, el nu pare să se bazeze doar pe una dintre cele două modalități, ci, în schimb, fuzionează cu adevărat informațiile din ambele. Cu toate acestea, această abordare nu garantează o măsură directă a integrării mai mult decât celelalte variante ale iluziei, așa cum se argumentează mai jos.

A doua afirmație principală aici este că percepția componentelor de stimul acustic și vizual trebuie luată în considerare atunci când se interpretează efectul McGurk. Această problemă a fost elaborată anterior în lucrarea extinsă a lui Massaro și a colegilor (Massaro, 1998) și a altora (Sekiyama și Tohkura, 1991; Green și Norrix, 1997; Jiang și Bernstein, 2011). Este important deoarece acuratețea identificării componentelor unisenzoriale se reflectă în percepția audiovizuală a vorbirii.

În general, se consideră că intensitatea efectului McGurk crește atunci când proporția răspunsurilor în funcție de componenta acustică scade și/sau când proporția răspunsurilor de fuziune crește. Adică, efectul McGurk pentru stimulul AV este considerat mai puternic atunci când sunt date mai puține răspunsuri B și/sau mai multe răspunsuri D. Acesta este adesea un mod adecvat de a măsura puterea efectului McGurk – dacă se ține cont de faptul că se presupune în mod implicit că percepția componentelor acustică și vizuală este exactă (sau cel puțin constantă între condițiile care sunt comparate). Cu toate acestea, poate duce la concluzii eronate dacă această presupunere nu este valabilă.

Efectul de fuziune oferă un prim exemplu al acestei atenționări. Acesta a fost interpretat ca însemnând că informațiile acustice și vizuale sunt integrate pentru a produce un percept nou, intermediar. De exemplu, atunci când AV este auzit ca , se crede că perceptul apare datorită fuziunii caracteristicilor (pentru locul de articulare) furnizate prin intermediul auzului (bilabială) și al vederii (velară), astfel încât este percepută o consoană intermediară diferită (alveolară) (van Wassenhove, 2013). Cu toate acestea, deja McGurk și MacDonald (1976) au scris ei înșiși că „mișcările buzelor pentru sunt frecvent interpretate greșit ca fiind ,” chiar dacă, din păcate, nu au măsurat performanța de citire a vorbirii. Omiterea condiției vizuale unisenzoriale în studiul original este un factor care a contribuit la statutul puternic al efectului de fuziune ca fiind singurul efect McGurk real, care reflectă o integrare adevărată. Totuși, dacă vizualul este confundat cu , nu este deloc surprinzător sau special dacă AV este perceput ca .

Pentru a demonstra mai explicit contribuția componentelor unisenzoriale, voi lua două exemple din cercetarea mea, în care stimulii de tip fuziune au produs percepții diferite în funcție de claritatea componentei vizuale. Într-un studiu, un stimul McGurk AV a fost auzit în principal ca o fuziune (Tiippana et al., 2004). Acest lucru a reflectat faptul că, într-o sarcină de identificare doar vizuală, vizualul a fost confundat cu (42% răspunsuri K și 45% răspunsuri T la vizual ). Într-un alt studiu, un stimul McGurk AV a fost auzit în principal ca fiind , iar acest lucru ar putea fi pus pe seama faptului că, într-o sarcină de identificare doar vizuală, vizualul a putut fi distins în mod clar de , și astfel a fost recunoscut foarte precis (100% corect la adulții tipici; Saalasti et al., 2012; dar rețineți comportamentul deviant al persoanelor cu sindromul Asperger). Astfel, chiar dacă stimulii McGurk au fost de tip fuziune în ambele studii, percepția lor a fost diferită în funcție în mare măsură de claritatea componentelor vizuale. Aceste constatări subliniază importanța cunoașterii calităților perceptuale ale stimulilor unisenzoriali înainte de a trage concluzii despre integrarea multisenzorială.

Cum anume să luăm în considerare proprietățile componentelor unisenzoriale în percepția multisenzorială a vorbirii este dincolo de această lucrare. Abordarea în detaliu a acestei probleme necesită studii experimentale atent concepute (Bertelson et al., 2003; Alsius et al., 2005), modelare computațională (Massaro, 1998; Schwartz, 2010) și investigarea mecanismelor cerebrale care stau la bază (Sams et al., 1991; Skipper et al., 2007). Cu toate acestea, principala linie directoare este că percepția unisenzorială a componentelor stimulului se reflectă în percepția multisenzorială a întregului (Ernst și Bülthoff, 2004).

În timpul experimentelor, atunci când sarcina este de a raporta ceea ce s-a auzit, observatorul raportează perceptul auditiv conștient evocat de stimulul audiovizual. Dacă nu există integrare sau interacțiune multisenzorială, perceptul este identic pentru stimulul audiovizual și pentru componenta auditivă prezentată singură. În cazul în care există integrare audiovizuală, perceptul auditiv conștient se modifică. Măsura în care inputul vizual influențează perceptul depinde de cât de coerentă și fiabilă este informația furnizată de fiecare modalitate. Informațiile coerente sunt integrate și ponderate, de exemplu, în funcție de fiabilitatea fiecărei modalități, ceea ce se reflectă în discriminabilitatea unisenzorială.

Acest proces de percepție este același pentru vorbirea audiovizuală – fie că este vorba de vorbirea audiovizuală naturală, congruentă, sau de stimuli de vorbire McGurk artificiali, incongruenți. Rezultatul este perceptul auditiv conștient. În funcție de ponderea relativă a auzului și a vederii, rezultatul pentru stimulii McGurk poate varia de la auzul în funcție de componenta acustică (atunci când auzul este mai fiabil decât vederea) la percepte de fuziune și combinație (atunci când ambele modalități sunt informative într-o anumită măsură) la auzul în funcție de componenta vizuală (atunci când vederea este mai fiabilă decât auzul). Discursul audiovizual congruent nu este tratat diferit, prezentând o influență vizuală atunci când fiabilitatea auditivă scade. Diferitele variante ale efectului McGurk sunt toate rezultate ale aceluiași proces perceptiv și reflectă integrarea audiovizuală.

Efectul McGurk este un instrument excelent pentru a investiga integrarea multisenzorială în percepția vorbirii. Mesajele principale ale acestui document de opinie sunt, în primul rând, că efectul McGurk ar trebui definit ca o modificare a percepției auditive datorată unui discurs vizual incongruent, astfel încât observatorii să audă un alt sunet de vorbire decât cel pronunțat de voce și, în al doilea rând, că proprietățile perceptuale ale componentelor stimulilor acustici și vizuali ar trebui luate în considerare atunci când se interpretează efectul McGurk ca reflectând integrarea.

Declarație privind conflictul de interese

Autorul declară că cercetarea a fost efectuată în absența oricăror relații comerciale sau financiare care ar putea fi interpretate ca un potențial conflict de interese.

Recunoaștere

Această cercetare a fost finanțată printr-un grant de la Universitatea din Helsinki.

Notele de subsol

1. ^În toată această lucrare sunt menționate doar câteva referințe reprezentative, ca exemple din literatura de specialitate extinsă pe fiecare subiect.

Alsius, A., Navarra, J., Campbell, R., și Soto-Faraco, S. (2005). Integrarea audiovizuală a vorbirii se clatină în condiții de solicitări mari de atenție. Curr. Biol. 15, 839-843. doi: 10.1016/j.cub.2005.03.046

Pubmed Abstract | Pubmed Full Text | Pubmed Full Cross | Refef Full Text

Bertelson, P., Vroomen, J., and De Gelder, B. (2003). Recalibrarea vizuală a identificării discursului auditiv: un afterefect McGurk. Psychol. Sci. 14, 592-597. doi: 10.1046/j.0956-7976.2003.psci_1470.x

Pubmed Abstract | Pubmed Full Text | Pubmed Full Cross | Refef Full Text

Brancazio, L., Miller, J. L., și Paré, M. A. (2003). Influențe vizuale asupra structurii interne a categoriilor fonetice. Percept. Psychophys. 65, 591-601. doi: 10.3758/BF03194585

Pubmed Abstract | Pubmed Full Text |Ref Full Text

Ernst, M. O., și Bülthoff, H. H. (2004). Îmbinarea simțurilor într-un percept robust. Trends Cogn. Sci. 8, 162-169. doi: 10.1016/j.tics.2004.02.002

Pubmed Abstract | Pubmed Full Text | Pubmed Full Cross |Ref Full Text

Green, K. P., and Norrix, L. W. (1997). Indicii acustice pentru locul de articulare și efectul McGurk: rolul exploziilor de eliberare, al aspirației și al tranzițiilor de formanți. J. Speech Lang. Hear. Res. 40, 646-665.

Pubmed Abstract | Pubmed Full Text

Jiang, J., și Bernstein, L. E. (2011). Psihofizica lui McGurk și a altor efecte de integrare a vorbirii audiovizuale. J. Exp. Psychol. Hum. Percept. Perform. 37, 1193-1209. doi: 10.1037/a0023100

Pubmed Abstract | Pubmed Full Text | Refef Full Text

Keil, J., Muller, N., Ihssen, N., și Weisz, N. (2012). Cu privire la variabilitatea efectului McGurk: integrarea audiovizuală depinde de stările cerebrale prestimulare. Cereb. Cortex 22, 221-231. doi: 10.1093/cercor/bhr125

Pubmed Abstract | Pubmed Full Text | Refef Full Text

MacDonald, J., și McGurk, H. (1978). Influențe vizuale asupra proceselor de percepție a vorbirii. Percept. Psychophys. 24, 253-257. doi: 10.3758/BF03206096

Pubmed Abstract | Pubmed Full Text | CrossRef Full Text

Massaro, D. W. (1998). Perceperea fețelor vorbitoare. Cambridge, MA: MIT Press.

McGurk, H., și MacDonald, J. (1976). Auzind buzele și văzând voci. Nature 264, 746-748. doi: 10.1038/264746a0

Pubmed Abstract | Pubmed Full Text | Refef Full Text

Rosenblum, L. D., și Saldaña, H. M. (1996). Un test audiovizual al primitivelor cinematice pentru percepția vizuală a vorbirii. J. Exp. Psychol. Hum. Percept. Perform. 22, 318-331. doi: 10.1037/0096-1523.22.2.318

Pubmed Abstract | Pubmed Full Text | Pubmed Full Cross | Refef Full Text

Saalasti, S., Kätsyri, J., Tiippana, K., Laine-Hernandez, M., von Wendt, L. și Sams, M. (2012). Percepția discursului audiovizual și comportamentul privirii ochilor adulților cu sindromul Asperger. J. Autism Dev. Disord. 42, 1606-1615. doi: 10.1007/s10803-011-1400-0

Pubmed Abstract | Pubmed Full Text | Refef Full Text

Sams, M., Aulanko, R., Hämäläinen, M., Hari, R., Lounasmaa, O. V., Lu, S.-T., et al. (1991). Văzând vorbirea: informațiile vizuale din mișcările buzelor modifică activitatea în cortexul auditiv uman. Neurosci. Lett. 127, 141-145. doi: 10.1016/0304-3940(91)90914-F

Pubmed Abstract | Pubmed Full Text | Pubmed Full Cross | Refef Full Text

Schwartz, J. L. (2010). O reanaliză a datelor McGurk sugerează că fuziunea audiovizuală în percepția vorbirii este dependentă de subiect. J. Acoust. Soc. Am. 127, 1584-1594. doi: 10.1121/1.3293001

Pubmed Abstract | Pubmed Full Text | Pubmed Full Text | Refef Full Text

Sekiyama, K., și Tohkura, Y. (1991). Efectul McGurk la ascultătorii non-englezi: puține efecte vizuale pentru subiecții japonezi care aud silabe japoneze de inteligibilitate auditivă ridicată. J. Acoust. Soc. Am. 90, 1797-1805.

Pubmed Abstract | Pubmed Full Text

Setti, A., Burke, K. E., Kenny, R., și Newell, F. N. (2013). Susceptibilitatea la o iluzie de vorbire multisenzorială la persoanele în vârstă este determinată de procesele perceptuale. Front. Psychol. 4:575. doi: 10.3389/fpsyg.2013.00575

Pubmed Abstract | Pubmed Full Text | Refef Full Text

Skipper, J. I., van Wassenhove, V., Nusbaum, H. C., și Small, S. L. (2007). Auzind buzele și văzând vocile: modul în care zonele corticale care susțin producția de vorbire mediază percepția audiovizuală a vorbirii. Cereb. Cortex 17, 2387-2399. doi: 10.1093/cercor/bhl147

Pubmed Abstract | Pubmed Full Text | Refef Full Text

Tiippana, K., Andersen, T. S., și Sams, M. (2004). Atenția vizuală modulează percepția audiovizuală a vorbirii. Eur. J. Cogn. Psychol. 16, 457-472. doi: 10.1080/0954144034340000268

Pubmed Abstract | Pubmed Full Text | Refef Full Text

van Wassenhove, V. (2013). Vorbirea prin urechi și ochi: interfațarea simțurilor cu creierul supramodal. Front. Psychol. 4:388. doi: 10.3389/fpsyg.2013.00388

Pubmed Abstract | Pubmed Full Text | Refef Full Text

van Wassenhove, V., Grant, K. W., și Poeppel, D. (2007). Fereastra temporală de integrare în percepția auditiv-vizuală a vorbirii. Neuropsychologia 45, 598-607. doi: 10.1016/j.neuropsychologia.2006.01.001

Pubmed Abstract | Pubmed Full Text | Refef Full Text

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.