Innan talet fanns - om språkets evolution

Peter Gärdenfors

Published in in Tystnader, ed. by H. Andersson and E. Österberg, Lund University Press, Lund, pp. 7-15. Abridged version published in Sydsvenska Dagbladet 21/4 1996.

I begynnelsen var tystnaden.

Den varade länge. Man uppskattar att den gren av primaterna som skulle utvecklas till den moderna människan, Homo sapiens, skildes från den gren som skulle bli schimpanser för åtminstone 5 miljoner år sedan. Men det talade språket utvecklades förmodligen först för 200.000 - 300.000 år sedan. Under en mycket lång period av människans historia fanns det alltså inget tal.

Hur språket har uppstått är en av de stora gåtorna i människans evolutionära historia. Darwins egen teori om språkets tillkomst finner man i boken The Descent of Man. Han noterar att även om djur bara har ett begränsat antal ljudsignaler, så kan de använda olika "tonfall" som uttrycker olika sinnesstämningar. Men vilka steg leder härifrån till människornas språk? Darwin spekulerar att först uppkom någon form av primitiv sång som sedan följdes av röstimitationer av olika fenomen innan vi fick ett fullödigt språk.

Frågan om språkets ursprung har lockat många forskare. Trots att Darwins utvecklingslära öppnade nya vägar, förbjöd den prestigefyllda Societé de Linguistique i Paris, i sina statuter från 1866, all diskussion av ämnet. Skälet för detta var att det mesta som sades om språkets evolution blev rena gissningar, eftersom det fanns så litet handfast evidens att bygga under med.

Nu vi vet betydligt mer om människans historia och utvecklingen av hennes hjärna än för ett århundrade sedan. Även om det fortfarande finns stora luckor kan man lägga ett sammanhängande pussel med bitar från arkeologi, antropologi, barns språkutveckling, neurofysiologi och allmänna teorier om kognitiva funktioner.

Men det finns mer än ett sätt att lägga pusslet på. Den amerikanske språkforskaren Noam Chomsky hävdar att vi har en särskild språkmodul i huvudet som är separerad från hjärnans övriga funktioner. I denna modul finns de grundläggande grammatiska reglerna lagrade redan från födelsen. Enligt Chomsky är det nödvändigt att göra ett sådant antagande för att förklara varför barn så oerhört snabbt kan lära sig ett språk.

I den moderna forskningen om hjärnan har man emellertid inte kunnat identifiera någon struktur som svarar mot den enhet för språket som Chomsky antar. I stället verkar det som om språkförmågan är tätt sammanvävd med hjärnans övriga funktioner. Den språkliga kunskapen finns spridd över stora delar av hjärnan.

Om man ser hjärnan ur ett evolutionärt perspektiv, blir det också svårt att förklara varför det skulle finns en särskild modul för språket. Man utgår vanligen från att utvecklingen av ett organ sker i små steg. Då verkar det orimligt att ett separat språkcentrum med en fullständig grammatisk förmåga skulle kunna uppstå på en gång. Chomsky påstår helt följdriktigt att språkförmågan inte kan ges en evolutionär förklaring.

Om teorin om en språkmodul inte håller, hur kan då en evolutionärt rimlig beskrivning av språkets uppkomst se ut? Utgångspunkten för den historia jag skall skissera är att mycket av våra tankeformer hade mejslats ut av evolutionen långt innan vi fick ett språk. Det allra mesta av det unikt mänskliga i hjärnan har uppkommit innan vi kunde tala. Språket är bara grädden på tankens tårta.

Människans utveckling

Människornas förfäder på den utvecklingsgren som skilts från övriga apor kallas för hominider. De tidigaste var australopitheciner som fanns för mellan 4 och 2 miljoner år sedan. Det mest kända fyndet från denna tid är det skelett som kallas "Lucy". Nästa steg i utvecklingen är Homo habilis som fanns mellan 2,3 och 1,7 miljoner år före vår tid. Den första tydligt mänskliga arten, Homo erectus, "den upprätta människan", existerade för mellan 1,7 miljoner och 300.000 år sedan. Den s.k. pekingmänniskan hör till denna art. Namnet är inte helt rättvisande eftersom redan australopithecinerna hade en upprätt gång. Homo sapiens, "den vetande människan", uppstod för ungefär 250.000 sedan. Neandertalmänniskan, som försvann för ungefär 40.000 år sedan, betraktas vanligen som en underart till Homo sapiens.

Hjärnans storlek har vuxit stadigt under hela tiden från australopithecinerna till Homo sapiens. Framför allt är det hjärnbarken som ökar i storlek och allra mest växer pannloben. Men det är först Homo erectus som får en hjärna som är väsentligen större än apornas och tillväxten accelerar vid uppkomsten av Homo sapiens.

Hur tänker man innan det finns ett språk?

Storleken på hjärnan måste kopplas till hominidernas utveckling av tänkandet. Man kan naturligtvis inte veta något direkt om deras tankevärld, utan man får dra slutsatser från vad som är känt om hur våra förfäder levde. Det arkeologiska materialet är mycket begränsat, så det hela blir ganska spekulativt.

En viktig ledtråd till hur hominiderna tänkte ger deras användning av verktyg. Det är först hos Homo erectus som man finner avancerade verktyg i form av tillhuggna stenyxor.

Sådana verktyg tyder på en ganska avancerad tankeförmåga: för att kunna lära sig tillverka stenyxor måste man kunna härma någon annan som gör en yxa. Man måste också komma ihåg en serie handlingar i rätt ordning. Tillverkningen förutsatte målmedveten träning. Stenyxorna gjordes symmetriska vilket innebär att man kunde föreställa sig det färdiga verktyget medan det tillverkades och planera tillhuggandet. Att föreställa sig en färdig yxa kräver inget språk, men det förutsätter ett avancerat visuellt tänkande. Konsten att tänka i bilder är mycket äldre än förmågan att tänka i ord.

En del apor gör verktyg i sin naturliga miljö. Schimpanser skalar exempelvis av löven av grenar för att kunna "fiska" termiter i deras stackar. Men apor tillverkar verktyg bara när de behöver ett och de tar nästan aldrig med sig verktygen från en plats till en annan.

Förmågan att föreställa sig det som inte finns närvarande är en avgörande faktor som skiljer människans tänkande från apornas. En människa kan inse att hon kommer att behöva verktyget i morgon också och därmed bära det med sig det till en ny boplats. En sådan föreställningsförmåga är nödvändig för långsiktig planering. Den visar sig bland annat i hur människobarn och apungar leker. Apor, liksom många andra däggdjur, leker under sin uppväxt. Leken tränar upp olika motoriska färdigheter som att slåss eller att fånga ett byte och ökar därför djurens överlevnadschanser. Men det är bara människans barn som hittar på nya lekar genom att skapa nya rörelsescheman eller genom att införa nya regler för hur leken skall gå till. Barn härmar ofta de vuxnas beteenden i sina lekar. För att kunna härma måste de föreställa sig vad de vuxna gör och försöka göra likadant.

Hur kommunicerar man innan det finns ett språk?

Det finns mycket kommunikation som inte utnyttjar talat språk. Detta visas tydligt av de teckenspråk som uppstått i olika dövsamhällen över hela världen. Dessa språk har fullt utvecklade grammatiska system och omfattande ordförråd. Det går alltså alldeles utmärkt att kommunicera utan att tala.

Men de dövas teckenspråk är en avancerad form av kommunikation. Det finns en mer primitiv form som förstås av alla: när vi kommer till ett land där vi inte behärskar språket, kan vi förklara vad vi vill genom att gestikulera eller mima. Den kanadensiske psykologen Merlin Donald presenterar sin bok Origins of the Modern Mind teorin att Homo erectus hade en väl utvecklad kommunikation som byggde på just mimandet. Man kan visa att någon skall gå och hämta vatten genom att härma hämtandet. En unge kan skvallra på ett äldre syskon genom att visa vad ont syskonet gjort. Man kan planera en jakt genom att mima de olika rörelserna. På detta sätt kan man kommunicera med hjälp av gester.

Ett av de vanligaste argumenten för Chomskys teori om en medfödd grammatik och mot teorin om att språket har utvecklats ur ett mimande stadium är att det inte finns några kulturer där man ser spår av ett teckenspråk. Men detta stämmer inte: teckenspråk förekommer parallellt med talat språk bland annat hos en del amerikanska indianer och hos vissa australiska folk. En annan sorts stöd för teorin att mimande är en del av språkets utveckling kommer från studier av barn: strax innan ett barn når tvåordsstadiet i sin språkutveckling kombinerar det gärna ett ord med en gest för att öka uttryckskraften. Det kan säga "vovve" och samtidigt göra en hoppande rörelse med händerna för att visa att hunden hoppade.

Steget från beskrivande rörelser till dans och andra ritualer är inte långt. Förmodligen uppkom de första sociala ritualerna under den tid Homo erectus fanns. Stammens ledare kunde mima en planerad räd mot en fiendegrupp. Kvinnorna kunde med en dans initiera en ung flicka i vuxenlivet. Riter kan ha använts för att markera början eller slutet på olika former av samarbete inom stammen.

Språk och signaler

Avancerad kommunikation finns också bland djuren. Markattor har exempelvis tre olika rop för att varna för leopard, orm och rovfågel. Bin kan genom sin dans signalera för andra bin med stor precision var nektar finns att hämta.

Vad skiljer då ett språk från de signaler som djur använder när de kommunicerar? En avgörande skillnad är att signaler bara handlar om det som är närvarande i djurets omgivning. Bina dansar bara direkt efter att de kommit åter till kupan när de funnit nektar. Med ett språk kan man däremot uttrycka sig om saker som inte är här och nu eller som inte ens finns. Vi kan exempelvis berätta de mest fantastiska sagor för våra barn. En hund kan signalera att den vill gå ut eller att den är glad, men den kan inte uttrycka att den jagade en kanin i går, eller att den kommer att bli arg om den lämnas ensam i kväll och att den i så fall kommer att tugga i sönder morgontofflorna. Signaler handlar om världen runtomkring, medan språket ofta handlar om vår inre värld, dvs våra föreställningar, minnen, planer och drömmar. Språket bygger på symboliska uttryck som har en referens.

Det vi kallar ett "kroppsspråk" är därför inte ett språk i den här meningen, utan bara signaler. Med hjälp av vår kroppshållning och vår mimik signalerar vi olika känslor och reaktioner, men dessa signaler refererar inte till något.

Skvallerteorin

En originell idé om språkets uppkomst presenterades för ett par år sedan av den engelske antropologen Robin Dunbar. Han hävdar att språket inte främst har använts för kommunikation, utan för att stärka de sociala banden mellan medlemmarna i en grupp. Som socialt kitt kan språkljuden ha ersatt den putsning av pälsen som apor ägnar varandra. Enligt Dunbar har språket ursprungligen varit emotionellt snarare än informativt. En konsekvens av hans resonemang är att skvaller kan ha varit (och fortfarande vara) en viktigare användning av språket än exempelvis upplysningar om var jaktbyten finns att hämta.

Dunbar visar att bland primaterna finns det en klar korrelation mellan hjärnstorleken hos olika arter av apor och hominider och storleken på deras samhällsgrupper. När grupperna blir större räcker tiden inte till för att plocka löss på alla som man vill upprätthålla en vänlig social relation till. Tal är mycket mer effektivt för detta ändamål än putsning: man kan tala till mer än en åt gången och man har samtidigt händerna fria för andra sysslor. Syjuntor uppfyller förmodligen en mycket grundläggande mänsklig funktion.

Det talade språkets uppkomst

Ett språk måste inte vara talat. Men talet har ändå stora fördelar som ger evolutionära effekter. Om man bär ett litet barn i famnen, så är det lättare att tala än att teckna med händerna. Talet kan också användas när det är beckmörkt. Men talet är inte alltid det bästa sättet att kommunicera. Om man använder rösten när man jagar, skrämmer man ofta bytet. I sådana situationer kan ett teckenspråk vara mer användbart.

Djuren kan inte välja när de skall signalera utan det sker instinktivt. Det är faktiskt bara människor som viljemässigt kan kontrollera sin röst. Vårt tal utgår från den så kallade Brocas area som ligger i främre vänstra delen av hjärnbarken. Den ligger precis intill den del av motorcortex som styr ansiktsmusklerna. Apors och andra djurs rop är ofrivilliga. Deras röster kontrolleras av strukturer i hjärnan som ligger under hjärnbarken och som evolutionärt är mycket äldre. Apor i vilt tillstånd använder inte heller några tecken som de avsiktligt utför (de kan inte ens peka). Det finns inget som tyder på att de har någon form av symbolisk kommunikation.

I begynnelsen var tystnaden nog inte total. Homo erectus och de övriga hominiderna har säkert använt sig av ljud som en del av den mimade kommunikationen. Man kan kackla som en höna eller skälla som en hund även om vi inte har ord för djuren. Homo erectus använde antagligen symboliska uttryck, mimade eller talade, för olika föremål och händelser.

Man antar att det symboliska talade språket uppstår i samband med Homo sapiens uppkomst. Den mest påtagliga anatomiska skillnaden mellan Homo erectus och Homo sapiens är att struphuvudet sitter mycket lägre i halsen på Homo sapiens. Detta leder till att munhålan blir större och Homo sapiens kan därför forma betydligt fler sorters ljud, framför allt vokaler. Men struphuvudets sänkning medför också en nackdel, eftersom matstrupen och luftstrupen får en gemensam kanal, vilket ökar risken att kvävas av mat som hamnar i fel strupe. Den evolutionära vinsten med att ha ett talat språk måste vara stor för att kompensera för denna nackdel.

Den mimetiska förmågan förbereder språkförmågan. Genom att hjärnan anpassar sig till att hantera kombinationer av rörelser blir den redo för de syntaktiska sekvenserna. Talat språk förutsätter att man kan styra sin motorik, framför allt munmusklerna och stämbanden. Tal kan alltså tolkas som ljudgester. Utan en sådan muskelkontroll kan man inte ens babbla. Och joller är en oundgänglig del av ett barns språkutveckling. En fascinerande parallell finns hos döva barn som bara växer upp med teckenspråk. De kan inte öva röstmotoriken, men de övar handrörelser - de jollrar med händerna.

Mimade gester liknar i någon mån det som man berättar om. Vill man teckna en boll låter man händerna forma en cirkel i luften. Man säger att sådana tecken är ikoniska. Förmodligen uppstod det talade språket delvis genom härmande ljud, som också är ikoniska, men i normalt språk är de ljud vi använder för att beteckna ett begrepp godtyckliga. Ordet "hund" liknar inte en hund. Genom att ljudtecknen inte behöver vara ikoniska får vi större frihet att skapa nya ljudkombinationer för olika begrepp vi vill uttrycka, men det innebär också att vi måste lära oss vad orden betyder.

Grammatikens uppkomst

Även om Homo sapiens var de första som hade ett talat språk, så tog det lång tid innan ett språk med en avancerad grammatik uppstod. Man kan grovt dela upp de byggbitar som ingår i språket i två grupper - de "grammatiska" och de "semantiska". De semantiska är de som bär det mesta av betydelsen, medan de grammatiska används för att sätta samman de semantiska och för att eliminera tvetydigheter.

Den amerikanske lingvisten Derek Bickerton hävdar i sin bok Language and Species att det har funnits ett stadium då man använt ett protospråk som bara innehåller de semantiska delarna av språket. Som stöd för sin tes visar Bickerton att det fortfarande finns flera olika språktyper som har en mycket förenklad struktur. Barn passerar ett stadium strax före två års ålder då deras språk består av meningar med två ord. Apor som undervisas i teckenspråk lär sig aldrig ett språk med grammatik, utan de stannar på en nivå som mycket påminner om barnens tvåordsstadium. När två kulturer med obesläktade språk möts, uppstår s.k. pidginspråk vilka också har en struktur som liknar tvåordsmeningar. Bickertons teori är att Homo erectus hade ett protospråk och att det är först hos Homo sapiens som vi får ett språk med grammatisk struktur.

Man kan fråga sig på vad sätt ett språk med grammatik är bättre som kommunikationsmedel än ett protospråk. Den stora fördelen är att grammatiska markörer gör budskapet mindre tvetydigt. Om en tvååring säger "slå Sune" så vet vi inte om det är barnet som har slagit Sune (eller vill slå honom) eller om det är Sune som slåss. Grammatiken gör också språket mer oberoende av det närvarande eftersom vi exempelvis lättare kan markera om vi talar om nuet eller det förflutna.

Språket i hjärnan

Hur har hjärnan anpassats för att kunna hantera ett språk med omfattande grammatik och ordförråd? Det är svårt att finna några entydiga områden i hjärnan där språket styr eftersom hjärnans funktioner är oerhört formbara, särskilt under de första levnadsåren. De områden i hjärnan som tydligast förknippas med språkförmågan är Wernickes area i temporalloben, där analysen av språkljuden sker, och Brocas area i nedre bakre delen av pannloben, som styr produktionen av talat språk. Båda dessa områden ligger normalt i vänstra hjärnhalvan, men undantag finns (t.ex. hos en del vänsterhänta personer).

Det finns en stark koppling mellan förmågan att utföra komplicerade rörelsemönster, framför allt handrörelser, och språkförmågan. Kopplingen gäller inte bara talat språk - döva människor förlorar förmågan att använda teckenspråk vid vissa skador på vänster sida av hjärnbarken.

Förmågan att tillverka verktyg, som ju förutsätter serier av handrörelser, föregick det talade språket i människans utveckling. Enligt den teori som presenterats här, skulle det utan denna förmåga inte varit möjligt att utveckla det talade språket, som ju använder serier av munrörelser. Ett stöd för teorin är att Brocas area hos ett litet barn används från början för både manipulation av föremål och språkstyrning. Men i slutet av barnets andra levnadsår differentieras det till två delområden där bara den nedre delen är specialiserad för avancerade språkfunktioner.

Sportkommentatorer och rapartister producerar talat språk i ett smattrande tempo, som långt överskrider möjligheterna att mima. Detta visar att människans munvighet numera helt överglänser de övriga kroppsdelarnas uttryckskraft.

Den moderna människans förmåga att tala har utvecklats till den grad att vi ibland önskar det fanns mer tystnad. Som Hemingway skriver: "Det tar två år för människan att lära sig tala men femtio för att lära sig tiga".