I en ny studie vid Stockholms universitet fick universitetslärare i ett blindtest bedöma svar på hemtentor skrivna antingen av en chatbot eller en student. Det visade sig att svar från ChatGPT i hög grad godkändes och att lärare var mer kritiska i bedömningen av studenters egenproducerade texter.
Foto: Martin of Sweden
Studiens syfte var att undersöka vilken inverkan ChatGPT och liknande AI chatbotar har på universitetslärares bedömningspraxis och även hur de potentiellt skulle kunna påverka högre utbildning. I testet medverkade lärare från fyra olika institutioner inom humaniora och samhällsvetenskap, som sedan även intervjuades för att ges möjlighet att reflektera över sina bedömningar.
Kort om resultatet
Lärares bedömning av AI chatbot-svar
Chat GPT-svar hade en godkännandegrad mellan 37,5 % (pedagogik) och 85,7 % (filosofi).
Deltagarna lovordade den språkliga kvaliteten hos Chat GPT-svar och texterna uppfattades som kreativa och innovativa.
Svagheten i ChatGPT-texter var argumentationen, användandet av referenser samt kopplingen till kursinnehåll och kurslitteratur.
Lärares bedömning av studentgenerade svar
Ett mönster av betygssänkning identifierades, något som antyder en mer kritisk bedömning av studenters egna texter.
Deltagarna var mer kritiska mot struktur och flyt i studenters egna texter.
Flera av deltagarna misstänkte att några av studenternas egna texter var skrivna av en chatbot.
–Bara själva vetskapen om att texten kunde vara skriven av en chatbot gjorde att lärarna bedömde annorlunda än de vanligtvis gjorde. Den skapade också en misstänksamhet, något som kan innebära att lärare tvivlar på sitt inneboende förtroende för att studenten själv skriver sina hemtentor, säger Alexandra Farazouli, studiens huvudförfattare.
Den högskolepedagogiska forskningen vid Institutionen för pedagogik och didaktik inkluderar både teoretiska och empiriska studier av studenters och lärares lärande och lärares undervisning samt studier av organisatoriska villkor för och processer inom högre utbildning.