Chatbotters reaktioner på hadefuldt sprog

Offentliggjort

Forskerne fodrede den kunstige intelligens med venstre- og højreorienteret data. Derefter testede de reaktionen på hadefuldt sprog.

* Modellerne, der blev trænet med venstreorienteret data, var mere følsomme over for hadefuldt sprog rettet mod etniske, religiøse og seksuelle minoriteter.

* Modellerne, der blev trænet med højreorienteret data, var mere følsomme over for hadefuldt sprog rettet mod hvide kristne mænd.

* Venstreorienterede sprogmodeller var bedre til at afsløre misinformation fra højreorienterede kilder. Men dårligere til at afsløre misinformation fra venstreorienterede kilder og omvendt.

Kilde: Studiet "From Pretraining Data to Language Models to Downstream Tasks: Tracking the Trails of Political Biases Leading to Unfair NLP Models".

Køb et abonnement og få adgang

Allerede abonnent? Log ind her

Digital-abonnement

  • Dagens avis hver dag som e-avis
  • Adgang til alle artikler på folketidende.dk
  • Adgang til arkivet (1873-nu)
  • Adgang til FolketidendePlay
  • Lås op for Folketidende Fordele
Få adgang nu