tisdag 4 mars 2014

Att inte sätta sig in i informationstekniken är ett tjänstefel

Har du någongång försökt få ett paper accepterat på em konferens, då vet du också hur mycket tid det går åt samt väntan på att få sitt paper eller konferensbidrag accepterat av nämnden som beslutar om kvalitet och relevans för konferensen.

Men nu väcks frågor över hur en del av dessa papers produceras och två förlag som publicerar papers har nu varit tvungna att rensa bland alla de papers som finns i deras databaser. Orsaken är enkel, idag är det lätt att skapa ett datorgenererat paper baserat på information som finns inom ämnet.

I en artikel på Nature kan vi läsa om hur datavetaren Cyril Labbé vid Joseph Fourier universitet i Grenoble i Frankrike har katalogiserat datorgenererade papers som publicerats i över 30 konferenser mellan 2008och 2013. Sexton av dessa dök upp i förlaget Springers arkiv.

Hur går då det hela till? Det finns en tjänst som heter SciGen som togs fram av två MIT-studenter i Cambridge redan år 2005. Tjänsten skapade man just för att kunna bevisa att det går att automatgenerera papers som kommer att accepteras av konferenser (läs mer om detta här ) Om du själv går in på tjänsten så kan du mycket enkelt skapa ett paper som dessutom innehåller modeller och kanske grafer samt en referenslista (det bör understrykas att de dokument som skapas är utifrån informationsteknik som ämnesområde).
 Skärmdump av ett eget datorgenererat paper

Tekniken för att skapa dessa bygger på att papers skapas utifrån en karaktäristisk vokabulär som genereras av SciGen. Med samma vokabulär har Cyril Labbé skapat en annan tjänst som upptäcker om dokumentet har skapats med SciGen. Denna når ni via Labbés webbplats. Labbé såg att många av dessa papers som datorgenererats har accepterats på Kinesiska konferenser.

Utifrån detta resonemang och teknikutveckling så kan vi utgå från att vi framöver kommer att få flera tjänster som skapar falska nonsensdokument men som ändå ser korrekta ut. Detta blir en stor utmaning för högre utbildning men även skolan i allmänhet. Våra plagieringsverktyg kommer inte att räcka till för att detektera dessa falska dokument då de inte bygger på andras utan skapas av datorer och blir alltså helt unika. Mer intressant är att vi framöver också kommer att kunna nyttja all data som vi nu laddar upp i molnet och med denna data så kommer vi att kunna med enkla sätt skapa nya sammanhang och ny information som baseras på big data. 

En sak som blir väldigt tydlig är att de som har informationskompetens också kommer att kunna hantera den digitala världen (och med det också världen i stort) överlägset mycket bättre än de som aldrig tar sin i dessa domäner. Att inte kunna hantera digitala verktyg och förstå dess mekanismer kommer att leda till att man inte längre kan hantera många av jobben i framtiden. Att lärare väljer bort att sätta sig i detta är ett tjänstefel. CVn, resuméer,  intyg mm kan idag lätt skapas på annat sätt än tidigare och idag är det nödvändigt att Googla upp som söker en tjänst. Utmaningarna radar upp sig...och det är ju skojigt :-)