Hvordan sortere 220 000 artikler

Sorterer man ikke leksikon alfabetisk lengre? (hørt på Twitter)

Search, don’t sort! (Google Mails mantra)

En av de største forskjellene mellom et papirleksikon og et nettleksikon går på hvordan en leser finner fram i all kunnskapen. Mens man før gikk i bokhylla, dro ut et tungt bind, bladde seg fram og tilbake for å finne et oppslagsord utifra alfabetet, bruker nå de fleste søkefunksjoner for å finne det de vil lese om.

Hovedredaktør Godal vurderer kategorisering av samfunnsfagene. Foto: Georg Kjøll, CC-BY-SA

Men selv om det for den jevne søker dermed vil være likegyldig til hvori en database en leksikonartikkel ligger, er det ikke dermed sagt at alle oppslagsordene kan plasseres i en diger haug. På snl.no har vi i overkant av 200 000 artikler som alle skal oppdateres, administreres og sjekkes for feil med ujevne mellomrom. Hvordan vet man hvilke artikler som bør sjekkes når, og hvem skal gjøre all denne oppdateringen?

Store norske leksikon sitt store svar på dette spørsmålet er å fordele artiklene mellom fagansvarlige. Når en ny fagperson kommer på plass skal hun få overta en artikkelbase som hun har spesielle faglige forutsetninger for å forvalte, og den skal være av en slik størrelse at det er mulig å ha oversikt over hva som ligger der.

Alle våre artikler er dermed  kategorisert i fagområder, med ett fagområde per artikkel. Artikkelen om Accra ligger i ‘Ghanas geografi‘. Artikkelen om kosher ligger i kategorien ‘jødedom‘. Omtalen av Massive Attack ligger i ‘elektronisk musikk‘.

Den underliggende strukturen av fagområder er en sentral forutsetning for at ideen om et redigert leksikon, forvaltet av redaktører og fagansvarlige kan fungere. Og siden vi allikevel har behov for kategorisystemet, har vi åpnet opp for muligheten til brukere å navigere i kategoriene, ved å gjøre kategoriene til en synlig del av artiklene og nettsidene.

Utklipp av strukturforslag til bildende kunst

Dermed har også fagstrukturen en pedagogisk funksjon, og lar folk lete seg fram i kunnskapen, ikke bare ved søk, men også ved å klikke seg fram i kategorier de synes ser interessante ut.

Men behovet for og verdien i god kategorisering gjør også leksikonjobbingen ganske kompleks. Når Kunnskapsforlaget overførte leksikonet fra papir til nett, var både tid og ressurser begrenset, og ikke alle emner ble delt inn på en god måte.

Noen inndelinger har vært greie for Kunnskapsforlaget å gjøre, og veldig mange artikler er dermed delt inn (relativt) logisk etter geografiske regioner, som Ecuadors geografi, Australias litteratur, Frankrikes historie. Andre fagområder lider derimot under at det ikke har blitt gjort noen forsøk på å fordele artikler utover å putte dem i veldig generelle kategorier: for eksempel spillefilm og fjernsyn, malerkunst, arkitektur, bedrifter.

Fagområdet arkitektur inneholder i dag over 1800 artikler, malerkunst har  nesten 2600. Over 1300 artikler om bedrifter av ulikt slag har hittil vært samlet i én haug.

Utsnitt av tankekart for kategorisering av typografi og grafisk design, av fagansvarlig Christian Leborg

Det er umulig for én fagansvarlig, som deltidsjobb, å holde styr på alt som foregår og har foregått i feltet ‘malerkunst’, like lite som det er mulig å vite om alle forandringer i selskapers ledelse og struktur, når selskapene er så forskjellige som Pfizer, Norgesmøllene og Carlings.

Å rydde opp i dette sammen med de fagansvarlige, og lage logiske og pedagogiske inndelinger, har vist seg å være blant de mest utfordrende og tidkrevende sidene ved innholdsjobben i leksikonet. Det er ikke tungt bare fordi alle artiklene pr i dag må flyttes én etter én (puh!), men også fordi valg av kategorier, deres navn og hva som skal plasseres hvor, forutsetter at verdivalg tas, og kompromisser gjøres.

Hvor skal spørsmål om kjønn og seksualitet behandles? Kanskje i samfunnsfagene, men isåfall hvor? Handler kjønn mest om politikk, sosiale spørsmål, eller rettigheter? Hvor skal en religion som baha’i plasseres? Å la den ligge under ‘islam’, slik den har gjort hittil, står i fare for å nedvurdere dens plass som selvstendig tro og verdensreligion.

Eller ta et mindre kontroversielt eksempel: Bjørn Floberg. Skal han plasseres i film eller teater? Burde man finne multikunstneren Kim Hiorthøy i elektronisk musikk, kunst eller litteratur?

Redaktør Ryste, Redaktør Hovde og Hovedredaktør Godal i dyp kontemplasjon om struktureringen av samfunnsfagene. Foto: Georg Kjøll, CC-BY-SA

Det hadde vært kjekt å kunne hoppe bukk over alle disse problemstillingene, og bare putte ting i den rekkefølgen det (tilnærmet) nøytrale systemet alfabetisering dikterer. Men samtidig har det å kunne dele slike problemstillinger, få innspill fra brukere, og åpne opp prosessen med kategorisering en stor merverdi.

Hvilke fagfelt et begrep tilhører, innenfor hvilket fagområde en artikkel er plassert, er en del av kunnskapens kontekst. Ved å gi innsyn i denne konteksten, og dermed hvilke valg som til enhver tid gjøres i både kategorisering og skriving, åpner vi opp for at disse valgene kan diskuteres, og nye perspektiver slippes til.