April: nyhetskategorier

Siden påske har vi jobbet iherdig med å snekre et design for automatisk klassifisering av nyhetstekster. Her er spørsmålet gjerne hva slags prinsipper som skal ligge til grunn for å gruppere ulike saksområder innen store innholdskategorier som kultur, politikk, økonomi, sport og samfunnsspørsmål. Så er spørsmålet videre hvordan man får en datamaskin til å automatisk klassifisere ulike nyhetstekster i henhold til regler for kategorisering. En ting er å klare å identifisere sportsaker basert på ordfrekvenser, en ganske annen er å skille rene politikksaker fra saker som for eksempel handler om sosialsektoren, arbeidsmarkedet og økonomi. Dette er et work-in-progress, men her er en illustrajon av et første forsøk på å visualisere et slikt klassifiseringsopplegg.

Visualisering av innholdskategorier
Visualisering av innholdskategorier

 

Legg igjen et svar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*