[rohrpost] SPIEGEL-Titelbilder-Vorhersage-Algorithmus

SPIEGELstudien.de sekretariat at spiegelstudien.de
Mon Sep 1 18:13:21 CEST 2003


--------------------------------------------------------------------------------
Studien & Materialien
http://spiegelstudien.de
--------------------------------------------------------------------------------

SPIEGELstudien ist ein im Jahre 2003 gegruendetes interdisziplinaeres
Forschungsprojekt, das kulturhistorische Untersuchungen zur Ikonographie der
Sensations-Berichterstattung durchfuehrt, nach medienwissenschaftlichen Methoden
zur Erklaerung von Jounalismus-Verdrossenheit sucht und informations-
technologische Verfahren zur Verarbeitung, Klassifizierung und Vorhersage von
Titel-Schlagzeilen und -Bildern des Hamburger Nachrichtenmagazins DER SPIEGEL
entwickelt.

SPIEGELstudien findet zur Zeit als Untergraduiertenkolleg an der Neuen
Universitaet Berlin statt. Bewerbungen richten Sie bitte an die Fakultaet fuer
Kulturwissenschaften, z.Hd. Frau Tania Huegel, tania.huegel at nu-berlin.de.
Materialien, Aufgaben und Fragestellungen des laufenden Semesters erhalten Sie
hier: http://spiegelstudien.de/downloads/SPIEGELstudien.ws2003-01.tar.gz

Ein Forschungsprojekt der Neuen Universitaet Berlin
in Zusammenarbeit mit Partner gegen Berlin



--------------------------------------------------------------------------------
Aufgaben & Fragen
http://spiegelstudien.de/downloads/SPIEGELstudien.ws2003-01.tar.gz
--------------------------------------------------------------------------------

Entwickeln und implementieren Sie einen Algorithmus, der subjektiv bessere
Titelbild-Vorhersagen liefert als der derzeitige.

Die entsprechenden Resultate sollten sich ueber ein online zugaengliches
Benutzerinterface verifizieren lassen. Der von Ihnen entwickelte Sourcecode
sollte in Perl oder PHP verfasst und unter der GNU General Public License
veroeffentlicht sein.

Beantworten Sie dabei die folgenden Fragen:

1)  Ist die zur Zeit implementierte Betrachtung eines X Wochen breiten
     Zeitfensters ein aussichtreicher Ansatz? Ist 5 ein guter Wert fuer X?
     Waere eine Analyse der Art "Seit X Wochen kein Hitler-Titelbild mehr"
     vielversprechender, und waere X dabei allein von der mittleren Frequenz
     frueherer Hitler-Titelbilder (zzt. ca. 25 Wochen) abhaengig?

2)  Wuerde die Vorhersage durch eine feinere Gewichtung der Daten an Qualitaet
     gewinnen? Sollten Schlagzeilen gegenueber Unterzeilen bevorzugt werden,
     spaetere Jahre gegenueber frueheren oder die Mitte des Zeitfensters
     gegenueber seinen Raendern? Sollte neben der Klassenzugehoerigkeit eines
     Titels auch seine Familienzugehoerigkeit beruecksichtigt werden?

3)  Gaebe es ein statistisches Verfahren, um zu vermeiden, dass im Herbst
     Wahlkampf-Titelbilder vorhergesagt werden, die Helmut Kohl zeigen? Wuerde
     dieses Verfahren weiterhin gewaehrleisten, dass zur Jahreswende
     Jesus-Titelbilder vorhergesagt werden? Und zu welchem Pol wuerden dann
     Terror-Titelbilder im September und Kriegs-Titelbilder im Maerz gehoeren?

Bitte entwickeln Sie einen Algorithmus, keine Interpretation. Anders gesagt:
Vermeiden Sie das Hardcoden vermeintlicher Gesetzmaessigkeiten ("wenn Monat
gleich Mai dann Wahrscheinlichkeit eines Magritte-inspirierten Titelbildes
gleich fuenfzig Prozent") oder Sonderfaelle ("wenn Wort gleich Affaere dann
Signifikanz gleich null"). Beschraenken Sie sich nach Moeglichkeit auf das
Filtern haeufiger Woerter wie "der", "die", "das" oder "Rudolf Augstein".

Bei Rueckfragen wenden Sie sich bitte an sekretariat at spiegelstudien.de