Rechtfertigungsversuch

eine eifrige Kommentatorin hat bereits die seit gestern eingeschalteten Captchas entdeckt – hier nur eine kurze Erklärung, wie es dazu kam:

Seit ich in meinem Blog Kommentare zulasse, bekomme ich den erwarteten Kommentar-Spam, den ich zur Zeit vor der Veröffentlichung von Hand ausfilter (Kommentare unbekannter Kommentaroren müssen erst von mir “approved” werden).

Leider lässt sich dieser Vorgang kaum weiter automatisieren, da, wie ich dabei lernen durfte, die üblichen Spammer erstmal ne Menge Testballons (harmlose, aber im Kontext völlig sinnfreie Texte) abschießen, bevor sie den eigentlichen Spam abladen. Beispiele gefällig?

  • “Inspirierender Beitrag.Ich habe ein paar tolle Denkanstoesse gekriegt. Warte auf neue Posts zum Thema.” – zum Photo+Einzeiler-Artikel über den Hagel auf unseren Dachfenstern
  • “Gefaellt mir, dass hier haeufig gepostet wird.” – nach einem meiner ersten Artikel
  • “Interessanter Artikel! Ich werde da nochmal versuchen mehr zu erfahren!” – nach meinem einzeiligen Kommentar zu Kirks Risikobewusstein

Das Highlight war jedoch bisher der versuchte Kommentar zu meinem Blogpost über das Speed-Dial in Opera:

Windows XP is really a trustworthy and efficient program. Although Microsof company is putting good energy into the growth and development of Windows Vista, Windows Seven and some newer types are emerging on the labs XP keeps to some degree rectified and a lot effective system in the household. Helping the functionality of this system is a task well worth placing attempts. The very best ways to put into action the answer will be to make use of some well-written apps which are intended to preserve Windows xp efficient further.

Ein Spam-Filter würde diese Texte entweder nicht erkennen oder aber ein hohes Risiko von false-positives (die ja eine große Ähnlichkeiten zu den Testballons aufweisen) in Kauf nehmen. Daher will ich stattdessen erstmal versuchen, die Anzahl der vollautomatisierten Kommentare zu reduzieren.

Ich sehe das Einschalten eines Captchas auch eher als Experiment (und habe aus Zeitgründen auch das erstbeste Captcha genommen, dass sich ohne weiteren Aufwand (sprich: ein Klick) in WordPress installieren lässt), um zu sehen, ob die Testballons dadurch abnehmen und/oder durch was anderes ersetzt werden.

BTW: Schade, dass es HotCaptcha (oder ähnliche Ansätze mit Hunden und Katzen) nicht mehr gibt, die hatten definitiv mehr Stil als die Buchstabentipperei.

…wie man es nicht besser macht

Ein kleines Update zu meinem vorgestrigen Artikel über die Lehrevaluation an der Math.-Nat. II (der Rest der Uni benutzt zwar die gleiche Software, ich weiß aber nicht, ob das Verfahren dort mit den gleichen fragwürdigen Details durchgeführt wird):

Prinzipiell war vorgestern nur eine hier nicht näher zu nennende (aber für Insider relativ naheliegende) Veranstaltung offensichtlich von den vergleichsweise trivial durchzuführenden Manipulationen betroffen. Das Verhältnis zwischen teilnehmenden Studenten und beantworteten Fragebögen betrug zu diesem Zeitpunkt bei der Veranstaltung ungefähr den Faktor 1000.

Da dieser Umstand anscheinend auch den Umfragenden (gut gegendert, oder? 😉 ) aufgefallen ist, lösten diese das Problem kurz und schmerzarm (und letztendlich auch wirkungslos), indem sie die betreffende Lehrveranstaltung einfach aus der Umfrage entfernten. Daraufhin sanken die Zahlen der beantworteten Fragen wieder auf realistische Werte und das Problem wurde endgültig gelöst…
…also, naja, zumindest für ein paar Minuten:

der aktuelle Stand beträgt (Veranstaltungen/erfasste Fragebögen/Kommentare/beantwortete Fragen):

Zur leichteren Einordnung hier die Zahlen aller (Diplom/Magister/*-Bachelor/… aller Fachsemester) jeweils im WS2010/2011 (SS2011 habe ich nicht gefunden) eingeschriebenen, nicht beurlaubten Studenten (in der Verwaltung liebevoll “Studienfälle” genannt 🙂 – Quelle):

  • Informatik: 1083
  • Mathematik: 1637
  • Psychologie: 773
  • Geographie: 823

Die naheliegenden Divisionsaufgaben überlasse ich dem geneigten Leser selbst.

Zusätzlich habe ich leider Recht behalten, was die dauerhafte Geheimhaltung eines Passwortes angeht, dass hunderten von Personen in die Hand gegeben wird – zwei Passwörter bekommt man inzwischen via Google quasi geschenkt – zwei weitere habe ich auf anderem (durchaus legalen!) Weg erfahren. Ich erspare mir dennoch, sie hier hinzuschreiben.

Falls es nach den Stand am Mittwoch noch nicht offensichtlich war, dürfte sich spätestens jetzt eine ernsthafte Auswertung der Ergebnisse endgültig erledigt haben…

… wie man es nicht macht

Gegeben sei die aktuelle Lehrevaluation des Institutes für Informatik (wobei die im folgenden beschriebene Problematik leider alle Institute der Math.-Nat. II betrifft). Diese besteht aus einer Menge von Online-Fragebögen für jede einzelne Veranstaltung, in der die Studenten jeweils ankreuzen, -klicken, -whatever können, wie ihnen diese gefallen haben – soweit so gut.

Geradezu dämlich ist hingegen die Idee gewesen, veranstaltungsunabhängig alle Studenten eines Institutes mit ein und demselben Passwort auszustatten, da dies gleich drei offensichtliche Nachteile mit sich bringt:

  1. Studenten können wahlfrei über alle Veranstaltungen abstimmen, also insbesondere auch die, die sie nie besucht haben (bzw. deren Existenz ihnen nicht mal bewusst war),
  2. Studenten können für jede Veranstaltung beliebig oft abstimmen,
  3. da ein- und dasselbe Passwort hunderten von Studenten gegeben wurde (selbstverständlich auch noch unverschlüsselt) und für einen langen Zeitraum genutzt wird, ist anzunehmen, dass man den Kreis der abstimmenden Personen nach kurzer Zeit auf “beliebige Leute” erweitern kann.

Passendes Zitat eines Professors auf einer Lehrveranstaltungswebseite (die ich momentan aus gutem Grund nicht verlinke):

Und, ja: Mir ist bekannt, dass man Evaluationen mehrfach (beliebig viele) abgeben kann und dass beliebige Leute Evaluationen abgeben können.
Und, nein: Ich habe nichts zur Entschuldigung dafür vorzutragen 🙁

Dass die beschriebene Problematik nicht nur theoretischer Natur ist, kann man inzwischen auch auf dem Evaluationsserver gut nachvollziehen (man beachte die oben stehenden Zahlen – insbesondere die Anzahl der beantworteten Fragen):
evaluation.hu-berlin.de/evaluation/…

Wir haben also bereits den Zustand erreicht, dass die Umfrageergebnisse insgesamt vollkommen unbrauchbar sind (zumindest würde ich nicht ernsthaft ausschließen wollen, dass es mehrere automatisierte Antwort-Skripte gab und nur (mindestens) eines die Daten so offensichtlich verändert hat) – und ich habe leider einen banalen Grund mehr (neben den fehlenden Bindestrichen in den Namen Adlershofer Uni-Gebäude), mich für meine Uni zu schämen…

Nachtrag:
Ja, ich konnte der Versuchung widerstehen, selbst auch noch ein Skript zu schreiben, das meine eigene Lehrveranstaltung pusht.

Zu Tode gegendert

Gerade bekam ich eine weitergeleitete Einladungsmail zu einem Mini-Fußballturnier des Hochschulsports. Eine Veranstaltung, die zumindest von der Idee her hinreichend interessant klingt, dass es mir leid tut, dass ich an dem Tag nicht kann.

Die Mail selbst wurde vom RefRat der HU verschickt und ob der darin verwendeten Zitatkennzeichnung (siehe Guttenberg ;-)) ist nicht ganz klar, ob der Einladungstext direkt so vom Hochschulsport kam, oder vom RefRat verschlimmbessert wurde.

Wie auch immer, Wer-auch-immer-da-für’s-Gendern-zuständig-ist hat sich wirklich Mühe gegeben, den Text nicht nur geschlechtsneutral, sondern dabei auch möglichst unverständlich und konfliktfreudig zu gestalten. Ich kann mir zumindest keine andere Ursache dafür vorstellen, wie man sonst Konstrukte wie

Gespielt wird […] mit 6 Feldspieler_innen, einem_einer Torwart_Torwärtin und 3 Ersatzspieler_innen.

oder

[…] jede_r Teilnehmer_in [darf] sein_ihr eigenes Ländershirt behalten.

ohne Magenkrämpfe in eine semi-offizielle Email packen kann.

(Einem Informatiker wird natürlich zusätzlich schlecht, da das “_” hier nicht nur, wie in entsprechenden Kreisen üblich, rechtschreibregelwidrig, sondern darüberhinaus auch noch kontextsensitiv (dat war’s dann mit linearer Erkennungszeit :-)) mit jeweils völlig unterschiedlicher Semantik verwendet wird, aber die Anzahl der Compilerbauer im RefRat dürfte eh hinreichend gering sein…)

…nur echt ohne Deppenapostroph