Datenverarbeitung und Statistik

Sie fragen sich wie die Statistiken zu Treffer- und Fehlerquote der einzelnen Blacklisten zustande kommen? Auf welchen Daten basieren diese? Wie werden die Mails klassifiziert? Nachfolgend finden Sie eine Einführung zur Datenverarbeitung und Statistik.

Blacklist Statistiken

Jede Blacklist Statistik zeigt die ausgewerteten Daten der zurückliegenden acht Wochen. Der "SPAM HITS"-Balken zeigt die Trefferquote, also den prozentualen Anteil von Spam-Emails die korrekt als Spam klassifiziert wurden. Der "HAM HITS"-Balken zeigt die Fehlerquote, also den prozentualen Anteil von erwünschten Emails (Ham) die von der Blacklist fälschlicherweise als Spam klassifiziert wurden.

Nehmen wir an die Blacklist "Alpha" klassifiziert 70% der Spam-Emails korrekt als Spam (SPAM HITS) und 0.1% der erwünschten Emails fälschlicherweise als Spam (HAM HITS). Gehen wir weiter davon aus, dass eine zweite Blacklist „Beta" 90% Trefferquote (SPAM HITS) und 10% Fehlerquote (HAM HITS)  aufweist. Dann kann man daraus schließen, dass die Blacklist „Beta“ mehr Spam wie Blacklist „Alpha“ erkennt, allerdings eine hundertmal höhere Fehlerquote aufweist.


Email Klassifizierung

Die Intra2net Statistik-Datenbank basiert auf einem Verbund von Mail-Servern in Mitteleuropa. Sie repräsentiert den realen Mailverkehr von ausgewählten Intra2net Geschäftskunden. Wir verwenden weder Spamfallen, ungenutzte Email-Adressen noch vergleichbare Methoden zur Datensammlung. Sämtliche Emails werden automatisch klassifiziert – entscheidend hierfür ist ausschließlich die Ablage der Emails durch den Benutzer.

Undefiniert

Alle Emails im Ordner "Posteingang"
oder im Unterordner "Spamverdacht"

Spam

Alle Emails im Unterordner "Spam"

Ham

Alle Emails in anderen Unterordnern

Die Benutzer sind geschult worden nicht erkannte Spam-Emails aus dem Ordner "Posteingang" in den Unterordner "Spam" zu verschieben und den Unterordner "Spamverdacht" regelmässig aufzuräumen. Durch das Verschieben von Emails in andere Unterordner werden diese als erwünschte Emails klassifiziert (Ham). Der Eingriff in das alltägliche Benutzerverhalten wird dadurch auf ein Minimum reduziert. Gelöschte oder abgeholte Emails (POP3) und Backscatter werden ignoriert. Der automatische Spamfilter ist auf „Mittel“ konfiguriert, damit die Fehlerquoten der einzelnen Blacklisten so gut wie vollständig erfasst werden.


Datenverarbeitung

Alle eingehenden Emails werden auf einen internen Reporting-Server dupliziert. Sämtliche SMTP-Protokoll Informationen bleiben dabei erhalten, um die netzwerkbasierten Test korrekt durchführen zu können. Alle Testreihen auf den Reporting-Servern werden unabhängig vom Spamfilter des primären Mail-Servers durchgeführt. Für die Zuordnung werden lediglich die IDs sowie die Klassifizierung (siehe oben) der Emails ausgetauscht. Die Ergebnisse der einzelnen Reporting-Server werden dann zentral zusammengeführt.

Die Intra2net Statistik-Datenbank hat einen durchschnittlichen Anteil von 90% Spam-Emails und 10% Ham-Emails, vergleichbar mit anderen Statistiken zum weltweiten Mailaufkommen. Lediglich der Anteil an Mailinglisten Emails kann leicht abweichen. Hier zeigt sich auch, dass einige netzwerkbasierte Tests Schwierigkeiten haben, erwünschte Massen-Emails von unerwünschten Massen-Emails zu unterscheiden. Wir zählen weder IP-Adressen, noch einzelene Emails, noch zählen wir, wie viele Mails die gleiche IP-Adresse versandt hat.
UND: Wir haben keinen Einfluss auf die Klassifizierung der Emails durch den einzelnen Benutzer! Sofern dieser eine erwünschte Email versehentlich als Spam klassifiziert (Ablage im Unterordner „Spam“), kann die Statistik hierdurch minimal verfälscht werden. Auch haben wir aus Datenschutz-Gründen keinen Zugriff auf die Inhalte der externen Emails für weitere Analysen!

Das Test-Framework basiert auf einer Forschungsarbeit in Kooperation
mit der Hochschule Furtwangen, Fakultät Informatik.


Bei Fragen, Kommentaren oder Anregungen zu unserem Blacklist Performance Monitor
einfach Kontakt aufnehmen.


Zur Blacklist Monitor Hauptseite