Autor Thema: Spam-Links im Forum  (Gelesen 38326 mal)

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #40 am: 28. February 2011, 20:28 »
Hallo,


Dagegen. Das setzt tiefgreifendes Grundwissen voraus, welches nicht jeder hier wissen muss.
Das ist zwar ein berechtigter Einwand aber meine Beispielfrage war wohl auch nicht aus der leichtesten Schwierigkeitsklasse.
Es geht mir einfach darum das eine Aufgabe gestellt wird die ein Computer nicht lösen kann und die auch nicht von Menschen gelöst werden kann die kein Deutsch verstehen und nicht wenigstens ein paar Grundlagen von Computern können.

Und wenn mich ein Forum gängelt, dann lass ichs halt bleiben.
Das will ich ja auch gar nicht.

Potentiell dafür. Es muss aber offensichtlich sein, dass es nur beim ersten Beitrag moderiert wird (z.B. nach dem Absenden wird noch ein Hinweis angezeigt).
Grundsätzlich hat diese Variante ein paar verlockende Aspekte aber gerade das Bewerten von Fragen ist IMHO nicht so einfach.

Die Arbeitserleichterung für Admins ist aber recht gering (die Spam-Postings bleiben halt in der Queue liegen, statt irgendwo verstreut im Forum zu landen).
Aber zumindest das Forum bleibt sauber und so wie ich die letzten Spam-Bot-Aktionen zufällig beobachtet hab fängt ein Bot an gleich haufenweise Spam zu posten so das da auch eine quantitative Arbeitserleichterung für die Admins möglich ist.

Ich habe in den letzten paar Tagen mindestens 10 Spam-Posts gesehen und wimre 8 davon hat ein Bot (ich vermute einfach mal das es ein Bot war denn wissen tu ich das nicht) in wenigen Minuten abgesetzt. Aber auch ich beobachte das Forum natürlich nicht permanent (ich hab schließlich noch ein reales Leben), alle meine Beobachtungen waren rein zufällig und genau deswegen würde es mich interessieren wie viel es wirklich war.


Tun sie seit Jahren. Dass du das erst jetzt merkst, ist doch ein gutes Zeichen.
Ich würde schon sagen das es da eine deutlich Zunahme bei der Häufigkeit gibt. Ich bin hier jetzt seit recht genau 1,5 Jahren dabei und so oft wie in den letzten Wochen hab ich hier noch nie Spam beobachtet.

Wenn du wissen willst, wieviele Accounts/Posts wir gelöscht haben, kannst du ja die Lücken in den IDs ermitteln. Die zählen einfach hoch.
Das heißt also ich soll alle Posts per Script o.ä. (händisch wäre dann doch ein bisschen zu aufwendig) durchackern lassen und die Lücken zählen lassen? Hm, interessante Idee aber von den typischen Scipt-Systemen die wohl für sowas geeignet wären hab ich absolut keine Ahnung. Deswegen hätte ich ja gerne von den durchführenden Admins mal eine kurze Abschätzung.


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

kevin

  • Administrator
  • Beiträge: 2 767
    • Profil anzeigen
Gespeichert
« Antwort #41 am: 28. February 2011, 23:19 »
Aber zumindest das Forum bleibt sauber und so wie ich die letzten Spam-Bot-Aktionen zufällig beobachtet hab fängt ein Bot an gleich haufenweise Spam zu posten so das da auch eine quantitative Arbeitserleichterung für die Admins möglich ist.
Nö. Beim Löschen des Benutzers "Alle Themen und Beiträge löschen" anklicken ist bei einem Beitrag genauso viel Aufwand wie bei fünfzig. ;)

Zitat
Aber auch ich beobachte das Forum natürlich nicht permanent (ich hab schließlich noch ein reales Leben), alle meine Beobachtungen waren rein zufällig und genau deswegen würde es mich interessieren wie viel es wirklich war.
Das zählt wohl keiner mit. Tatsächlich Beiträge lösche ich relativ selten, aber Accounts doch eher in Massen.
Thou shalt not follow the NULL pointer, for chaos and madness await thee at its end.

Svenska

  • Beiträge: 1 792
    • Profil anzeigen
Gespeichert
« Antwort #42 am: 01. March 2011, 02:42 »
Es geht mir einfach darum das eine Aufgabe gestellt wird die ein Computer nicht lösen kann und die auch nicht von Menschen gelöst werden kann die kein Deutsch verstehen und nicht wenigstens ein paar Grundlagen von Computern können.
Deutsch muss nicht unbedingt eine Voraussetzung sein müssen (wenn jemand von woanders herkommt und nur wenig deutsch kann, ist das für mich nicht unbedingt ein Ausschlusskriterium). Wenn die Fragen einfache "
  • ja [ ] nein"-Schemen sind, kann man es bruteforcen und wenn du einen Text verlangst, brauchst du einen richtigen Parser.


Ich halte das nicht für machbar. Was allerdings auftaucht, sind Dinge wie "Bitte geben Sie folgende Zahl als Wort ein: 2" oder "Was ist vier plus drei?".

Potentiell dafür. Es muss aber offensichtlich sein, dass es nur beim ersten Beitrag moderiert wird (z.B. nach dem Absenden wird noch ein Hinweis angezeigt).
Grundsätzlich hat diese Variante ein paar verlockende Aspekte aber gerade das Bewerten von Fragen ist IMHO nicht so einfach.
Der Moderator hat eine Frage an der Stelle nicht zu bewerten, sondern nach "eindeutig Spam" oder "kein Spam" zu klassifizieren. Das ist ein kleiner Unterschied. Spam erkennt man üblicherweise recht deutlich...

Gruß,
Svenska

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #43 am: 01. March 2011, 07:41 »
Hallo,


Nö. Beim Löschen des Benutzers "Alle Themen und Beiträge löschen" anklicken ist bei einem Beitrag genauso viel Aufwand wie bei fünfzig. ;)
Okay, das es eine solche Funktion gibt wusste ich nicht.

Das zählt wohl keiner mit. Tatsächlich Beiträge lösche ich relativ selten, aber Accounts doch eher in Massen.
Der Benutzer-ID-Zähler steht derzeit (jetzt wo ich diesen Beitrag schreibe) bei 10676 und es sind "nur" 775 User (von denen die 3 neuesten von Heute wohl auch Spam-Bots sind) also wurden bereits 9901 Accounts gelöscht, das ist meiner Meinung nach eine ziemlich krasse Bilanz. Auch die 6.28 durchschnittlichen Registrierungen pro Tag zeigen deutlich den Arbeitsaufwand der Admins denn wirklich neue Mitglieder sind da nur selten dabei.


Deutsch muss nicht unbedingt eine Voraussetzung sein müssen ....
Naja, wie viele Mitglieder gibt es hier denn die kein Deutsch können?
Anderes Beispiel:
Zitat
5 Kinder toben auf dem Spielplatz:
Anja und Lisa spielen mit einem Ball. Max buddelt im Sandkasten. Anja wirft den Ball zu Lisa. Alex hilft Max. Nur Moriz ist frech der schnappt den Ball noch im Flug der Lisa weg.
Welches Kind hat den Ball gefangen?
Das dürfte man ohne ein paar grundlegende umgangssprachliche Deutschkenntnisse kaum knacken können (kein Verb ist doppelt vorhanden) und die Antwort ist ein einzelnes Wort für das man keinen Parser sondern einfach nur eine caseinsensitive strcmp-Funktion benötigt.
Der Punkt ist das die Captchas offensichtlich zu leicht zu knacken sind und IMHO mindestens bei der Anmeldung einfach was anderes hin muss. Schon allein der Umstand das lowlevel.eu etwas individuelles macht dürfte die Bots nachhaltig draußen halten weil wohl kein Bots-Programmierer speziell für dieses Forum was entwickelt (dafür sind wir viel zu unbedeutend).

Der Moderator hat eine Frage an der Stelle nicht zu bewerten, sondern nach "eindeutig Spam" oder "kein Spam" zu klassifizieren. Das ist ein kleiner Unterschied. Spam erkennt man üblicherweise recht deutlich...
Da hast Du recht aber wenn so ein Werkzeug einmal vorhanden ist ...  ich fühle mich bei diesem Gedanken einfach ein wenig unwohl.


Wenn unsere Admins jetzt sagen "egal das machen wir auch weiterhin gerne per Hand" dann ist diese Diskussion völlig überflüssig und sollte gelöscht werden, wenn unsere Admins aber sagen "ein bisschen technische Unterstützung wäre echt was tolles" dann sollten wir weiter überlegen wie diese technische Unterstützung konkret umzusetzen ist.
Schade das darauf noch keiner eingegangen ist. Ich denke diese Frage sollte zu erst geklärt werden


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

kevin

  • Administrator
  • Beiträge: 2 767
    • Profil anzeigen
Gespeichert
« Antwort #44 am: 01. March 2011, 09:15 »
Der Punkt ist das die Captchas offensichtlich zu leicht zu knacken sind und IMHO mindestens bei der Anmeldung einfach was anderes hin muss.
Das Problem ist, automatisch eine Frage zu generieren, die nicht automatisch beantwortet werden kann, aber gleichzeitig keinen Menschen ausschließt, weil sie zu schwierig ist (das Problem hat man ja schon mit manchen Captchas). Gar nicht so einfach.

Zitat
Schon allein der Umstand das lowlevel.eu etwas individuelles macht dürfte die Bots nachhaltig draußen halten weil wohl kein Bots-Programmierer speziell für dieses Forum was entwickelt (dafür sind wir viel zu unbedeutend).
Weiß nicht. Wir haben im Herbst das Feld für die Mailadresse im Registrierungsformular umbenannt und ein hidden-Feld namens email eingeführt. Der Trick hat auch ungefähr zwei Monate lang funktioniert und wir hatten null Spambots, aber mittlerweile scheinen sie damit zurechtzukommen. Wäre interessant zu wissen, ob sie nur generell "schlauer" geworden sind oder ob da manuelle Beteiligung dabei war.

Zitat
Wenn unsere Admins jetzt sagen "egal das machen wir auch weiterhin gerne per Hand" dann ist diese Diskussion völlig überflüssig und sollte gelöscht werden, wenn unsere Admins aber sagen "ein bisschen technische Unterstützung wäre echt was tolles" dann sollten wir weiter überlegen wie diese technische Unterstützung konkret umzusetzen ist.
Schade das darauf noch keiner eingegangen ist. Ich denke diese Frage sollte zu erst geklärt werden
Wenn die Lösung einfach zu implementieren ist (das kostet die Admins nämlich auch Zeit) und keine Fehlalarme produziert (abgelehnte tatsächlich Interessierte sind der GAU), dann gern. Wenn nicht, dann ist es aber auch nicht so, dass die bisherige Menge an Spam echte Probleme bereitet.
Thou shalt not follow the NULL pointer, for chaos and madness await thee at its end.

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #45 am: 01. March 2011, 21:04 »
Hallo,


Das Problem ist, automatisch eine Frage zu generieren ...
Hm, ich hätte gedacht das man das aus nem großen Pool holt aber das macht natürlich erst recht Arbeit. Ja, das ist wirklich gar nicht so einfach.

Weiß nicht. Wir haben im Herbst das Feld für die Mailadresse im Registrierungsformular umbenannt und ein hidden-Feld namens email eingeführt. Der Trick hat auch ungefähr zwei Monate lang funktioniert und wir hatten null Spambots, aber mittlerweile scheinen sie damit zurechtzukommen. Wäre interessant zu wissen, ob sie nur generell "schlauer" geworden sind oder ob da manuelle Beteiligung dabei war.
Ich denke mal die üblichen HTML-Tricks für versteckte Elemente haben die Bots ganz allgemein gelernt (da muss man wohl schon etwas tiefer in die Trickkiste greifen damit das auch wirkt) und das mit dem Feldnamen ist möglicherweise einfach noch zu simpel als das es nicht von einer generischen Heuristik erkannt werden könnte.

Wie wäre es denn alle Feldname mit einem Zufallsnamen zu betiteln und auch den Text davor nicht als Text sondern als Graphik (mit einem zufälligen Dateinamen) auszuliefern (es wird doch für die Anmeldung sicher ein Session-Cookie oder eine Session-ID benutzt über die das wieder richtig zugeordnet werden kann). Wenn man dann noch eine Möglichkeit findet auch die Reihenfolge der Elemente im HTML-Code zu randomisieren und diese Elemente vielleicht wirklich zufällig anordnet dann dürften sich die Bots daran erst einmal die Zähne ausbeißen.

Eine weitere interessante Frage ist ob Java-Script als Voraussetzung akzeptabel ist, wenn ja kann man den HTML-Code auch erst im Browser ordentlich machen lassen was den Schwierigkeitsgrad für die Bots noch einmal signifikant erhöht. Damit könnte man sich z.B. die Bilder für die Texte sparen und die Texte erst im Browser entschlüsseln lassen.

Ein weiterer Punkt wäre das personalisieren des Profils, das könnte man z.B. ganz verbieten (oder zumindest nicht wirksam werden lassen) wenn noch keine Beiträge geschrieben wurden das würde sicher einige Bots sehr verwirren.

Das Problem an reCaptcha ist offensichtlich das es so verbreitet ist und deswegen die Bots damit gut umgehen können. Wenn ein Forum auch langfristig einigermaßen Spam-Frei bleiben will dann ist IMHO mehr Individualität gefragt.

Wenn die Lösung einfach zu implementieren ist (das kostet die Admins nämlich auch Zeit) und keine Fehlalarme produziert (abgelehnte tatsächlich Interessierte sind der GAU), dann gern. Wenn nicht, dann ist es aber auch nicht so, dass die bisherige Menge an Spam echte Probleme bereitet.
Klar macht das Arbeit aber ganz ohne lässt sich so ein Forum auch nicht betreiben. Das mit dem Spam wird meiner persönlichen Meinung nach in Zukunft aber noch stärker zunehmen so das es irgendwann vielleicht doch Sinn macht mal einen dickeren Batzen Arbeit ins Anmeldeformular zu investieren um damit langfristig wieder Ruhe zu haben.
Echte Nutzer abzuweisen wäre wirklich der totale GAU, das muss ganz klar auf jeden Fall vermieden werden.


Wie wird das eigentlich in anderen Foren so gehandhabt? Oder haben die einfach nur mehr 24/7-Admins und damit kürzere Reaktionszeiten?


Von HTML hab ich ein wenig Ahnung, wenn da Interesse besteht würde ich mir zumindest mal für die Randomisierungstricks versuchen etwas vernünftiges einfallen zu lassen.


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

sfan

  • Beiträge: 94
    • Profil anzeigen
Gespeichert
« Antwort #46 am: 02. March 2011, 13:54 »
Eine weitere interessante Frage ist ob Java-Script als Voraussetzung akzeptabel ist, wenn ja kann man den HTML-Code auch erst im Browser ordentlich machen lassen was den Schwierigkeitsgrad für die Bots noch einmal signifikant erhöht.

Eine Möglichkeit wäre:
<input type='text' name='email' id='email' />
<input type='text' name='unecht' id='unecht' />
<script type='text/javascript'>
document.getElementById('unecht').style = "display:none; visibillity:hidden";
</script>


Sfan

Jidder

  • Administrator
  • Beiträge: 1 625
    • Profil anzeigen
Gespeichert
« Antwort #47 am: 02. March 2011, 17:01 »
Wie wärs, wenn ihr euch mal an Leute wendet, die Captcha-Software rausgeben? Die wissen sicherlich, was wirksam ist und was nicht.
Dieser Text wird unter jedem Beitrag angezeigt.

stultus

  • Beiträge: 486
    • Profil anzeigen
Gespeichert
« Antwort #48 am: 02. March 2011, 18:17 »
Javascript-Gefrickel ist jedenfalls ganz klar (für mich jedenfalls) _keine_ Option. Für nen Forum kann man imho nicht einfach verlangen das man das an hat. Und die Existenz eines unnützen weiteren Formularfeldes zu erklären... naja, irgendwie doof.
Von den bisherigen Vorschlägen wäre imho nur das Frage-Antwort-Spielchen geeignet. Jede Frage mit nem Link auf nen Lösungshinweis versehen und es sollte keiner außen vor bleiben weil er die Antwort nicht kennt. Bilder werden halt (früher oder später) entweder automatisiert geknackt, oder man lässt das lösen halt machen.
MSN: planetconquestdm@hotmail.de
ICQ: 190-084-185

... Wayne?

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #49 am: 03. March 2011, 18:14 »
Hallo,


Javascript-Gefrickel ist jedenfalls ganz klar (für mich jedenfalls) keine Option. Für nen Forum kann man imho nicht einfach verlangen das man das an hat.
Okay, das ist eine nachvollziehbare Meinung. Ich wollte einfach nur mal gefragt haben.
Es ging mir auch nicht darum ein vorhandenes Formularfeld zu verstecken sondern z.B. erst den Text lesbar zu machen oder ähnliche Manipulationen damit man dem nackten HTML-Code möglichst wenig Informationen entnehmen kann. Wenn das aber wirklich viel eingesetzt wird dann werden die Bot-Programmierer früher oder später eine virtuelle Browserumgebung schaffen und darin auch die Scripte ausführen.

Und die Existenz eines unnützen weiteren Formularfeldes zu erklären... naja, irgendwie doof.
Mit verstecken meinte ich eher das dem Formularfeld und dem Text davor die selbe Farbe wie dem Hintergrund zu geben, das Feld wäre ganz normal vorhanden aber der User sieht es einfach nicht. Er könnte auch reinklicken und etwas eintippen aber es wäre auch dann kein Text zu sehen. Wenn die Anmeldeseite 6 Felder hat (davon 2 Dummy-Felder) und alle zufällige IDs usw. dann dürfte das schon eine recht schwierige Herausforderung für den Bot werden.

Von den bisherigen Vorschlägen wäre imho nur das Frage-Antwort-Spielchen geeignet. Jede Frage mit nem Link auf nen Lösungshinweis versehen und es sollte keiner außen vor bleiben weil er die Antwort nicht kennt.
vielleicht könnte man auch die Frage einfach ein paar Sätze länger machen so das sich die Antwort immer aus den Worten der Frage ergibt, z.B. so wie in meinem letzten Beispiel. Das Problem ist nur das man solche Fragen wohl kaum automatisch generieren kann und nen großen Pool anzulegen macht auch extrem viel Arbeit.

Bilder werden halt (früher oder später) entweder automatisiert geknackt, oder man lässt das lösen halt machen.
Eben. Bei umgangssprachlichen Fragen kann man das zwar auch automatisiert an Menschen weiter delegieren aber zumindest nicht in Regionen wo das Lohnniveau niedrig genug ist das es sich auch lohnt.


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

Svenska

  • Beiträge: 1 792
    • Profil anzeigen
Gespeichert
« Antwort #50 am: 03. March 2011, 19:58 »
Man könnte natürlich einfach ein Bildfenster nehmen, wo fünf oder zehn zufällige Bilder von flickr oder so zu sehen sind, und man soll angeben, was der Suchbegriff war, aus einer Liste von 5 oder 10 Begriffen.
Es sollten allerdings passende Suchbegriffe sein (allgemein, anfassbar, leicht erkennbar; z.B. "Schuh", "Glas", "Hund" oder sowas).

Wenn wir hier ein System haben, was nirgends sonst im Internet angewendet wird, dann dürfte das so ziemlich alle Bots draußen halten, glaub ich.

Es müsste nur mal "jemand" machen. ;-)

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #51 am: 04. March 2011, 14:15 »
Hallo,


Man könnte natürlich einfach ein Bildfenster nehmen, wo fünf oder zehn zufällige Bilder von flickr oder so zu sehen sind, und man soll angeben, was der Suchbegriff war, aus einer Liste von 5 oder 10 Begriffen.
Diese Idee find ich auch ganz nett, man muss nur aufpassen das die Begriffe sich nicht zu ähnlich sind so das immer eine eindeutige Antwort möglich ist.

Wenn wir hier ein System haben, was nirgends sonst im Internet angewendet wird, dann dürfte das so ziemlich alle Bots draußen halten, glaub ich.
Genau so ist es. Das ist sicher auch einer der Gründe warum für Linux weniger Viren existieren, es gibt einfach zu viele unterschiedliche Linux-Varianten. Das Problem ist nur das wenn jeder Forumbetreiber etwas individuelles haben will dann muss auch jeder Forumbetreiber dafür individuell Arbeit investieren.

Es müsste nur mal "jemand" machen. ;-)
Ja, das ist wohl wahr. Aber ich schätze dafür ist der Spam noch nicht häufig genug oder vielleicht noch zu gut auf die hier anwesende Zielgruppe eingestellt (Potenzmittel, wie seit heute Früh bis jetzt, könnten in einem reinen Männerforum durchaus als angebracht gelten obwohl bei dem hier durchschnittlichen Alter daran eigentlich noch kein Bedarf existieren sollte).


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #52 am: 04. March 2011, 23:51 »
Hallo,


Man könnte natürlich einfach ein Bildfenster nehmen, wo fünf oder zehn zufällige Bilder von flickr oder so zu sehen sind, und man soll angeben, was der Suchbegriff war, aus einer Liste von 5 oder 10 Begriffen.
Da fällt mir ein das der Bot ja einfach selber mit allen vorgegebenen Suchbegriffen (sind ja im HTML-Code mit drin) selber bei flickr suchen kann und dann einfach die Bilder vergleicht. Dagegen müsste man mindestens 2 Maßnahmen ergreifen: es dürfen nicht die ersten paar Suchtreffer benutzt werden sondern ein paar zufällige von den ersten 1000 oder 10000 Suchtreffern (wenn die Suchworte gut sind sollte das kein Problem sein) und die Bilder dürfen nicht als nackte Dateien 1:1 übernommen werden sondern müssen in eine andere Auflösung skaliert und zusätzlich noch ein klein wenig verformt werden (z.B. um 5 Grad rotiert o.ä.) damit zumindest eine einfache Ähnlichkeitsanalyse nicht so einfach zu bewerkstelligen ist. Es geht darum das der Aufwand für den Bot um ein fettes Vielfaches höher ist als für den Forums-Server wenn der Bot versuchen würde das ganze mit Brute-Force zu knacken.
Aber ansonsten finde ich die Idee wirklich gut, ich schätze mal damit könnte man die Bots ziemlich nachhaltig draußen halten.


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

sfan

  • Beiträge: 94
    • Profil anzeigen
Gespeichert
« Antwort #53 am: 05. March 2011, 15:23 »
Aber ansonsten finde ich die Idee wirklich gut, ich schätze mal damit könnte man die Bots ziemlich nachhaltig draußen halten.

Ich finde die Idee genauso gut!
Dafür bräuchten die Bots ein sehr gutes Bildprogramm um die Bilder zu vergleichen!

Sfan

DerHartmut

  • Beiträge: 236
    • Profil anzeigen
    • Mein Blog
Gespeichert
« Antwort #54 am: 06. March 2011, 14:42 »
Hier wird ja nun eifrig über alle möglichen Abwehrmechanismen geredet, aber was ist mit reCAPTCHAs?

Und falls das keine Option sein sollte: Wieso es denn so kompliziert machen? Die Idee der zu beantwortenden Frage ist gar nicht mal so schlecht. Wird die Frage dann z.B. dreimal falsch beantwortet, dann gibt's nen Timeout. Passiert so etwas öfter von der gleichen IP wird diese gesperrt.

Das Problem ist, einen Mittelweg aus ausreichend schwerer und nicht zu schwerer Frage zu finden.
$_="krJhruaesrltre c a cnp,ohet";$_.=$1,print$2while s/(..)(.)//;
Nutze die Macht, nutze Perl ;-)

kevin

  • Administrator
  • Beiträge: 2 767
    • Profil anzeigen
Gespeichert
« Antwort #55 am: 06. March 2011, 15:33 »
Das Problem mit reCaptcha ist, dass wir es benutzen und es offensichtlich nicht hilft. ;)
Thou shalt not follow the NULL pointer, for chaos and madness await thee at its end.

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #56 am: 07. March 2011, 09:37 »
Hallo,


Dafür bräuchten die Bots ein sehr gutes Bildprogramm um die Bilder zu vergleichen!
Vor allem bräuchten die Bots sehr viel Rechenpower zur Verfügung um das ganze per Brute-Force zu knacken. Wenn man wirklich 5 Begriffe und zufällige Treffer aus den ersten 10000 nimmt müsste der Bot 50000 Bilder analysieren und vergleichen und das dürfte seine Möglichkeiten oft übersteigen (schon allein von der Bandbreite her um all die Bilder von flickr runter zu laden).


Die Idee der zu beantwortenden Frage ist gar nicht mal so schlecht.
Das Problem ist eben diese Fragen automatisch zu generieren. Oder möchtest Du da einen ausreichend großen Vorrat per Hand erstellen?

Das Problem ist, einen Mittelweg aus ausreichend schwerer und nicht zu schwerer Frage zu finden.
Auch das dürfte schon bei händischer Erstellung der Fragen ein Problem sein und bei automatischer Generierung der Fragen erst recht. In der Theorie klingt diese Idee wirklich gut aber sie dürfte nur ziemlich schwer realisierbar sein. Zumindest ich hab da momentan keine Idee wie man das vernünftig automatisieren könnte, wenn andere dazu eine gute Idee haben dann nur raus damit.

Dagegen erscheint mir das mit den flickr-Bildern sehr viel besser für eine automatische Lösung geeignet. Eine ansprechende Sammlung an Substantiven sollte man doch bestimmt als fertige Liste bekommen können und den Code zum Abschicken und Empfangen einer Suchanfrage an flickr dürfte es doch auch schon geben. Klar macht auch diese Lösung einiges an Arbeit aber das sollte einmaliger Aufwand sein und dann hoffentlich auch langfristig helfen.

Ich persönlich denke die Schwäche von reCaptcha ist das es sich zu leicht automatisiert umgehen lässt bzw. das es zu leicht ist diese Aufgabe in großem Umfang an menschliche Lösungspersonen weiter zureichen. Alles was die Lösungspersonen dafür können müssen sind lateinische Buchstaben und das ist keine hohe Hürde wohingegen selbst rudimentäre Deutschkenntnisse, zumindest in den Gegenden dieser Welt wo sich diese Art des Out-Sourcens finanziell lohnt, wohl nicht so häufig sind. In diesem Punkt wären die Fragen zwar klar im Vorteil weil man dazu wirklich richtige kleine Texte lesen und verstehen können muss aber diese Lösung ist eben auch hier mit hohem Aufwand verbunden.


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

sfan

  • Beiträge: 94
    • Profil anzeigen
Gespeichert
« Antwort #57 am: 21. March 2011, 16:36 »
Hallo,

eine weitere Möglichkeit wäre auch alle User die ein nicht existierendes ICQ/MSN-Konto haben rauszuschmeissen.
Viele Bots tragen falsche ICQ-Nummern und MSN-Daten im Profil ein.


Sfan

DerHartmut

  • Beiträge: 236
    • Profil anzeigen
    • Mein Blog
Gespeichert
« Antwort #58 am: 21. March 2011, 16:53 »
Das halte ich für Suboptimal. Es gibt Leute, die haben weder MSN noch ICQ und du kannst (afaik) nicht überprüfen, ob die MSN-ID auch wirklich für MSN genutzt wird (kann auch eine E-Mail-Adresse sein, die für MSN benutzt wird oder nicht) - außerdem kann ich mich ja auch verschreiben (z.B. bei der ICQ-Nummer) und dann bin ich einfach gesperrt.
$_="krJhruaesrltre c a cnp,ohet";$_.=$1,print$2while s/(..)(.)//;
Nutze die Macht, nutze Perl ;-)

erik.vikinger

  • Beiträge: 1 277
    • Profil anzeigen
Gespeichert
« Antwort #59 am: 22. March 2011, 12:23 »
Hallo,


eine weitere Möglichkeit wäre auch alle User die ein nicht existierendes ICQ/MSN-Konto haben rauszuschmeissen.
Was ist MSN und ICQ? (diese Frage ist wirklich ernst gemeint)
Werde ich dann auch rausgeworfen?

Ich würde sagen das es einem Account der nicht auch schon mal etwas gepostet hat (oder mindestens 1 Woche alt + mindestens 3 Anmeldungen + mindestens 2 empfangene PNs) gar nicht gestattet sein sollte diese Felder überhaupt auszufüllen, also keine Signatur, keine Website und auch kein Geschlecht und all die anderen netten Dinge. Wer hier nur einen Account hat um bequem mitlesen zu können (auch diese Mitglieder sind hier sehr willkommen) benötigt hier IMHO erstmal keine Selbstdarstellung (außer er kommuniziert schon fleißig mit anderen Mitgliedern per PN da würde ich das auch als legitim betrachten).
Ich denke wenn die Bots hier keine Möglichkeit haben Spam-Links in ihre Profile zu packen dann ist LowLevel.eu schon mal grundsätzlich weniger interessant (nebst dessen das die Bots dadurch hoffentlich etwas verwirrt werden).
Das einzigste Problem was dadurch entsteht ist das die Admins die Spam-Accounts nicht mehr so einfach erkennen können, schließlich wäre dann ja kein Spam mehr im Account drin so das der Account erst dann wirklich gelöscht werden kann wenn er richtige Spam-Beiträge postet. Als Alternative müsste dann wohl doch mit einem Anmelde-TimeOut und zugehörigen Erinnerungsemails gearbeitet werden. Was den Nebeneffekt hätte das dann auch verweißte Accounts von echten Menschen, die blos kein Interesse mehr an LowLevel haben, mit aussortiert werden (ob das von Vorteil oder Nachteil ist müsste vielleicht auch mal richtig diskutiert werden).


Grüße
Erik
Reality is that which, when you stop believing in it, doesn't go away.

 

Einloggen