samtech samtech

recent

dernières infos

recent
جاري التحميل ...

Deux grands genres de spam email !

spam, spam email, courrier indésirable


Il existe deux principaux types de spam, et ils ont des effets différents sur les utilisateurs d'Internet


Le spam Usenet annulable est un message unique envoyé à 20 groupes de discussion Usenet ou plus. (Grâce à une longue expérience, les utilisateurs de Usenet ont constaté que tout message posté à un si grand nombre de groupes de discussion n'est souvent pas pertinent pour la plupart ou la totalité d'entre eux). Le spam Usenet vise les "lurkers", c'est-à-dire les personnes qui lisent les groupes de discussion mais ne postent que rarement ou jamais et donnent leur adresse. Le spam Usenet prive les utilisateurs de l'utilité des groupes de discussion en les submergeant d'un barrage de publicité ou d'autres messages non pertinents. En outre, le spam Usenet compromet la capacité des administrateurs et des propriétaires de systèmes à gérer les sujets qu'ils acceptent sur leurs systèmes.


Je pense qu'il est possible d'arrêter le spam et que les filtres basés sur le contenu sont le moyen d'y parvenir. 


Le talon d'Achille des spammeurs est leur message. Ils peuvent contourner toutes les autres barrières que vous mettez en place. Ils l'ont fait jusqu'à présent, du moins. Mais ils doivent délivrer leur message, quel qu'il soit. Si nous pouvons écrire un logiciel qui reconnaît leurs messages, il n'y a aucun moyen pour eux de contourner cela. Le spam par e-mail cible les utilisateurs individuels avec des messages directs. Les listes de spam sont souvent créées en analysant les messages Usenet, en volant des listes de diffusion Internet ou en recherchant des adresses sur le Web. 


Les spams par courrier électronique coûtent généralement de l'argent aux utilisateurs pour les recevoir. Beaucoup de gens - tous ceux qui ont un service téléphonique mesuré - lisent ou reçoivent leur courrier pendant que le compteur tourne, pour ainsi dire. Les spams leur coûtent de l'argent supplémentaire. En outre, la transmission du spam coûte de l'argent aux FAI et aux services en ligne, et ces coûts sont directement répercutés sur les abonnés.


L'approche statistique n'est généralement pas la première que les gens essaient lorsqu'ils écrivent des filtres anti-spam. Le premier réflexe de la plupart des pirates est d'essayer d'écrire un logiciel qui reconnaît les propriétés individuelles du spam. En regardant les spams, on se dit : "Quel culot ces types ont-ils d'essayer de m'envoyer un courrier qui commence par "Cher ami" ou dont l'objet est tout en majuscules et se termine par huit points d'exclamation. Je peux filtrer ce genre de choses avec environ une ligne de code. Mais le véritable avantage de l'approche bayésienne, bien sûr, est que vous savez ce que vous mesurez. 


Les filtres de reconnaissance des caractéristiques comme Spam Assassin attribuent un score de spam aux e-mails. L'approche bayésienne attribue une probabilité réelle. Le problème avec un score est que personne ne sait ce qu'il signifie. L'utilisateur ne sait pas ce qu'il signifie, mais pire encore, le développeur du filtre ne le sait pas non plus. Combien de points doit recevoir un courriel contenant le mot "sexe" ? Une probabilité peut bien sûr être erronée, mais il y a peu d'ambiguïté sur ce qu'elle signifie, ou sur la façon dont les preuves doivent être combinées pour la calculer. 

Sur la base de mon corpus, sexe indique une probabilité de 0,97 que l'e-mail contenant le mot soit un spam, alors que sexy indique une probabilité de 0,99. Et la règle de Bayes, également sans ambiguïté, indique qu'un courriel contenant les deux mots aurait, en l'absence (improbable) de toute autre preuve, une probabilité de 99,97 % d'être un spam.


عن الكاتب

SamTech

التعليقات


جميع الحقوق محفوظة

samtech