Base de conhecimento
Dicas e truques do Filtro Bayesiano
Como uma ferramenta de filtro contra spam, a filtragem Bayesiana “aprende” a detectar e-mails indesejados e e-mails legitimos ao análisar o cabeçalho, assunto e conteúdo das mensagens recebidas.
O processo Bayesiano designa uma probabilidade de spam para cada palavra, nome de domínio, código HTML ou outro “simbolo” em cada mensagem. O filtro Bayesiano então, utiliza estes dados para determinar se as novas mensagens de entrada são provavelmente spam ou não-spam.
Como parte do processo Bayesiano, o MDaemon tem ferramentas para configurar pastas separadas para receber cópias de mensagens conhecidas como spam e como e-mails legitimos. A filtragem bayesiana obtém os seus dados ao analisar as mensagens contidas nessas pastas. Ao se adicionar regularmente mensagens spam e não-spam as pastas, a filtragem de spam “aprende” a ser mais confiável na hora de distinguir entre os dois (spam e não-spam).
O Bayesiano irá começar a pontuar os e-mails após 200 mensagens spam e não-spam alimentadas ao sistema. A precisão do sistema depende da maneira em que essa “alimentação” do sistema é feita. Aqui vão algumas dicas:
1. Quanto mais melhor – alimente continuamente as pastas de spam e não-spam mesmo após a pontuação ter começado. Tente alimentar quantidades semelhantes de cada tipo de correspondência (se não for possivel, alimente mais não-spam do que spam).
2. Alimente as pastas com uma variedade de mensagens – é importante alimentar ambas as pastas, spam e não-spam, com uma variedade de remetentes e vários tipos de conteúdo. Não alimente também com mensagens endereçadas a apenas um usuário.
3. Faça uma revisão manual das mensagens antes que elas sejam utilizadas no processo de aprendizagem – é necessário que alguem realize uma revisão de cada mensagem, para assegurar que elas estão no lugar apropriado. A apredizagem não supervisionada é uma das maneiras mais fáceis de arruinar todo o trabalho de classificação.
4. Alimente as pastas com falhas e também com correspondências que não foram pontuadas – se o Bayesiano pontuar uma mensagem erroneamente, você deve colocar essa mensagem na pasta correspondente (spam ou não-spam). Você deve colocar também aquelas que não foram pontuadas pelo sistema Bayesiano.
|
Avalie o resultado
Este artigo lhe ajudou a solucionar sua dúvida? Por favor coloque sua nota para o mesmo. Caso não tenha lhe ajudado ou tenha faltado algo, por favor faça seus comentários abaixo. Obrigado!
|
|