Este tutorial descreve como escanear emails para localizar spam de imagens em um servidor Debian Lenny (
image spam) usando o software
FuzzyOCR. FuzzyOCR é um plugin para o
SpamAssassin que visa detectar spam contendo imagens como meio de transmitir conteúdo. Usando métodos diferentes, ele analisa o conteúdo e as propriedades das imagens para diferenciá-las de mensagens normais e mensagens de spam. FuzzyOCR tenta manter a carga do sistema baixa escaneando apenas os emails que ainda não foram categorizados como spam pelo
SpamAssassin, evitando desta forma realizar trabalho desnecessário. Entretanto, eu não garanto que isto irá funcionar para você!
Observações preliminares:
Neste artigo eu uso o sistema
Debian Lenny como base. Eu assumo que o software
SpamAssassin já está instalado e funcionando, com o diretório
/etc/mail/spamassassin/ sendo usado como o principal diretório de configuração. Se você estiver usando um diretório diferente (por exemplo, se você tiver instalado o software
ISPConfig 2, o diretório de configuração será então
/home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/)), não tem problema. Eu alertarei sobre as mudanças que devem ser feitas.
Por favor, certifique-se de que a sua versão do software SpamAssassin funciona com o software FuzzyOCR. Por exemplo, a versão do FuzzyOCR que eu vou instalar aqui (fuzzyocr-3.5.1-devel.tar.gz) exige
SpamAssassin 3.1.4 ou versões mais recentes.
Pré-requisitos e instalação
FuzzyOCR possui alguns pré-requisitos como os softwares
ocrad e
gocr, que podemos instalar com o comando:
# aptitude install netpbm gifsicle libungif-bin gocr ocrad libstring-approx-perl libmldbm-sync-perl imagemagick tesseract-ocr
Instalação FuzzyOCR
Em seguida, iremos baixar e instalar a última versão do software FuzzyOCR do endereço:
# cd /usr/src/
# wget http://users.own-hero.net/~decoder/fuzzyocr/fuzzyocr-3.5.1-devel.tar.gz
A seguir, abrimos o arquivo de distribuição e movemos todo os arquivos iniciados por FuzzyOcr* e o diretório FuzzyOcr (todos estes arquivos estão contidos no diretório FuzzyOcr-3.5.1/), para o diretório
/etc/mail/spamassassin:
# tar xvfz fuzzyocr-3.5.1-devel.tar.gz
# cd FuzzyOcr-3.5.1/
# mv FuzzyOcr* /etc/mail/spamassassin/
Se o seu diretório do software
SpamAssassin for diferente, por exemplo
/home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/, então o último comando deve ser substituído por:
# mv FuzzyOcr* /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/
Não apague o diretório /usr/src/FuzzyOcr-3.5.1/ ainda. Existe um diretório com imagens de amostra de emails com spam de imagens (samples) que iremos precisar mais tarde para testar se o software FuzzyOCR está funcionando como esperado.
FuzzyOCR está instalado e precisamos agora configurá-lo.