Terça-feira, 9 de Fevereiro de 2010
Vivo sob os escombros um mês depois - Um homem de 28 anos foi encontrado ontem com vida entre os escombros de um edifício no Haiti, onde terá estado preso desde 12 de janeiro

Cientistas portugueses criaram «aspirador» de lixo electrónico

2008-08-11
Por Jeniffer Lopes

Partilhar

Luís Rocha: «Novo modelo compete positivamente com os já existentes»
Luís Rocha: «Novo modelo compete positivamente com os já existentes»
Os spams (e-mails ilegítimos ou fraudulentos) são a praga do mundo moderno. Para os milhares de pessoas que lidam com correio electrónico (e-mail), estes “invasores”, que conseguem iludir os sistemas que actualmente existem para os detectar, são um verdadeiro problema. Cientistas do Instituto Gulbenkian de Ciência (IGC) encontraram a solução - um método inovador que permite detectar de forma eficaz estas ameaças, funcionado como uma espécie de “aspirador” de lixo electrónico. E, por mais inverosímil que possa parecer, inspiraram-se, para desenvolver o novo método, no funcionamento do sistema imunitário dos seres vivos.

Jorge Carneiro, do IGC
Jorge Carneiro, do IGC

A invenção é de um grupo de investigadores do IGC e representa um substancial avanço em termos de detecção dos e-mails fraudulentos que muitas vezes vêm entupir as caixas de entrada dos que lidam com correio electrónico. O Ciência Hoje falou sobre as potencialidades deste novo modelo com Luís Rocha, director do co-laboratório de Biologia Computacional do IGC e da Fundação Luso-Americana para o Desenvolvimento.

Uma colaboração com Jorge Carneiro, investigador do IGC, terá sido o ponto de partida para o desenvolvimento do projecto. Jorge Carneiro, juntamente com outros cientistas, desenvolveu um modelo matemático sobre a regulação cruzada de linfócitos T (T-cells). “Este modelo mostra como um sistema baseado em apenas três tipos de células pode discriminar entre dois tipos de substâncias (antigénios): nocivas (normalmente, invasores como bactérias ou vírus) ou necessárias (normalmente, elementos do próprio corpo)”, explica Luís Rocha.

Os investigadores perceberam rapidamente que o processo explicado pelo modelo de Jorge Carneiro e da sua equipa poderia ser utilizado como base para a criação de um sistema de detecção de spams. “Uma vez que a finalidade do sistema de regulação cruzada é discriminar entre duas classes de objectos, pareceu-nos muito natural utilizar a mesma ideia para separar e-mails genuínos de spam”, conta Luís Rocha.

Linfócitos T como base

O que se fez, segundo explica o investigador, foi, “utilizando simulação por agentes, desenvolver um algoritmo de computação bio-inspirada baseado em linfócitos T artificiais que reagem, não a antigénios como no sistema imune, mas antes a fragmentos de e-mails como palavras, sequências de palavras, código de HTML”. Assim, no sistema artificial, os antigénios correspondem aos fragmentos de e-mail. Do processo de reconhecimento destes fragmentos resulta a classificação de um e-mail como sendo lixo ou genuíno.

Apesar de o projecto ser ainda preliminar, os testes realizados permitem a Luís Rocha afirmar que “o sistema pode detectar spam tão bem como os melhores classificadores que existem”, comportando-se até melhor que alguns em determinadas situações. O investigador conta: “Testámo-lo contra classificadores tradicionais em sistemas de spam, bem como usando dados padrão na literatura de spam. Além de testar o nosso sistema em dados estáticos, vimos também a sua performance em dados dinâmicos, o que nos permite estudar e detectar o desvio de conceitos no tempo (desvio conceptual)”.

Luís Rocha explica que uma determinada palavra pode começar por não ser indicadora de spam, mas com o correr do tempo, passar a sê-lo. O novo sistema está a ser concebido para responder a situações deste tipo, que escapam aos detectores que actualmente existem. E a verdade é que os testes que têm sido feitos provam que o novo modelo compete positivamente com os já existentes.

Para Luís Rocha, muito há ainda a fazer. O novo modelo é o objecto da tese de doutoramento de um dos seus alunos na School of Informatics, na Universidade de Indiana, Alaa Abi-Haidar. No que diz respeito a spam, o investigador afirma que “o plano é continuar a desenvolver o modelo em várias vertentes, bem como criar dados padrão melhores para testar o desvio conceptual em e-mail”.

O que se pretende ainda é “aplicar o modelo a outros problemas de classificação que não simplesmente e-mail, como por exemplo em termos de recomendação de artigos científicos relevantes para utilizadores específicos”, acrescenta Luís Rocha.

Regulação cruzada

Compreender melhor a regulação cruzada em imunologia é também um dos objectivos do sistema que está a ser desenvolvido. “Sendo um modelo computacional, permite-nos estudar muito mais facilmente as vantagens e limitações de uma defesa imune baseada no princípio de regulação cruzada”. O sistema inovador de detecção de spam vai, assim, contribuir para melhor compreender o funcionamento das células do sistema imune que estão envolvidas no processo vital de tolerância e controlo das doenças auto-imunes.

Quando questionado sobre se é de esperar que o modelo venha a ser comercializado e utilizado pelos que acedem à Internet, o investigador afirma que, “se os resultados da teste de doutoramento de Abi-Haidar forem o que se espera de um trabalho preliminar tão promissor, há todo o interesse, se não em comercializar, pelo menos em fornecer o código à comunidade da Web para utilizar o sistema”.

Apresentado na conferência Artificial Life XI, na Universidade de Southampton, Reino Unido, no passado dia 7 de Agosto, o novo modelo foi muito bem acolhido. “Ficámos surpreendidos com a recepção tão positiva a um trabalho ainda algo preliminar”, confessa Luís Rocha. A conferência Artificial Life XI apresenta o que de melhor se faz actualmente no estudo das propriedades fundamentais dos sistemas vivos, através de simulações e síntese de entidades e processos biológicos em meios artificiais. “O interesse da imprensa do Reino Unido e internacional foi grande, tendo saído notícias sobre o nosso trabalho desde a BBC até ao Slashdot”, revela o investigador.



Comentários

O seu comentário:


O seu nome:


O seu email (não será publicado):






Concurso Dos 0 aos 100
Ciência Viva TV
FCCN - Fundação para a Computação Científica Nacional Ciência Viva


Contactos
Ficha técnica
Estatuto Editorial
Conselho Científico
A Palavra do Leitor
Portuguese Science