A partir de combinação de informações, taxas de exatidão na identificação chegam a 92%; até limpar
os cookies pode facilitar o rastreamento.
Dados reunidos diariamente por logs de internet (endereço de IP, cookies, sistema operacional, tipo de navegador, entre outros) podem
ameaçar a privacidade online porque podem ser utilizados para identificar a atividade de máquinas individuais, de acordo com pesquisadores da Microsoft.
Enquanto isso, análise de tais dados quando tornados anônimos podem ajudar a detectar atividades maliciosas e melhorar a segurança
na web como um todo, adicionaram os especialistas.
Os pesquisadores descobriram também que, em 62% das vezes, informações de HTTP de agente de usuário podem sozinhas identificar
um host com precisão. Combine esses mesmos dados com um endereço de IP e a exatidão salta para 80.6%. Se as informações de agente de usuário são
combinadas apenas com o prefixo do IP, ainda assim a precisão é de 79.3%, afirmou a equipe.
O índice mais alto surgiu quando mais de um ID de usuário era ligado a um único host, o que seria o caso de uma família que compartilha
um único computador, produzindo uma exatidão de 92.8%. A análise dessa informação aparentemente benigna foi baseada em agosto
de 2010, a partir de dados anônimos do Hotmail e Bing de centenas de milhões de usuários. Os pesquisadores então tentaram descobrir se
apenas uma parcela do log de informações poderia revelar um único host.
A descoberta foi de que mesmo dados anônimos podem acabar vazando informações. Por exemplo, substituir um endereço de IP por seu prefixo
ainda exibe detalhes suficientes que, quando combinadas com outros outros fatores registrados, podem aumentar a exposição. “Prefixos granulados
de IPs alcançam precisão de rastreabilidade similar a informações de endereço de IP quando são combinadas com outros agentes de usuário”, pontuaram
os pesquisadores.
A partir do Hotmail, os especialistas coletaram informações a respeito dos tipos de navegador e sistema operacional, fonte do endereço de IP, tempo de
login e IDs anônimas de usuários. Já no Bing, foi possível reunir agentes de usuários HTTP, origem das consultas dos endereços de IPs, tempo das
consultas, cookies de identificação emitidos pelo Bing e a data de criação dos cookies.
Depois disso, o passo seguinte foi detalhar a quantidade de dados capazes de identificar um usuários que era revelada por esses logs comuns.
Eles não estavam tentando descobrir as atividades específicas dos indivíduos, mas sim entender os padrões de atividades agregadas e explorar suas implicações.
Os pesquisadores afirmaram essa utilização de dados se enquadra nas políticas de privacidade da Microsoft, já que há termos que não permitem que
essas informações sejam disponibilizadas para estudiosos externos.
Outra descoberta foi que os provedores de serviço podem reconhecer 88% dos
dispositivos que recebem um cookie, limpar o cookie, para depois retornar ao site, caso eles examinem outros fatores de identificação que foram
extraídos durante a conexão inicial. Mesmo se estiver utilizando um modo de navegação privada, que é desenvolvido para proteger a identidade do
usuário, mesmo assim ele pode ser identificado, pontuaram os estudiosos.
“Nossa análise sugere que os usuários que não desejam ser rastreados devem fazer muito mais do que simplesmente limpar os cookies”, já que, conforme foi
levantado pelo estudo, em alguns circunstâncias excluir os cookies pode ajudar a identificar um host em particular. “Comportamentos atípicos como limpar os
cookies a cada solicitação pode, ao contrário do que se pensa, distinguir um usuário daqueles que não o fazem”. concluíram.
Por Network World/EUA via IDGNow


Responder com Citação
