Ciência & Tecnologia

Estudo pretende melhorar sistemas de recomendação na internet




Ao navegar por lojas virtuais, os consumidores costumam ser bombardeados por anúncios de produtos, serviços e informações que, na maioria das vezes, estão longe do que buscam naquele momento.

Uma pesquisa de pós-doutorado, desenvolvida no Laboratório de Inteligência Computacional (Labic) do Instituto de Ciências Matemáticas e de Computação (ICMC) da Universidade de São Paulo (USP), campus de São Carlos, com Bolsa da FAPESP, pretende auxiliar os sites de comércio eletrônico (e-commerce) e provedores de conteúdo a tornar seus sistemas de recomendação mais eficientes.

Os pesquisadores estão desenvolvendo métodos para possibilitar que os sistemas computacionais das lojas virtuais possam fazer recomendações de produtos, serviços e conteúdos baseadas em outras variáveis que não somente o histórico de acessos ou de compras dos usuários, por exemplo.

Leia outras notícias em Tecnologia

“A ideia é que, além do padrão de comportamento do usuário ao acessar um determinado site, como as páginas de produtos que clicou, os sistemas de recomendação de lojas virtuais também utilizem informações do contexto em que o usuário está inserido enquanto navega, tais como o dia, a hora e a localização geográfica”, disse à Agência FAPESP Marcos Aurélio Domingues, pesquisador do Labic que, sob a supervisão da professora Solange Rezende, realizou o estudo.

De acordo com Domingues, os sites de e-commerce e provedores de conteúdo utilizam hoje dois diferentes níveis de sistemas de recomendação.

No primeiro, denominado recomendação “simples ou ingênua”, o sistema computacional sugere os mesmos produtos, músicas e filmes que o usuário comprou ou acessou em suas últimas visitas.

No segundo, adotado por empresas de comércio eletrônico como a norte-americana Amazon, o sistema de recomendação faz um cruzamento do produto que o usuário está clicando no momento da visita com os acessados ou comprados por pessoas que visitaram as mesmas páginas que ele nos últimos dias ou horas, para sugerir um produto que ainda não viu e que, eventualmente, pode ser de seu interesse.

Os dois sistemas, no entanto, ainda não levam em conta a informação de contexto, por exemplo, o dia da semana, o horário e a origem do acesso do usuário, que são fatores que influenciam o tipo de recomendação que deve receber, aponta Domingues.

“Se o usuário acessa um site de compras eletrônicas entre segunda e sexta-feira, das 8h às 18h, por exemplo, ele provavelmente está em horário de trabalho e deve receber um tipo de recomendação diferente da que teria de receber em um fim de semana, por exemplo”, comparou.

“O uso dessas informações de contexto pode ajudar a melhorar os sistemas de recomendação, tornando-os mais refinados e precisos”, afirmou.

Segundo o pesquisador, um dos principais obstáculos para esse uso é a falta de algoritmos (sequências de comandos) que possibilitem aos sistemas computacionais obter os dados de forma automática.

Outra lacuna é explorar outras informações de contexto, além do tempo (dia e horário) e a localização do usuário.

“O objetivo da pesquisa é identificar e utilizar outros tipos de informação de contexto e desenvolver algoritmos que possibilitem sua identificação automática pelos sistemas de recomendação, de forma que o usuário receba sugestões coerentes à situação do momento do acesso”, explicou Domingues.

Exemplos de aplicações

Alguns dos primeiros resultados da pesquisa realizada por Domingues foram utilizados em um estudo de caso de um site alemão que sugere nomes de bebês aos futuros pais em tempo real.

Durante a European Conference on Machine Learning and Principles and Practices of Knowledge Discovery (ECML PKDD), realizada no fim de setembro de 2013, em Praga (República Tcheca), os administradores do site alemão promoveram um desafio em que propuseram a programadores e pesquisadores de todo o mundo o desenvolvimento de um algoritmo para melhorar seu sistema de recomendação de nomes de bebês.

Domingues e colegas do Labic e da Universidade Federal do Mato Grosso do Sul (UFMS) desenvolveram um algoritmo que cruza os dados de localização do usuário no momento em que navega pelo site com uma relação de nomes mais populares de bebês no país de origem do acesso, identificados com base no acesso de outros usuários da mesma região nos meses anteriores, para realizar recomendações.

O projeto ficou em quarto lugar na competição internacional de propostas de sistemas de recomendação de nomes e os resultados foram relatados em um artigo publicado nos anais da conferência.

“Ao utilizar informações de contexto bem simplistas, como o tempo e a localização do acesso, pudemos adaptar o sistema de recomendação de nomes do site ao contexto social e cultural e à língua dos usuários de diferentes países”, afirmou Domingues.

“Pelo nosso sistema, os resultados de uma busca de nome de bebê feita por um usuário do Brasil, por exemplo, são diferentes das sugestões feitas para um usuário de outro país ou que também é do Brasil, mas acessou o site alguns meses depois, por exemplo”, disse.

Em outro estudo de caso, os pesquisadores do Labic e da UFMS desenvolveram um algoritmo para organizar hierarquicamente e de forma automática o conteúdo de um site de notícias agrícolas da Empresa Brasileira de Pesquisa Agropecuária (Embrapa) por tópicos.

Os conjuntos de páginas agrupadas por tópicos foram utilizados como informações de contexto para melhorar a precisão do sistema de recomendação de informações aos usuários do portal de notícias agrícolas.

A ideia é que um usuário, ao navegar por uma notícia publicada no site sobre soja, por exemplo, seja identificado pelo sistema de recomendação e que este sugira outras notícias relacionadas à oleaginosa categorizadas em outros tópicos do portal, como monitoramento de pragas que atacam a cultura, por exemplo.

O estudo de caso foi submetido para ser apresentado na 22nd International Conference on Pattern Recognition, que ocorrerá no fim de agosto em Estocolmo (Suécia).

“Temos obtido resultados com esse tipo de informação de contexto muito melhores do que usando dados de tempo e localização do usuário”, disse Domingues.

De acordo com o pesquisador, a organização e a categorização de informações por assunto já são utilizadas por sites de notícias com o objetivo de facilitar a navegação dos usuários.

A diferença, no entanto, é que os sistemas desses portais partem do pressuposto de que os usuários sabem exatamente sobre quais assuntos querem ler e clicam diretamente nos tópicos de notícias relacionadas aos temas de preferência.

Já o sistema de recomendação sensível ao contexto que pretendem implantar pressupõe que o usuário esteja navegando por domínios que ainda não conhece e não sabe exatamente o que busca.

“O sistema de recomendação tenta auxiliar o usuário a encontrar algo de que gostaria mas que não sabe, exatamente, como achar”, afirmou.

“Ao fazer uma recomendação, o sistema tenta adivinhar o que o usuário quer”, explicou.

Continua após a publicidade..