Recommender Systems Flashcards
Representação das preferências dos usuários num sistema de recomendação?
Recomendações têm seus limites, especialmente para a descoberta de informações.
O domínio do problema consiste em usuários expressarem as suas preferências sobre vários itens.
Uma preferência é chamada de avaliação e é representada como uma tupla (Usuário, Item, Avaliação).
As avaliações podem ter muitas formas:
- 0 a 5 estrelas (mais comum)
- Binário (gostei/não gostei)
- Avaliações unárias (como “comprado”, é muito comum no comércio eletrônico)
O conjunto de todas as avaliações forma uma matriz esparsa referida como uma matriz de avaliações.
Tasks
As tarefas típicas geralmente se concentram em dois objetivos:
Tarefa de previsão: dado um usuário e um item, qual é a provável preferência do usuário pelo item?
Tarefa de recomendação: dado um usuário, fornecer a melhor lista classificada de n itens para a necessidade do usuário.
Notação
U- conjunto de utilizadores
I- conjunto de itens
Iu- conjunto de itens avaliados pelo usuário u
R- rating matrix:
r u,i - avaliação do user u ao item i
r u - vetor com tadas as avaliações do usuário u
r i - vetor com todas as avaliações feitas ao item i
ru e ri com traço em cima - As médias das avaliações de um usuário u ou de um item i.
P u,i - A previsão do recomendador para o usuário u no item i. OU r^ u,i
Como os dados são coletados para preencher a matriz?
Abordagens explícitas:
- Pedir às pessoas para avaliar os itens (geralmente não funciona muito bem).
- Pagar às pessoas para avaliar os itens.
Abordagens implícitas:
- Páginas da web: clicar em um link, tempo gasto olhando para uma página, visitas repetidas, referência de uma página para outros, etc.
- Players de música: o que ouvimos, pular músicas, número de vezes que uma música é tocada.
Abordagens algorítmicas para sistemas de recomendação
Content-Based: Foca nas propriedades dos itens. A similaridade entre itens é determinada pela similaridade nas próprias propriedades, recomendando itens semelhantes às preferências do usuário.
Colaborative Filtering: Foca na relação entre usuários e itens. Faz previsões sobre os interesses de um usuário ao coletar preferências de muitos usuários. A premissa subjacente é que se um usuário A tem a mesma opinião que um usuário B, A é mais provável de ter a opinião de B sobre um assunto diferente, digamos x, do que ter a opinião sobre x de um usuário escolhido aleatoriamente. A similaridade entre dois itens é determinada pela similaridade das avaliações dadas pelos usuários que avaliaram ambos os itens. Existem dois tipos de similaridade considerados: usuário-usuário e item-item.
Latent Factors (uma espécie de decomposição SVD): Foca na relação entre usuários e itens. A matriz de avaliações é modelada como o produto de duas matrizes (não negativas). As iterações entre usuário-item são modeladas como produtos internos.
Clusterização (não muito utilizada).
Como é feita a avaliação?
-Erro médio quadrático
-Erro médio absoluto
Precisão ao longo do tempo: como a precisão muda conforme os usuários adicionam mais avaliações?
Métricas de suporte à decisão:
Útil em domínios unários, como históricos de compras
- Precisão (valor preditivo positivo)
- recall (sensibilidade)
Medidas de Similiridade