Recommender Systems Flashcards

1
Q

Representação das preferências dos usuários num sistema de recomendação?

A

Recomendações têm seus limites, especialmente para a descoberta de informações.

O domínio do problema consiste em usuários expressarem as suas preferências sobre vários itens.

Uma preferência é chamada de avaliação e é representada como uma tupla (Usuário, Item, Avaliação).

As avaliações podem ter muitas formas:
- 0 a 5 estrelas (mais comum)
- Binário (gostei/não gostei)
- Avaliações unárias (como “comprado”, é muito comum no comércio eletrônico)

O conjunto de todas as avaliações forma uma matriz esparsa referida como uma matriz de avaliações.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Tasks

A

As tarefas típicas geralmente se concentram em dois objetivos:

Tarefa de previsão: dado um usuário e um item, qual é a provável preferência do usuário pelo item?

Tarefa de recomendação: dado um usuário, fornecer a melhor lista classificada de n itens para a necessidade do usuário.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Notação

A

U- conjunto de utilizadores
I- conjunto de itens
Iu- conjunto de itens avaliados pelo usuário u

R- rating matrix:
r u,i - avaliação do user u ao item i
r u - vetor com tadas as avaliações do usuário u
r i - vetor com todas as avaliações feitas ao item i
ru e ri com traço em cima - As médias das avaliações de um usuário u ou de um item i.

P u,i - A previsão do recomendador para o usuário u no item i. OU r^ u,i

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Como os dados são coletados para preencher a matriz?

A

Abordagens explícitas:

  • Pedir às pessoas para avaliar os itens (geralmente não funciona muito bem).
  • Pagar às pessoas para avaliar os itens.

Abordagens implícitas:

  • Páginas da web: clicar em um link, tempo gasto olhando para uma página, visitas repetidas, referência de uma página para outros, etc.
  • Players de música: o que ouvimos, pular músicas, número de vezes que uma música é tocada.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Abordagens algorítmicas para sistemas de recomendação

A

Content-Based: Foca nas propriedades dos itens. A similaridade entre itens é determinada pela similaridade nas próprias propriedades, recomendando itens semelhantes às preferências do usuário.

Colaborative Filtering: Foca na relação entre usuários e itens. Faz previsões sobre os interesses de um usuário ao coletar preferências de muitos usuários. A premissa subjacente é que se um usuário A tem a mesma opinião que um usuário B, A é mais provável de ter a opinião de B sobre um assunto diferente, digamos x, do que ter a opinião sobre x de um usuário escolhido aleatoriamente. A similaridade entre dois itens é determinada pela similaridade das avaliações dadas pelos usuários que avaliaram ambos os itens. Existem dois tipos de similaridade considerados: usuário-usuário e item-item.

Latent Factors (uma espécie de decomposição SVD): Foca na relação entre usuários e itens. A matriz de avaliações é modelada como o produto de duas matrizes (não negativas). As iterações entre usuário-item são modeladas como produtos internos.

Clusterização (não muito utilizada).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Como é feita a avaliação?

A

-Erro médio quadrático
-Erro médio absoluto

Precisão ao longo do tempo: como a precisão muda conforme os usuários adicionam mais avaliações?

Métricas de suporte à decisão:
Útil em domínios unários, como históricos de compras
- Precisão (valor preditivo positivo)
- recall (sensibilidade)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Medidas de Similiridade

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly