Meio Bit » Ciência » Netflix diz que para prever gosto, geografia, gênero e idade são “lixo”

Netflix diz que para prever gosto, geografia, gênero e idade são “lixo”

A Netflix revelou dados interessantes sobre os dados de acesso de seus usuários e como os usam para alimentar o algoritmo de recomendação. O curioso mesmo? Informações como localização geográfica, gênero e etnia do usuário são completamente inúteis para determinar se ele vai gostar ou não de um filme.

4 anos e meio atrás

chickflicks_1-1024x787

Já ouvi de mais de um batráquio a máxima meu avô fumou a vida inteira e morreu atropelado, como argumento contra a correlação absurdamente comprovada entre cigarro e câncer. Eles estão certos, mas calma que eu explico.

Estatísticas não se aplicam a indivíduos. Eu sou brasileiro e carioca, estatisticamente teria enorme probabilidade de gostar de samba, mas quem me conhece jamais sonharia em fazer essa previsão.

Isso não quer dizer que estatísticas não sirvam para prever comportamento de grupos, existem sim diferenças. Meninos gostam mais de filmes com coisas que explodem, meninas gostam mais de filmes do Hugh Grant, quando você planeja um blockbuster leva isso em conta, e além de grandes explosões pensa no público feminino e coloca cenas absolutamente gratuitas e apelativas:

8268cf30058c58a98d4bb7d583bba3b9

A análise estatística que determina esse tipo de ação funciona perfeitamente bem, mas ela quebra quando o grupo se torna menor. Chega-se a um ponto onde é impossível extrapolar, saindo de uma base de dados global, o comportamento de um indivíduo.

Aì entra a Netflix, que tem em suas mãos algo valiosíssimo, que pouquíssimas empresas têm, nenhuma delas empresas de mídia: dados detalhados de comportamento de cada um de seus usuários. Com isso ela consegue extrapolar perfeitamente que séries e atores e estilos agradam mais a mulheres de classe média entre 18 e 24 anos pernetas nos estados americanos com número ímpar de letras.

Agora a parte bonita e elegante desse caso de BigData: a Netflix sabe cada filme que você assistiu, quando, onde, quantas vezes deu pause, se viu na TV, no celular ou no trabalho. Ela sabe o quê você procurou para chegar até esse filme, se começou e parou outros.

House-of-cards-netflix

Com esses dados ela pode fazer uma razoável estimativa se você vai gostar ou não de um filme, e isso é tão sério para o business que a Netflix lançou um prêmio de um milhão de dólares, para quem conseguisse melhorar o algoritmo. Em 2009 o grupo BellKor's Pragmatic Chaos foi o vencedor, com um aprimoramento de 10,06%.

Agora Todd Yellin, VP de Inovação de Produto da Netflix fez umas revelações interessantes: segundo ele dados como geografia, gênero e idade são lixo. Não servem para nada pra estimar se um indivíduo vai gostar de um filme.

Não deixa de ser interessante essa dualidade. Lançar uma comédia romântica e achar que ela vai fazer sucesso entre as mulheres é uma estimativa razoável. Oferecer uma comédia romântica a uma usuária por ser mulher é ineficiente e se baseia em estereótipos. Parece algo saído do Tumblr, mas é pura matemática.

Quer um exemplo? O sujeito tem nome japonês, 17 anos, é homem e está acessando de Tóquio. O bom-senso diz para oferecer um animê. Parabéns, jogou sua recomendação fora. Só 10% dos acessos de animês na Netflix vêm do Japão.

elektra-header2

O algoritmo ignora tudo isso, ele determina o gosto da pessoa com base no que ela consome, não em quem ela é e onde mora. Claro, é tudo bem mais complexo do que estou descrevendo e tenho capacidade para entender, mas basicamente na utopia da Netflix você é julgado pelos seus atos, não por cor, sexo, etnia ou nacionalidade. Bonito isso.

Só seria mais bonito se a Netflix fosse esperta e não me mandasse e-mail recomendando House of Cards e Demolidor, duas séries que todo mundo está careca de conhecer e assistir.

Fonte: Fortune.

Leia mais sobre: , , , .

relacionados


Comentários