O ser humano possui uma característica, talvez de ordem evolutiva, que nos torna em verdadeiras máquinas de classificação e padronização. Sentimos constantemente o impulso de agrupar e rotular qualquer coisa que pareça semelhante entre si, seja para nos igualarmos, seja para nos distinguirmos.

No mundo da tecnologia, ciência e cultura pop, isso não seria diferente. Seja num nível mais abrangente, com frases sem sentido como “quem gosta de Apple não conhece nada de computador”, “quem joga RPG é virgem” ou “engenharia não é área para mulheres”, como em camadas bem mais específicas, a exemplo de estereótipos que ditam que Swift é coisa de hipster, C++ é uma linguagem de programação para velhos ou que ninguém de fato gosta de codificar em Java.

beard-programmers-final-two

Foi pensando nisso que um engenheiro de computação chamado Jeff Allen, do Trestle Tech, resolveu tirar isso a limpo usando ferramentas de análise estatística e linguagem R para cruzar informações pessoais de um pequeno número de homens e mulheres, todos com certo renome em suas áreas e linguagens de programação, e o que existe em seus repositórios no GitHub.

Aliado a isso, ele usou o API Face, do sistema cognitivo de reconhecimento de faces da Microsoft, para avaliar e classificar as fotos dessas pessoas.

Como o site R-bloggers deixa claro, não podemos dizer que esse é um processo lá muito científico. Além disso, por questões de performance, Jeff restringiu seu estudo às seguintes linguagens:

E ele chegou a alguns resultados bem curiosos. Por exemplo, esta é a distribuição de linguagens de programação entre as mulheres, com maior número de programadoras em JavaScript e R, e bem menos em C++, Java e Python:

mulheres_programação

Ainda assim, quando a gente compara ao número de homens que programam, ou ao menos ao que o Face API identificou como homem, essa distribuição se torna bem disforme:

É importante citar aqui que o processo envolve um conceito de gênero simplificado por limitações computacionais, que por ora avalia somente feições estéticas e não de identidade. Fica aí uma dica de evolução para o futuro dessa API.

Mas voltando, vamos falar de uma distribuição estatística mediana em relação à idade dessas pessoas e a linguagem de programação que elas trabalham:

E quais são as linguagens de programação que deixam os profissionais mais felizes? Para saber isso ao certo, somente com um estudo muito mais completo, mas Jeff resolveu analisar de uma forma mais poética: sorrisos!

E essa coisa de que hipsters barbudos preferem programar em Swift, seria verdade? Veja bem…

E já que chegamos nesse nível de maluquice, por que não cruzar tipos de linguagem de programação por bigodes e costeletas?

Mustaches by Language
Sideburns by Language

Conclusão

Se você for participar de um projeto em C++, deixe seu bigode crescer. Mentira.

Na verdade, o cara precisaria de uma amostragem muito maior para que esse estudo tivesse o mínimo de precisão com relação a comunidade de programadores, e a Face API precisaria ser melhor ajustada para avaliar essas nuances de gênero, personalidade e identidade.

Mas foi uma abordagem extremamente interessante do ponto de vista de análise de dados. Para quem se interessa por esse tipo de assunto e quiser ver a fundo como as consultas foram realizadas, Jeff disponibilizou o código-fonte, claro, em seu perfil no GitHub — note que você precisará de uma chave do Azure para a API da Microsoft.

Relacionados

Escrito por

Matheus Gonçalves

Matheus Gonçalves

Ex-redator

Matheus Gonçalves é formado em Ciências da Computação pelo Centro Universitário FEI. Com mais de 20 anos de experiência em tecnologia e especialização em usabilidade e game development, atuou no Tecnoblog entre 2015 e 2017 abordando assuntos relacionados à sua área. Passou por empresas como Itaú, Bradesco, Amazon Web Services e Salesforce. É criador da Start Game App e podcaster do Toad Cast.