Twahpic (pronuncia-se twa: pik), um conjunto de Twitter e tópico, é um projeto de demonstração de pesquisa da Microsoft que combina modelagem de tópico semissupervisionada com feeds do Twitter para permitir que as pessoas explorem o que é um conjunto de tweets (de um usuário, correspondendo a uma consulta) tudo sobre.
Os tópicos do Twahpic são gerados analisando cerca de uma semana de tweets do Twitter e, em seguida, construindo modelos especiais que encapsulam a linguagem usada para descrever vários conceitos. Muitas vezes, esses conceitos se aglutinam claramente em torno de substantivos como pessoas e lugares. Os tópicos também podem ser menos definidos, como adjetivos positivos ou palavras de saudação. Em seguida, identifica se cada tópico é social, status, substância ou estilo.
Twahpic ou Twitter Topic Modeling é, portanto, um projeto voltado para a modelagem de tweets. De acordo com a Microsoft, “Twahpic” mostra do que tratam os tweets no Twitter. Twahpic usa Análise de Dirichlet Latente Parcialmente Rotulada (PLDA) para identificar 200 tópicos usados no Twitter. Isso é realmente incrível em termos de resultados que fornece, porque antes disso eu nunca encontrei algo que pudesse realmente modelar meus interesses junto com a substância, o social, o status e o estilo.
O que me impressiona ainda mais é que ele está hospedado no Windows Azure. Sim, é um aplicativo baseado em nuvem que comprova o investimento que a Microsoft está fazendo em serviços em nuvem.
Deixe-me dar uma ideia disso:
Visita Twahpic e digite o nome da pessoa de cujos tweets você deseja modelar ou apenas escreva qualquer consulta. Aqui, pegamos o exemplo de tweets @TheWindowsClub.
Você pode ver o que nós twitamos sobre! Esta é apenas uma interpretação dos nossos tweets que ajuda as pessoas a compreender o nosso conteúdo. Também pode ser divertido tentar pesquisar com palavras-chave como moda, filmes, roupas, etc. Tenho certeza que você vai gostar disso!