Você já se perguntou sobre a linguagem usada nas Redes Sociais? Ou as palavras que usamos são baseadas em nossos traços de personalidade? Se sua resposta for sim, você está com sorte.
O Centro de Psicologia Positiva com sede na Universidade da Pensilvânia, criou o que é conhecido como O Projeto Bem-Estar Mundial (WWBP). Este incrível projeto está forjando técnicas científicas medindo o bem-estar psicológico e a saúde física com base na análise da linguagem nas redes sociais. Os mais brilhantes cientistas da computação, psicólogos e estatísticos estão analisando os processos psicossociais que afetam a saúde e a felicidade e explorando o potencial para substituir métodos caros de pesquisa. Em 2013, o WWBP publicou um estude intitulado Personalidade, gênero e idade na linguagem das mídias sociais: a abordagem do vocabulário aberto. Em um dos maiores estudos até hoje, o WWBP analisou mais de 700 milhões de palavras, frases e instâncias de tópicos coletados das mensagens do Facebook de 75.000 voluntários. Para analisar as mensagens, eles usaram dois métodos diferentes para encontrar atributos demográficos e psicológicos:
Neste estudo específico, o WWBP também fez voluntários fazerem testes de personalidade padrão (o Big 5 Factor Model) para determinar as palavras usadas em certos traços de personalidade. Combine tudo isso, e eles foram capazes de vincular a linguagem da mídia social de personalidade, gênero e idade com 91,9% de precisão. Agora vamos sujar as mãos e dar uma olhada em como eles reuniram as atualizações de status do Facebook e formularam seus gráficos de visualização.
O conjunto de dados completo consistia em aproximadamente 19 milhões de atualizações de status do Facebook escritas por todos os participantes. A equipe do WWBP restringiu sua análise aos usuários do Facebook que atendiam a 4 determinados critérios:
Os recursos da linguagem feminina são mostrados na parte superior com os recursos do idioma masculino abaixo. O s tamanho da palavra indica a força da correlação; a Cor indica frequência relativa de uso. Sublinhados (_) conectar palavras de frases com várias palavras.
Como você pode ver na Figura 3 acima, há mudanças sutis de tópicos que progridem de uma faixa etária para a seguinte. Além disso, existem distinções claras em palavras como o uso de gírias, emoticons e linguagem da Internet no Faixa etária de 13 a 18 anos . No 23 a 29 anos , você pode ver um casal Fala internet ou tópicos de trabalho (por exemplo, ‘no trabalho’, ‘novo emprego’). Nós vemos um escola tópico relacionado para 13 a 18 anos (por exemplo, ‘escola’, ‘lição de casa’, ‘ugh’), enquanto vemos um Faculdade tópico relacionado para 19 a 22 anos (por exemplo, 'semestre', 'faculdade', 'matrícula'). Conforme você avança para o Grupo de 30 a 65 anos , as palavras usadas são mais focadas na estabilidade emocional com a família e amigos (por exemplo, ‘filha’, ‘meu filho’, ‘meus filhos’ e ‘meus amigos fb’). Em geral, você verá uma progressão de escola, faculdade, trabalho e família ao examinar os principais tópicos em todas as faixas etárias.
Em Fig. 4A , o gráfico mostra a frequência relativa dos temas mais seletivos para cada faixa etária em função da idade. Fig. 4B reforça essa hipótese ao apresentar um padrão semelhante com base em outros tópicos sociais. Fig. 4C mostra que o uso de 'nós' aumenta depois dos 22 anos, enquanto 'eu' diminui. Isso definitivamente sugere a crescente importância das amizades e relacionamentos à medida que as pessoas envelhecem.
Os pesquisadores investigaram como nossa linguagem e personalidade coincidem. Eles analisaram as palavras usadas pelos participantes e as organizaram com base na personalidade de cada participante. Aqui está uma rápida atualização dos 5 fatores de personalidade:
Podemos ver no canto superior esquerdo que categorias socialmente relacionadas, como Festa tópicos surgem como uma característica distintiva chave para Extrovertidos . Além disso, os resultados sugerem que Introvertidos estão interessados em mídia japonesa (por exemplo, 'anime', 'manga', 'internet' e emoticons de estilo japonês: ˆ_ˆ). A parte inferior esquerda da Figura 5 acima mostra que as pessoas Alto em Neuroticismo frases comumente mencionadas como 'cansado de', 'deprimido' e 'eu odeio'. O canto inferior direito mostra a linguagem relacionada à estabilidade emocional ( Neuroticismo baixo ) Neurótico Baixo indivíduos escreveram sobre atividades sociais agradáveis que promovem a harmonia ou criam um maior equilíbrio emocional, como ‘esportes’, ‘férias’, ‘praia’, ‘igreja’, ‘equipe’ e um tempo para a família tema. Na Figura 6 abaixo (canto inferior direito), as pessoas que exibem Baixa Abertura use palavras abreviadas em sua atualização de status (por exemplo, ‘2 dias’, ‘ur’, ‘a cada 1’). Pessoas que são Grande Aberto (canto inferior esquerdo) utilizam palavras criativas (por exemplo, 'arte', 'universo', 'música', 'escrita' e 'alma'). Você pode não concordar com isso, mas Baixa Consciência pessoas (meio-esquerdo) usam palavras muito explícitas em suas atualizações, enquanto Alta Consciência pessoas (meio-esquerdo) usam frases (por exemplo, 'para o trabalho', 'pronto para' e 'ótimo dia'). Como você pode ver, plataformas de mídia social como Facebook e Twitter são recursos muito favoráveis para o estudo de pessoas; atualizações de status e tweets são expressivos, pessoais e têm conteúdo emocional. Lembre-se de algumas coisas:
figura 1
Como você pode ver na Figura 1 acima, o DLA opera por: 1.) Extração de recurso: Extraindo linguagem por: (a) palavras e frases : uma sequência de 1 a 3 palavras encontradas em uma sequência de texto, emoticons e duas ou mais palavras que correspondem a alguma forma convencional de dizer as coisas. (b) tópicos : analisando automaticamente grandes coleções de texto sem etiqueta. 2.) Análise Correlacional: o processo de correlacionar palavras com gênero, idade e personalidade. Uma vez que encontraram milhares de palavras significativamente correlacionadas, os gráficos de visualização foram a chave para a compreensão de sua pesquisa (ver Fig. 2 abaixo).
Fascinante certo?