As palavras mais populares usadas nas redes sociais

Você já se perguntou sobre a linguagem usada nas Redes Sociais? Ou as palavras que usamos são baseadas em nossos traços de personalidade? Se sua resposta for sim, você está com sorte.

Fundo

O Centro de Psicologia Positiva com sede na Universidade da Pensilvânia, criou o que é conhecido como O Projeto Bem-Estar Mundial (WWBP). Este incrível projeto está forjando técnicas científicas medindo o bem-estar psicológico e a saúde física com base na análise da linguagem nas redes sociais. Os mais brilhantes cientistas da computação, psicólogos e estatísticos estão analisando os processos psicossociais que afetam a saúde e a felicidade e explorando o potencial para substituir métodos caros de pesquisa. Em 2013, o WWBP publicou um estude intitulado Personalidade, gênero e idade na linguagem das mídias sociais: a abordagem do vocabulário aberto. Em um dos maiores estudos até hoje, o WWBP analisou mais de 700 milhões de palavras, frases e instâncias de tópicos coletados das mensagens do Facebook de 75.000 voluntários. Para analisar as mensagens, eles usaram dois métodos diferentes para encontrar atributos demográficos e psicológicos:

  • Análise Diferencial de Linguagem (DLA): um método desenvolvido pela WWBP para identificar os recursos de linguagem mais distintos de qualquer atributo.
  • Pesquisa lingüística e contagem de palavras (LIWC): uma ferramenta popular usada em psicologia para encontrar maneiras de as pessoas usarem as palavras em seu dia a dia. Isso pode fornecer informações valiosas sobre suas crenças, medos, padrões de pensamento, relacionamentos sociais e personalidades.

Neste estudo específico, o WWBP também fez voluntários fazerem testes de personalidade padrão (o Big 5 Factor Model) para determinar as palavras usadas em certos traços de personalidade. Combine tudo isso, e eles foram capazes de vincular a linguagem da mídia social de personalidade, gênero e idade com 91,9% de precisão. Agora vamos sujar as mãos e dar uma olhada em como eles reuniram as atualizações de status do Facebook e formularam seus gráficos de visualização.



Os dados

O conjunto de dados completo consistia em aproximadamente 19 milhões de atualizações de status do Facebook escritas por todos os participantes. A equipe do WWBP restringiu sua análise aos usuários do Facebook que atendiam a 4 determinados critérios:

  • Eles devem indicar o inglês como idioma principal
  • Ter escrito pelo menos 1.000 palavras em suas atualizações de status
  • Ter menos de 65 anos
  • Indique o sexo (masculino e feminino) e a idade

Língua do gênero:

linguagem de mídia social

Os recursos da linguagem feminina são mostrados na parte superior com os recursos do idioma masculino abaixo. O s tamanho da palavra indica a força da correlação; a Cor indica frequência relativa de uso. Sublinhados (_) conectar palavras de frases com várias palavras.



  • Mulheres deste estudo (superior), usou mais palavras de emoção (por exemplo, animado) e singulares de primeira pessoa e mencionam mais processos psicológicos e sociais (por exemplo, 'te amo' e '<3’ –a heart).
  • Doenças usou mais palavrões e referências a objetos (por exemplo, 'xbox', 'black ops', 'deseja que ele').

Língua da Idade:

linguagem de mídia social

Como você pode ver na Figura 3 acima, há mudanças sutis de tópicos que progridem de uma faixa etária para a seguinte. Além disso, existem distinções claras em palavras como o uso de gírias, emoticons e linguagem da Internet no Faixa etária de 13 a 18 anos . No 23 a 29 anos , você pode ver um casal Fala internet ou tópicos de trabalho (por exemplo, ‘no trabalho’, ‘novo emprego’). Nós vemos um escola tópico relacionado para 13 a 18 anos (por exemplo, ‘escola’, ‘lição de casa’, ‘ugh’), enquanto vemos um Faculdade tópico relacionado para 19 a 22 anos (por exemplo, 'semestre', 'faculdade', 'matrícula'). Conforme você avança para o Grupo de 30 a 65 anos , as palavras usadas são mais focadas na estabilidade emocional com a família e amigos (por exemplo, ‘filha’, ‘meu filho’, ‘meus filhos’ e ‘meus amigos fb’). Em geral, você verá uma progressão de escola, faculdade, trabalho e família ao examinar os principais tópicos em todas as faixas etárias.



Frequência padrão de tópicos e palavras com base na idade: linguagem de mídia social

Em Fig. 4A , o gráfico mostra a frequência relativa dos temas mais seletivos para cada faixa etária em função da idade. Fig. 4B reforça essa hipótese ao apresentar um padrão semelhante com base em outros tópicos sociais. Fig. 4C mostra que o uso de 'nós' aumenta depois dos 22 anos, enquanto 'eu' diminui. Isso definitivamente sugere a crescente importância das amizades e relacionamentos à medida que as pessoas envelhecem.



Linguagem de personalidade:

Os pesquisadores investigaram como nossa linguagem e personalidade coincidem. Eles analisaram as palavras usadas pelos participantes e as organizaram com base na personalidade de cada participante. Aqui está uma rápida atualização dos 5 fatores de personalidade:

  • Extroversão: descreve como você interage com as pessoas.
  • Neuroticismo: é como você lida com as emoções
  • Amabilidade: é como você se sente em relação aos outros
  • Consciência: descreve o quão organizado e confiável você é
  • Abertura: é quando alguém está curioso e com a mente aberta para novas experiências e conhecimentos
linguagem de mídia social linguagem de mídia social

Podemos ver no canto superior esquerdo que categorias socialmente relacionadas, como Festa tópicos surgem como uma característica distintiva chave para Extrovertidos . Além disso, os resultados sugerem que Introvertidos estão interessados ​​em mídia japonesa (por exemplo, 'anime', 'manga', 'internet' e emoticons de estilo japonês: ˆ_ˆ). A parte inferior esquerda da Figura 5 acima mostra que as pessoas Alto em Neuroticismo frases comumente mencionadas como 'cansado de', 'deprimido' e 'eu odeio'. O canto inferior direito mostra a linguagem relacionada à estabilidade emocional ( Neuroticismo baixo ) Neurótico Baixo indivíduos escreveram sobre atividades sociais agradáveis ​​que promovem a harmonia ou criam um maior equilíbrio emocional, como ‘esportes’, ‘férias’, ‘praia’, ‘igreja’, ‘equipe’ e um tempo para a família tema. Na Figura 6 abaixo (canto inferior direito), as pessoas que exibem Baixa Abertura use palavras abreviadas em sua atualização de status (por exemplo, ‘2 dias’, ‘ur’, ‘a cada 1’). Pessoas que são Grande Aberto (canto inferior esquerdo) utilizam palavras criativas (por exemplo, 'arte', 'universo', 'música', 'escrita' e 'alma'). Você pode não concordar com isso, mas Baixa Consciência pessoas (meio-esquerdo) usam palavras muito explícitas em suas atualizações, enquanto Alta Consciência pessoas (meio-esquerdo) usam frases (por exemplo, 'para o trabalho', 'pronto para' e 'ótimo dia'). Como você pode ver, plataformas de mídia social como Facebook e Twitter são recursos muito favoráveis ​​para o estudo de pessoas; atualizações de status e tweets são expressivos, pessoais e têm conteúdo emocional. Lembre-se de algumas coisas:



  • Essa linguagem, em geral, é imparcial e é um dado comportamental mensurável
  • A linguagem do Facebook permite especificamente que os pesquisadores observem os indivíduos conforme eles se apresentam ao mundo online.

Método FOR

figura 1



Como você pode ver na Figura 1 acima, o DLA opera por: 1.) Extração de recurso: Extraindo linguagem por: (a) palavras e frases : uma sequência de 1 a 3 palavras encontradas em uma sequência de texto, emoticons e duas ou mais palavras que correspondem a alguma forma convencional de dizer as coisas. (b) tópicos : analisando automaticamente grandes coleções de texto sem etiqueta. 2.) Análise Correlacional: o processo de correlacionar palavras com gênero, idade e personalidade. Uma vez que encontraram milhares de palavras significativamente correlacionadas, os gráficos de visualização foram a chave para a compreensão de sua pesquisa (ver Fig. 2 abaixo).

Fascinante certo?