Da grande árvore da Linguística, surgiram vários galhos como a Sociolinguística, a Psicolinguística e a Linguística Textual. A Linguística de corpus é uma dessas ramificações.
Essa área se interessa por estudar a língua em uso, a partir de suas especificidades – como as expressões regionais – e da comparação com outras formas de expressão pela fala do dia a dia.
Como ela faz isso? A partir da coleta e análise de imensos bancos de dados formados por textos produzidos por falantes reais (a exemplo de discursos, textos históricos, entrevistas transcritas e conteúdo extraído de redes sociais). Para formar um corpus, só é preciso que eles tenham algo bem típico e, portanto, apresentem alguma similaridade.
Isso pode ser encontrado numa coleção de edições diárias de um jornal ou revista, na coleção de arquivos dos discursos feitos em Plenário do Congresso Nacional, ou ainda em todos os tweets de um influenciador digital qualquer.
Continue reading