Língua Portuguesa e Literatura para o Enem

Tag: processamento de linguagem natural

N-gramas – entenda o conceito e os campos de aplicação

Aqui no Clube do Português a gente fala sobre “n” assuntos interessantes, não é? Já pensou nessa expressão que acabei de usar: ‘“n” assuntos’? Se você entende do que estou falando, vai ficar fácil compreender o que são n-gramas.  Eles são uma subsequência de n itens de uma dada sequência. Essa sequência contígua de itens pertence a uma determinada amostra de texto ou fala, ou seja, a um corpus.

O termo “n-grama”, ou “n-gram”, em inglês, é usado por linguistas computacionais e engenheiros para se referir a combinações de palavras que ocorrem juntas (que descrevem um padrão de discurso), normalmente com uma certa frequência.

No fundo, é um jogo probabilístico que mede a chance de ocorrer uma dada letra na sequência de um determinado número de itens. Em um modelo de linguagem simples de n-grama, é a probabilidade de ocorrer uma palavra, condicionada a algum número de palavras anteriores.

Mas note que os n-gramas não são apenas palavras. Podem ser também itens como fonemas, sílabas, letras, ou pares de bases coletados dentro de um corpus de texto ou fala – sim, além de pertinentes ao campo das probabilidades, os n-gramas também estão ligados à linguística computacional.

Continue reading

Linguística computacional – conceito e campos de aplicação

A linguística computacional é um campo marcado pelo cruzamento da linguística com a tecnologia. Neste artigo, vamos aprofundar esse conceito e mostrar seus campos de aplicação. Vejamos!

Muito mais do que entender como você se comunica com seu computador, é curioso pensar como é que ele entende você? Como, afinal, a linguagem humana é compreendida em bytes e bits.

Linguística, Informática e Inteligência Artificial (IA), tudo junto e misturado como forma de expressão que parte da relação entre o processamento de linguagem natural com as inovações tecnológicas. É disso que se faz a linguística computacional, uma área multidisciplinar do conhecimento que utiliza processos computacionais para o controle e uso da linguagem humana.

Olha, é preciso pontuar que a linguística é uma área de conhecimento razoavelmente recente, e que a computacional, então, é mais ainda, mesmo que venha apresentando um desenvolvimento considerável nos últimos anos. Ela visa facilitar cada vez mais a interação homem-máquina, aspecto fundamental para a rápida popularização dos computadores.

A linguística computacional desenvolve sistemas capazes de produzir e reconhecer a linguagem natural, a do dia a dia da gente. E faz isso por meio de algoritmos, métodos e softwares que permitem aos computadores “traduzirem” automaticamente para si documentos e arquivos de texto, voz ou vídeo gerados em alguma língua humana.

Entre suas aplicações mais comuns, estão programas como tradutores automáticos (ex: Google Tradutor), corretores ortográficos e gramaticais (ex: corretor do Word), entre outros. Estão sob esse “guarda-chuva”, também, os chatbots, que são aqueles programas que dão conta de conversar online com pessoas (consumidores) por meio de um chat (sala de bate-papo) dentro de sites ou por redes de mensageria (WhatsApp, em especial).

Linguística aplicada à Inteligência Artificial

Como um campo que estuda e manipula o processamento computacional das linguagens naturais humanas, a Linguística Computacional é dividida em duas áreas: Linguística de Corpus e Processamento de Linguagem Natural (NLP).

Um corpus linguístico que tenha como base a computação é um imenso banco de dados de textos de uma língua específica que vão sendo recolhidos pelo sistema operacional e organizados sistematicamente no computador a partir do conhecimento prévio dessa língua pelo sistema.

Já o NLP é o passo adiante, é a vertente da inteligência artificial que ajuda o computador a entender, interpretar e manipular esse banco de dados da linguagem humana. É como a AI de um chatbot torna-se capaz de compreender, interagir e atender à demanda do consumidor.

Está aí a justificativa para a necessidade dessa conexão entre linguística e tecnologia. Para construir um bot que consiga dar conta do atendimento ao cliente, é preciso que ele reconheça a linguagem da pessoa que é sua interlocutora e que possa construir soluções linguísticas que deem suporte a uma conversa satisfatória. Se não, imagina você dizendo ao bot que quer cancelar um serviço e ele respondendo com frases desconexas…

Como se faz isso?

É fácil intuir que a linguística computacional está imersa nos conceitos de matemática e lógica e que utiliza elementos básicos de linguagens de programação, como Python, com ênfase na biblioteca NLTK (Natural Language Toolkit).

Entre as soluções que prometem resolver estão a correção automática de erros de digitação, a tradução instantânea, o reconhecimento, emissão e síntese de voz (típico de robôs humanóides), os chatbots, a análise de sentimentos e a sumarização de textos.

É preciso que o sistema aprenda como as regras se organizam cognitivamente no cérebro de cada falante humano e as represente por um símbolo matemático aplicável em linguagem de programação, para imitar a comunicação humana.

O papel do linguista é traduzir para a linguagem computacional os detalhes de como a língua faz em termos semântico, fonético, fonológico, morfológico, sintático e pragmático, introduzindo conhecimento sobre a formação verbal, gênero e número etc., para poder conversar bem com “aquela pecinha que fica atrás do teclado”.

*

Gostou do texto? Então vale a pena conferir todos os artigos da série Língua e Tecnologia.

Fonética articulatória, acústica e auditiva – qual a diferença?

A imagem mostra uma menina e um robô e simboliza como os conceitos de fonética articulatória, acústica e auditiva vêm sendo usados no campo da inteligência artifical.
Esses conceitos vêm sendo usados no campo da Inteligência Artificial

A fonética é o campo da gramática que, segundo o professor Napoleão Mendes de Almeida, estuda os vários sons ou fonemas linguísticos.

Ela se divide em três áreas: articulatória, acústica e auditiva. Neste artigo, você vai entender cada uma delas. Vamos lá!

1) Fonética articulatória

Esse ramo da fonética estuda como os sons são produzidos no aparelho fonador (veja imagem abaixo):

A imagem mostra um aparelho fonador do corpo humano.

Antes de avançarmos com as explicações, é importante diferenciar dois conceitos: voz e fala.

Segundo, Izabel Seara, Vanessa Nunes e Cristiane Lazzarotto-Volcão, a voz pode ser definida como o som produzido a partir da vibração das pregas vocais. Já a fala é o resultado da articulação desse som.

Dito isso, vale destacar que esse segmento busca avaliar as propriedades articulatórias, que, segundo Markus Dicknson, Chris Brew e Detmar Meurers, são três:

Continue reading

© 2024 Clube do Português

Theme by Anders NorenUp ↑

#CodigoClever