NLP explained – O que é Processamento de Linguagem Natural?

Objectivo do Processamento de Linguagem Natural (PNL) e exemplos correspondentes de aplicações.

Natural Language Processing (NLP para abreviar) liga o processamento automático da linguagem natural na ciência da computação. Com base na linguagem natural e escrita ou falada, o computador pode analisar, compreender e processar a linguagem dos seres humanos.

O objectivo da PNL é compreender a linguagem natural com a ajuda de algoritmos e regras e também geri-la por si próprio. Para este fim, os conhecimentos da informática e da linguística são combinados. Como resultado, a PNL é um tipo de inteligência artificial, que tem numerosas áreas de aplicação, especialmente no campo das empresas e dos dados não estruturados. As áreas de aplicação incluem a comunicação entre humanos e máquinas sob a forma, por exemplo, de motores de busca de empresas ou de chatbots.

O foco aqui é a compreensão da informação não só com base em palavras-chave, mas em todo o seu contexto semântico. A PNL é então capaz de interpretar e interpretar correctamente os contextos de texto dependentes do contexto. O desafio aqui reside na complexidade da linguagem humana. Algumas palavras têm significados diferentes, dependendo da situação e do contexto social. Mas, por outro lado, por vezes temos mais palavras para o mesmo significado. A compreensão de tais diferenças é, portanto, elementar na PNL. Uma vez que os computadores, ao contrário dos humanos, não podem contar com a experiência para uma melhor compreensão da língua, são utilizados vários algoritmos e métodos de aprendizagem de máquinas. A PNL consiste em representar esta informação num formato numérico que pode ser compreendido pelo computador.

Inicialmente, portanto, uma aplicação de PNL requer a utilização de grandes quantidades de dados para a aprendizagem de diferentes padrões e para a análise dos sentidos. Contudo, nem sempre têm de ser dados internos da empresa, mas podem também, em muitos casos, ser dados livremente acessíveis na Internet. As empresas não têm de fornecer dados ou capacidades de servidor para uma aplicação de PNL per se.

Diferentes campos de PNL

O reconhecimento da fala humana pode ser dividido em diferentes áreas. Estas representam diferentes passos, que são posteriormente utilizados para o reconhecimento global do texto:

  • Reconhecimento da língua
  • Classificação de palavras e frases individuais
  • Aquisição de informação gramatical, tais como formulários básicos
  • Identificação de funções individuais das palavras numa frase (sujeito, verbo, objecto, adjectivo, etc.)
  • Interpretação do significado de sentenças (parciais)
  • Compreensão dos contextos e relações entre frases

Enormes desenvolvimentos no campo da PNL aumentaram enormemente as possibilidades de aplicação e a escalabilidade para, por exemplo, motores de busca de empresas. No entanto, a PNL ainda atinge actualmente os seus limites na interpretação de certos dispositivos estilísticos (questões retóricas, ironia ou paradoxos).

Áreas clássicas de aplicação de PNL

1. Modelos de perguntas-respostas

Os problemas deste tipo consistem em responder a perguntas com uma resposta tão precisa quanto possível. Quanto mais concreta a resposta deve ser, mais complexa é a tarefa para o computador. A forma mais fácil de o fazer é, por exemplo, a extracção completa de uma passagem de texto; em alternativa, também se poderia extrair palavras concretas ou embalá-las em frases de resposta. O nível seguinte seria a inferência lógica a partir de informação textual. Por exemplo, o texto poderia conter a informação de que os empregados A, B e C estão localizados no departamento de relações públicas. A resposta lógica à pergunta “Quantos empregados tem o nosso departamento de relações públicas?” seria então três.

Exemplo 1:

Uma empresa de média dimensão tem vários silos de dados com informações e documentos diferentes. Um motor de busca inteligente de empresas pode responder a perguntas como “Como resolvo o código de erro #err49284?

Exemplo 2:

Uma empresa recebe sempre as mesmas perguntas de clientes. Aqui, a empresa pode utilizar um chatbot para responder automaticamente às perguntas do cliente.

2. Classificação de diferentes sequências

O objectivo deste âmbito é classificar o texto em classes pré-definidas. Uma classe predefinida pode ser, por exemplo, emoções como feliz, triste ou zangada. O computador decide independentemente a que classe é atribuído o texto que lhe é apresentado. Da mesma forma, os textos poderiam ser atribuídos a autores ou formatos de artigos (blogue, opinião, notícias). Assim, a extensão dos textos pode ser escolhida arbitrariamente.

Exemplo 3:

Um portal de comparação quer ordenar as críticas negativas por conteúdo. As resenhas de clientes existentes com uma classificação negativa são assim divididas, por exemplo, nas classes “Reclamações sobre serviço ao cliente”, “Reclamações sobre facilidade de utilização” e “Reclamações sobre preços”. Cada classificação negativa (por exemplo, com 3 estrelas ou pior) é agora atribuída a uma classe.

Exemplo 4:

Um construtor de máquinas recebe correio endereçado a diferentes departamentos. Em vez de os seleccionar manualmente, o PNL pode ser utilizado para os subdividir em notas de entrega, facturas, e outros pedidos.

3. Geração de textos

Com base em determinados textos, devem ser sugeridas palavras adequadas para completar o texto. Isto, por sua vez, pode ser utilizado para a previsão e conclusão de outros textos.

Exemplo 5:

O criador de um programa de gestão de documentos pretende simplificar a procura de documentos semelhante ao fornecedor do motor de busca da empresa. Para tal, prevê as potenciais consultas de pesquisa na máscara de pesquisa com palavras correspondentes.

4. Identificação do elemento sentencioso

Esta área de PNL lida com a identificação de diferentes elementos de frases, tais como sujeitos, predicados ou objectos. Alternativamente, estes podem também ser pessoas singulares, empresas, horários ou endereços de correio electrónico.

Exemplo 6:

Uma empresa utiliza um motor de busca empresarial para extrair de actas as pessoas de contacto e prazos dos respectivos sujeitos.

5. Resumos

A tarefa do computador é transformar textos mais longos em textos mais curtos, tendo em conta as regras gramaticais. No processo, o conteúdo não deve mudar, pelo que a informação importante e sem importância deve ser reconhecida.

Exemplo 7:

Uma editora quer resumir automaticamente artigos mais longos para uma versão curta online. Para este efeito, tem um breve resumo criado em comprimento e complexidade linguística, dependendo do perfil do utilizador.

6. Traduções

Os textos são traduzidos em várias línguas em conformidade com as regras ortográficas aplicáveis. Tanto o conteúdo como a gramática do texto original devem ser mantidos próximos.

Exemplo 8:

Um fabricante de engenharia mecânica quer expandir-se da região DACH para a arena internacional e, por conseguinte, precisa de traduzir todas as descrições de produtos e especificações técnicas para outras línguas. O desafio é um vocabulário técnico adicional e específico da indústria.

Esta lista pode também ser alargada para incluir outros casos de utilização, tais como conversões de fala para texto ou reconhecimento de fala.

Como se irá desenvolver a PNL no futuro?

Sendo uma das formas mais promissoras de inteligência artificial, a investigação está actualmente a ser conduzida de forma mais intensiva no campo da PNL. Os rápidos desenvolvimentos dos últimos anos, que sobretudo permitem um desenvolvimento mais eficiente em termos de recursos, prometem desenvolvimentos igualmente rápidos no futuro.

A utilização da PNL já não está reservada às grandes empresas, mas está a tornar-se acessível a todos através de ferramentas de tradução ou pesquisa. Desenvolvimentos futuros trarão mais casos de utilização e reduzirão ainda mais os custos.

Será interessante ver como se desenvolverá a LND nesta área.

Bastian is the Co-Founder & CRO of the enterprise search tech company amberSearch. Me and my Co-Founders recognized the need for a state-of-the-art information management solution and now help companies and their employees to find access information as easily as possible within enterprises.  I primarily write about the latest developments relevant to enterprise search and start-ups. I look forward to growing my network on LinkedIn and meeting new people at different events. If you think, that there might be an opportunity or if you'd like to dive deeper into my topics, please reach out to me.

Comentários estão fechados.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More