-
CPPGCC/CCN009 - PROCESSAMENTO DE LINGUAGEM NATURAL - Turma: 01 (2025.2)
Discussão sobre o conteúdo programático, plano de ensino e sistemática de avaliação da disciplina.
Apresentação e discussão sobre algumas aplicações de Redes Neurais; Palestra realizada pelo Prof. Vinícius Ponte.
Apresentação e discussão sobre aprendizagem de máquina (algoritmos supervisionados): i) C4.5; ii) Máquinas de Comitê; iii) Máquinas de Vetor de Suporte (SVM); e iv) Naive Bayes. Na discussão dos algoritmos apresenta-se detalhes de implementações e as principais aplicações.
Apresentação e discussão de aplicações de técnicas de PLN:
i) Question/Answering – Sistemas de Perguntas/Resposta;
ii) Information Extraction – Extração de Informação de e-mails, fóruns, redes sociais e web;
iii) Machine Translation – Tradução Automática;
iv) Sumarização de documentos.
a) Problemas quase resolvidos
i) Dectectar spam;
ii) Part of Speech (POS) Tagging (algoritmos TreeTagger, MX-POST e QTag);
iii) Named Entity Recognition (NER).
b) Problemas com bom progresso:
i) Sentiment Analysis;
ii) Coreference Resolution;
iii) Word Sense Disambiguation (WSD);
iv) Parsing (Uso da ferramenta ANTLR);
v) Machine Translation (MT);
vi) Information Extraction (IE).
c) Problemas em aberto
i) Question Answering (QA);
ii) Paraphrase;
Ex: X acquired Y yesterday. Y has been taken over by X.
iii) Summarization;
iv) Carring on a complete human-machine communication in dialogue.
Implementação de aplicações que envolvem o uso de técnicas de PLN, considerando ajustes e adaptações para a língua portuguesa.
Apresentação de trabalhos.
- Discussão do plano de ensino
- Drive da disciplina: https://drive.google.com/drive/folders/1SxWS9gdl4mEw994p_jokL9gcOIQkHbQl?usp=sharing
Pré-processamento de textos: tokenização, normalização (stemming e lematização), remoção de stopwords, extração de padrões com expressões regulares (RegEx)
Representação de Texto: Bag-of-Words (BoW), TF-IDF, Word Embeddings (WE); Similaridade de cosseno e outras métricas
Classificação de textos: algoritmos tradicionais (Decision Tree, Naive Bayes e SVM); métricas de avaliação (acurácia, precisão, revocação, F1-score)
- 1a avaliação escrita e/ou trabalho prático
Redes Neurais para PLN: RNN, LSTM, BiLSTM
Modelos de Linguagem: Arquitetura Transformer e Modelos Pré-treinados (BERT, GPT e suas variantes); Conceito de Fine-Tuning
- 2a Avaliação escrita e/ou Trabalho Prático
Nenhum item foi encontrado
SIGAA | Superintendência de Tecnologia da Informação - STI/UFPI - (86) 3215-1124 | sigjb15.ufpi.br.instancia1 vSIGAA_3.12.1594 08/04/2026 17:49