IPN - Instituto Pedro Nunes

IPN     IPN Incubadora

IPN/LIS/2025/CON26

Reference

IPN/LIS/2025/CON26

Unit

Laboratório de Informática e Sistemas

Scientific Area

Engenharia Electrotécnica e Informática

Place of Performance

Instituto Pedro Nunes

Documents

Modelo de contrato de bolsa
Modelo de relatório final

Support

Apoios

Advisor

Marília Curado

Advisor Institution

Departamento de Engenharia Informática da FCTUC

Advisor category

Professor catedrático

Goals

O objetivo principal desta bolsa é investigar, desenvolver e integrar módulos de sistema de recomendação e de sistema de apoio à decisão na plataforma de processos participativos. O bolseiro será responsável por:

- Investigar e desenvolver mecanismos de recomendação baseados em análise semântica e processamento de linguagem natural, com o intuito de facilitar a colaboração e a convergência de propostas.

- Desenvolver e treinar algoritmos de PLN em múltiplos idiomas (português, espanhol e inglês) para os mecanismos de recomendação.

- Investigar e conceber mecanismos de apoio à decisão, incluindo modelos computacionais de múltiplos objetivos e avaliação de risco.

- Desenvolver interfaces gráficas intuitivas e mecanismos de geração de outputs automatizados para o sistema de apoio à decisão, incluindo uma interface dedicada a explainable AI (XAI).

- Integrar os módulos desenvolvidos na plataforma existente e participar na sua validação.

Entre os recursos públicos mais relevantes contam-se os dumps Open-Data do Metadecidim [1], conjuntos de dados diários de propostas e comentários que espelham fluxos reais de participação; o NYC Participatory Budgeting Projects [2], registo estruturado de textos, custos e estado de execução de projectos; o corpus multilingue OSCAR [3] sob CC0 para adaptação de modelos em PT/ES/EN; o ParaCrawl v9 [4], bitexto massivo alinhado para reforçar tradução automática e embeddings cruzados; o EuroParl [5], debates parlamentares limpos e alinhados entre 21 línguas da UE; o benchmark STS17 da SemEval-2017 [6] para avaliar similaridade semântica multilingue; o MovieLens-20M [7], matriz de classificações canónica para prototipar recomendadores híbridos; o Statlog German Credit [8] para demonstrações explicáveis de avaliação de risco; o ERASER benchmark [9], colecção multi-tarefa com justificações humanas a nível de excerto; e o e-SNLI [10], camada de explicações em linguagem natural sobre pares de inferência textual.

Referências
[1] Metadecidim Open-Data dumps, Metadecidim portal. meta.decidim.org
[2] NYC Participatory Budgeting Projects, NYC Open Data. data.cityofnewyork.us
[3] OSCAR Corpus, OSCAR Project. oscar-project.org
[4] ParaCrawl v9, ParaCrawl project. paracrawl.eu
[5] EuroParl Parallel Corpus, Statmt.org. statmt.org
[6] SemEval-2017 Task 1 STS17, ACL Anthology. aclanthology.org
[7] MovieLens-20M dataset, GroupLens Research. grouplens.org
[8] Statlog German Credit Data, UCI Machine Learning Repository. archive.ics.uci.edu
[9] ERASER Benchmark, ERASER Project. eraserbenchmark.com
[10] e-SNLI Dataset, arXiv. arxiv.org

Work Plan Area

Desenvolvimento de Sistemas Inteligentes de Recomendação e Apoio à Decisão para Processos Participativos

Work Plan

A bolsa será composta pelas seguintes fases de desenvolvimento:
1) Análise do estado da arte e requisitos: Aprofundamento do estudo sobre técnicas de NLP para tarefas de classificação/ categorização, extracção de informação e sobre sistemas de recomendação aplicados a processos participativos. Levantamento e detalhe dos requisitos para os módulos a desenvolver.
2) Conceção e especificação: Definição da arquitetura detalhada dos módulos de agregação e recomendação. Especificação dos algoritmos, modelos de dados e interfaces. Investigação e seleção das ferramentas e tecnologias a utilizar.
3) Desenvolvimento inicial e prototipagem: Início do desenvolvimento dos componentes nucleares dos módulos de agregação e de recomendação. Criação de protótipos iniciais para validação de conceitos e algoritmos. Preparação de datasets para treino e teste.
4) Implementação e Desenvolvimento Avançado: Desenvolvimento completo dos módulos de agregação e do sistema de recomendação, incluindo treino dos modelos de NLP e a implementação das interfaces gráficas.
5) Integração e Testes: Integração dos módulos desenvolvidos na plataforma principal. Realização de testes exaustivos para avaliar a funcionalidade, robustez, desempenho e precisão dos sistemas. Refinamento e otimização dos algoritmos e interfaces com base nos resultados dos testes.

Type of Internship

BI - Bolsa de Investigação

Amount

1040.98 €

Renewable

Sim

Payment method

Monthly

Duration

6 meses

Number of Internships

1

Recipients

Estudantes de mestrado, mestrado integrado, ou de outros cursos não conferentes de grau, que já tenham realizado os 180 créditos correspondentes aos primeiros 6 semestres curriculares de trabalho, na área de Engenharia Informática, Engenharia Física, Engenharia Electrotécnica e de Computadores, Física, ou áreas afins.

Documentation to deliver

a) Cópia de documento de identificação válido (Cartão de Cidadão ou Passaporte);
b) Curriculum Vitae do candidato;
c) Certificados de habilitações de todos os graus académicos obtidos, com média final e com as classificações em todas as disciplinas realizadas;
d) Comprovativo de inscrição num ciclo de estudos conducente a grau académico ou comprovativo de inscrição em cursos não conferentes de grau académico integrados no projeto educativo de uma instituição de ensino superior.

Announcement date

2025-09-04

Start date for applications

2025-09-19

Deadline for applications

2025-10-02