Bolsa de TT-IV-A em Engenharia de Dados

Level 4A-Technical Training Fellowship in Data Engineering

Nº: 4187

Área de conhecimento: Ciência da Computação

Field of knowledge: Computer science

Nº do processo FAPESP: 2020/05895-0

FAPESP process: 2020/05895-0

Título do projeto: Sistema de Perguntas e Respostas para o Domínio Econômico Financeiro

Project title: A Question Answering System for Financial Economic Domain

Área de atuação: Engenharia de Dados

Working area: Data Engineering

Quantidade de vagas: 1

Number of places: 1

Pesquisador principal: Valdirene Fontanette

Principal investigator: Valdirene Fontanette

Unidade/Instituição: Itera Inteligência Artificial

Unit/Instituition: Itera Inteligência Artificial

Data limite para inscrições: 29/03/2021

Deadline for submissions: 2021-03-29

Publicado em: 18/03/2021

Publishing date: 2021-03-18

Localização: Rua José Bonifácio, 565 – sala 11, São Carlos

Locale: Rua José Bonifácio, 565 – sala 11, São Carlos

E-mail para inscrições: contato@itera.com.br

E-mail for proposal submission: contato@itera.com.br

  • Resumo

    O plano de trabalho tem como foco a construção de uma base de dados semântica com notícias de jornais e revistas on-line. Para tal, o bolsista irá realizar estudos de viabilidade do uso de páginas web para montar uma base de notícias confiáveis, seguido da construção de crawlers para as páginas web selecionadas, capturando informações para a construção da base de dados semântica. Em seguida, o bolsista vai estudar, definir e implementar um método para extrair respostas da base com técnicas de Deep Learning, usando a abordagem extrativa.

    Perfil

    - Experiência de quatro anos após a graduação na área de TI.;
    - Experiência Python (2 anos);
    - Experiência banco de dados (relacional e não relacional) Elastic Search, Mongo, Postgresql;
    - Experiência na construção de APIs;
    - Experiência na construção de crawlers.

    Principais atividades

    - Desenvolver métodos sistematizados para a captura de notícias em jornais e revistas digitais;
    - Construir base de dados semântica;
    - Pesquisar, explorar e avaliar métodos de extração de conhecimento em documentos para formular e inferir respostas automaticamente;
    - Desenvolver, manter e estruturar códigos Python;
    - Code review de colegas de time.

    Infos adicionais

    - Home Office.

    Mais detalhes sobre perfil e condições da Bolsa FAPESP TT-IV-A em https://fapesp.br/3098 e https://fapesp/3162.