Bolsa de Capacitação Técnica em Bioinformática

Technical Training fellowship in bioinformatics

Nº: 286

Área de conhecimento: Biologia Geral

Field of knowledge: General biology

Nº do processo FAPESP: 2011/07776-9

FAPESP process: 2011/07776-9

Título do projeto: Bioinformática para sequenciamento de alto desempenho

Project title: Bioinformatics for high-throughput sequencing

Área de atuação: Bioinformatica

Working area: Bioinformatics

Pesquisador responsável: Francois Marie Artiguenave

Principal investigator: Francois Marie Artiguenave

Unidade/Instituição: Faculdade de Ciências Médicas - Unicamp

Unit/Instituition: Faculdade de Ciências Médicas - Unicamp

Data limite para inscrições: 15/01/2012

Deadline for submissions: 2012-01-15

Publicado em: 14/12/2011

Publishing date: 2011-12-14

Localização: Faculdade de Ciências Médicas,,

Locale: Faculdade de Ciências Médicas,,

  • Resumo Summary

    No contexto do laboratório de bioinformática na Faculdade de Ciências Médicas da Universidade Estadual de Campinas, o candidato irá participar do desenvolvimento de um sistema de descoberta de mutação baseado em sequenciamento de tecnologias de nova geração, NGS. 

    Os objetivos serão a concepção e montagem dos processos necessários para o mapeamento de leituras no Genoma Humano, e para a identificação de SNPs ou Variações estruturais (SV), usando a última tecnologia de sequenciamento de dados (preferencialmente HiSeq mas o sistema deve ser capaz de gerenciar dados de outras tecnologias). 

    A segunda parte do trabalho consistirá na elaboração de um banco de dados (relacional ou modelo de Objetos), permitindo a integração de resultados experimentais com diversos recursos públicos abrangendo aspectos moleculares e genética de doença mendeliana. 

    Finalmente, as interfaces serão projetadas (com a ajuda dos geneticistas), para fornecer uma aplicação integrada, incluindo ferramentas estatísticas e de datamining para explorar e consultar os dados. 

    O candidato será envolvido nos seguintes tarefas: 1. Identificação, avaliação e validação de software disponíveis / bancos de dados. 2. Desenvolvimento de métodos para a manipulação, análise e interpretação de dados NGS no contexto da medicina genética. O objetivo específico será o de fornecer um método capaz de extrair e classificar as variantes de um conjunto de short reads obtidos a partir de um genoma humano. 3. Design de banco de dados e desenvolvimento. 4. Desenvolvimento da estratégia in silico para análise de dados: filtragem de variantes de acordo com as regras de mineração de dados. Estas regras serão configuradas para o caso de doença rara (identificação de variantes raras). 5. Extração de dados, utilizando os recursos disponíveis para investigar os mecanismos moleculares de patogenicidade, incluindo bases de dados de mutações do gene (OMIM) e patologia (dados clínicos e genéticos).

    DA BOLSA
    O candidato selecionado receberá financiamento pela FAPESP, sendo contemplado com uma bolsa de capacitação técnica (20 horas, TT-4), com duração até 12 meses.

    As inscrições deverão ocorrer por e-mail para o responsável François Artiguenave (francois@fcm.unicamp.br) no período de 15/12/2011 a 15/01/2012.

    Os candidatos deverão ser graduados, especialistas em Tecnologia de Informação (TI), com dois anos de experiência após a graduação ou título de mestrado na área de TI. No ato da inscrição por e-mail o candidato deverá apresentar: a) Histórico escolar da graduação; b) Link para o Currículo Lattes;

    A seleção do bolsista será realizada em duas etapas: a) Avaliação das documentações dos candidatos; b) Os candidatos habilitados serão chamados para uma entrevista (convocação será enviada por e-mail). O resultado será enviado por e-mail a partir do dia 01/02/2011.

    In the context of the bioinformatics laboratory at the Medical Sciences Faculty, Federal University of Campinas, the applicant will participate to the development of a mutation discovery system based on next generation sequencing, NGS technologies. 

    Objectives will be to design and setup the workflows required for the mapping of reads onto the Human Genome reference, and for the identification of SNPs (Single Nucleotide Polymorphisms) or genomics Structural Variations (SV), using the last sequencing technologies data (preferentially HiSeq but the system should be able to manage data from other technologies). 

    The second part of the work will consist in designing a database (Relational or Objects model) enabling the integration of experimental results (collection of SNPs) with diverse public resources covering molecular and genetics aspects of Mendelian disease. 

    Finally, interfaces will be designed (with the help of geneticists), to provide an integrated application including statistical and datamining tools to explore and query the data. 

    The applicant will be involved in : 1. Identification, evaluation and validation of publicly/commercially available software/data resources. 2. Development of methods for handling, analyzing and interpreting NGS data in the context of medical genetics research. The specific objective will be to provide a method able to extract and rank variants from a set of short reads obtained from a Human Genome. 3. Database design and development. 4. Development of the in silico strategy for data analysis: filtering variants according to data mining rules. These rules will be setup for the rare disease case (identification of rare variants). 5. Data extraction, using available resources to investigate molecular mechanisms of pathogenicity including gene mutations databases (OMIM) and pathology (clinical and genetical data).

    For more information, please contact the project coordinator Professor François Artiguenave (francois@fcm.unicamp.br) until January 15, 2012.