Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição
Currently there are several tools proposed for analysis of Transcription Factors (TF), such as TFCheckpoint, JASPAR, SSTAR, GTRD, Enrichr. However, none of these tools offer a complete experience in assessing the reliability of TF, checking if an analyzed protein is a TF and its association with...
Na minha lista:
Autor principal: | |
---|---|
Outros Autores: | |
Formato: | Dissertação |
Idioma: | por |
Publicado em: |
Brasil
|
Assuntos: | |
Endereço do item: | https://repositorio.ufrn.br/jspui/handle/123456789/25393 |
Tags: |
Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
|
id |
ri-123456789-25393 |
---|---|
record_format |
dspace |
institution |
Repositório Institucional |
collection |
RI - UFRN |
language |
por |
topic |
TFAT Fatores de transcrição Genes alvo Grau de confiabilidade Ferramenta web Análise de enriquecimento CNPQ::OUTROS: BIOINFORMÁTICA |
spellingShingle |
TFAT Fatores de transcrição Genes alvo Grau de confiabilidade Ferramenta web Análise de enriquecimento CNPQ::OUTROS: BIOINFORMÁTICA Silva, Lucas Felipe da Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição |
description |
Currently there are several tools proposed for analysis of Transcription Factors (TF), such as
TFCheckpoint, JASPAR, SSTAR, GTRD, Enrichr. However, none of these tools offer a complete
experience in assessing the reliability of TF, checking if an analyzed protein is a TF and its association
with the target gene. Over time, numerous databases were built, all of them with rich information, but
the intrinsic complexity of the data, the volume of information, problems of nomenclature of the genes
and several other factors led these tools to do not offer a complete spectrum of analyses. On the other
hand, working with a large volume of data requires advanced computer skills. However, the general
public interested in analyzing these data are professionals from the biological areas, forming a barrier
since the academic formation of this area does not offer in its curricular components programming
disciplines. From this situation, this work aims to create a web tool exclusively for the analysis of TFs.
In this way, the Transcription Factor Analysis Tools (TFAT) was conceived and developed, containing
the integration of different databases and a set of scripts to manipulate this information, along with the
crucial parameters defined by the user in the analysis. The core of this tool is the analysis to identify
the key TFs in the modulation of gene transcription, namely the enrichment of the regulatory TFs of a
user-submitted gene list, which through the components of the tool, consults its database, identifies
the TFs that are associated with those genes and computes the p-value of enrichment. In addition, the
tool verifies TF reliability, makes available predictions, and converts items from a list to the Entrez
Gene's GeneID or Symbol. Another feature of this work is the use of TF reliability applied throughout
the tool. This degree of reliability takes into account evidences from different databases, experiments,
predictions and other characteristics of TFs. This reliability feature has a standard mode and a userdefined
parameter mode, which allows full customization through filters in the queries and analysis
control for the end user. |
author2 |
Souza, Jorge Estefano Santana de |
author_facet |
Souza, Jorge Estefano Santana de Silva, Lucas Felipe da |
format |
masterThesis |
author |
Silva, Lucas Felipe da |
author_sort |
Silva, Lucas Felipe da |
title |
Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição |
title_short |
Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição |
title_full |
Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição |
title_fullStr |
Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição |
title_full_unstemmed |
Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição |
title_sort |
integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição |
publisher |
Brasil |
publishDate |
2018 |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/25393 |
work_keys_str_mv |
AT silvalucasfelipeda integracaodedadosedesenvolvimentodemetricasescalavelparaanalisedefatoresdetranscricao |
_version_ |
1773961173912256512 |
spelling |
ri-123456789-253932019-01-30T17:41:23Z Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição Silva, Lucas Felipe da Souza, Jorge Estefano Santana de Dalmolin, Rodrigo Juliani Siqueira Figuerola, Wilfredo Blanco TFAT Fatores de transcrição Genes alvo Grau de confiabilidade Ferramenta web Análise de enriquecimento CNPQ::OUTROS: BIOINFORMÁTICA Currently there are several tools proposed for analysis of Transcription Factors (TF), such as TFCheckpoint, JASPAR, SSTAR, GTRD, Enrichr. However, none of these tools offer a complete experience in assessing the reliability of TF, checking if an analyzed protein is a TF and its association with the target gene. Over time, numerous databases were built, all of them with rich information, but the intrinsic complexity of the data, the volume of information, problems of nomenclature of the genes and several other factors led these tools to do not offer a complete spectrum of analyses. On the other hand, working with a large volume of data requires advanced computer skills. However, the general public interested in analyzing these data are professionals from the biological areas, forming a barrier since the academic formation of this area does not offer in its curricular components programming disciplines. From this situation, this work aims to create a web tool exclusively for the analysis of TFs. In this way, the Transcription Factor Analysis Tools (TFAT) was conceived and developed, containing the integration of different databases and a set of scripts to manipulate this information, along with the crucial parameters defined by the user in the analysis. The core of this tool is the analysis to identify the key TFs in the modulation of gene transcription, namely the enrichment of the regulatory TFs of a user-submitted gene list, which through the components of the tool, consults its database, identifies the TFs that are associated with those genes and computes the p-value of enrichment. In addition, the tool verifies TF reliability, makes available predictions, and converts items from a list to the Entrez Gene's GeneID or Symbol. Another feature of this work is the use of TF reliability applied throughout the tool. This degree of reliability takes into account evidences from different databases, experiments, predictions and other characteristics of TFs. This reliability feature has a standard mode and a userdefined parameter mode, which allows full customization through filters in the queries and analysis control for the end user. Atualmente há diversas ferramentas propostas para análise de Fatores de Transcrição (TF), tais como TFCheckpoint, JASPAR, SSTAR, GTRD, Enrichr. No entanto, nenhuma dessas ferramentas oferece uma experiência completa, em que se possa avaliar a confiabilidade do TF, ou seja, se de fato uma proteína analisada é um TF e a sua associação com o gene alvo. Ao longo do tempo, foram construídas inúmeras bases de dados, todas elas com riquíssimas informações, porém a complexidade intrínseca do dado, o volume de informações, problemas de nomenclatura dos genes e diversos outros fatores fizeram com que tais ferramentas não oferecessem um espectro completo da análise. Por outro lado, para se trabalhar com um grande volume de dados, se requer conhecimentos avançados de computação. Entretanto, o grande público interessado em analisar esses dados são os profissionais procedentes das áreas biológicas, configurando-se como uma barreira, uma vez que a formação acadêmica desta área não oferece em seus componentes curriculares disciplinas de programação. Diante desta situação, este trabalho tem como objetivo criar uma ferramenta web destinada exclusivamente para análise dos TFs. Desse modo, foi idealizado e desenvolvido o Transcription Factor Analysis Tools (TFAT), contendo a integração de diferentes bases de dados e um conjunto de scripts para manipular estas informações, juntamente com os parâmetros cruciais definidos pelo usuário em sua análise. O cerne desta ferramenta é a análise para identificar os TFs chaves na modularização da transcrição gênica, ou seja, o enriquecimento dos TFs reguladores de uma lista de genes submetida pelo usuário, que através dos componentes da ferramenta, consulta sua base de dados, identificam os TFs que estão associados aos genes da lista e calcula o p-valor de enriquecimento. Além disso, a ferramenta verifica a confiabilidade do TF, disponibiliza as predições realizadas e converte os itens de uma lista para o GeneID ou Symbol do Entrez Gene. Outro recurso presente neste trabalho é a utilização da confiabilidade do TF aplicado em toda a ferramenta. Esse grau de confiabilidade leva em consideração evidências de diferentes bases de dados, experimentos, predições e outras características dos TFs. Este recurso de confiabilidade possui um modo padrão e um modo com parâmetros definidos pelo próprio usuário, que permite toda uma personalização por meio de filtros nas consultas e controle de análise para o usuário final. 2018-06-13T22:36:09Z 2018-06-13T22:36:09Z 2018-03-28 masterThesis SILVA, Lucas Felipe da. Integração de dados e desenvolvimento de métricas escalável para análise de fatores de transcrição. 2018. 82f. Dissertação (Mestrado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2018. https://repositorio.ufrn.br/jspui/handle/123456789/25393 por Acesso Aberto application/pdf Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA |