转录因子(Transcription factor)是DNA转录成RNA过程中最重要的调控因子,参与并影响几乎所有的生物学过程。对转录因子进行准确识别、分类和注释是研究转录因子功能和基因表达调控的重要前提和基础。郭安源教授团队自2010年构建了动物转录因子数据库(AnimalTFDB),至今持续维护和更新了10多年。持续的更新、准确完善的数据和方便易用的界面使得AnimalTFDB成为国际上转录因子研究领域的权威资源,年访问量上百万次,总引用近700次。
2022年10月21日, Nucleic Acids Research杂志在线发表了生命学院郭安源教授团队的动物转录因子数据库第四版(AnimalTFDB 4.0)(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/)。华中科技大学生命科学与技术学院郭安源教授和华中科技大学同济医学院附属同济医院助理研究员胡慧为共同通讯作者,生命学院博士生沈文康和华中科技大学同济医学院附属协和医院博士后陈思义为该文章的共同第一作者。
图一文章信息
图二AnimalTFDB 4.0的工作流程
在最新发表的第四版AnimalTFDB中,作者鉴定、分类了183个动物中27万多个转录因子和15万多个转录辅因子,相比较前一个版本数据量有成倍增加。其中转录因子根据其DNA结合域被分成了73个家族,转录辅因子根据其功能被分成了82个家族。作者还对所有的转录因子和转录辅因子进行了详细的基因注释,包括:基因表型,相互作用,同源信息,转录因子结合位点,基因通路,翻译后修饰位点,自噬调控,基因突变及其在各种不同组织或者疾病中的基因表达等信息,为研究转录因子的功能和基因表达调控提供了丰富的资源。
AnimalTFDB提供许多实用的在线工具,包括转录因子预测(批量预测用户输入的序列是否为转录因子)、转录因子结合位点预测(批量预测DNA序列上的转录因子结合位点)和BLAST(可以将用户输入的序列和数据库中所有转录因子序列进行比对)。此外,新版的AnimalTFDB还增加了批量搜索的功能,用户可以上传基因或者蛋白列表从而对数据库进行批量搜索。
该研究得到了国家重点研发计划,国家自然科学基金,湖北省自然科学基金等项目的资助,同时计算工作得到了华中科技大学网络与计算中心高性能计算公共服务平台的支持。
参考文献:Wen-Kang Shen, Si-Yi Chen, Zi-Quan Gan, Yu-Zhu Zhang, Tao Yue, Miao-Miao Chen, Yu Xue, Hui Hu, An-Yuan Guo, AnimalTFDB 4.0: a comprehensive animal transcription factor database updated with variation and expression annotations, Nucleic Acids Research, 2022;, gkac907, https://doi.org/10.1093/nar/gkac907