关于生物信息学

什么是生物信息学

生物信息学的价值

我们的优势

1.生物信息学是大数据科学
生物信息学是大数据科学,相比于人脸,指纹,语音,视频,文本等大家耳熟能详的处理数据,我们的数据来自于基因组,通过测序仪测序以“ACGT”字符串的形式存储。个人基因组的数据量大约为100G,而个人的指纹,掌纹数据量(KB级)远远小于个人基因组大小。因此,生物信息学要做的是对海量的字符串序列进行高效快速的检索,比对与分析。
2.生物信息学是算法密集型科学
面对PB级的海量数据的新挑战,我们要与时俱进构造适合大规模数据的数据结构,在原有哈希,后缀树,图索引的基础上不断创新,并创造分布式数据结构,内外存混合结构等。有了数据结构的支撑,对经典的动态规划算法,贪心算法,分治算法,搜索算法等进行优化改进以适应新的大数据需求。