【金沙澳门官网手机版】全世界你的我的他的基因,都在这个小平台里

EMBL-EBI有英国重要的生物信息数据库,可以帮助研究人员更有效的寻找到可靠的数据信息,生物信息学将原始序列数据转换为有意义的生物学信息的重要性也随之增长,农业基因组学研究在农业科学中发挥的引领作用将进一步增大

金沙澳门官网手机版 3

金沙澳门官网手机版 ,近日,英国宣布政府将投入4500万英镑支持位于剑桥的生物信息数据库,为药物发现、癌症遗传学、再生医学和农作物疾病预防等提供支撑。

试想一下,在一个平台上就能实现全球基因组数据的搜索和访问,是不是可以帮助研究人员轻松解决数据查找问题,从而提升基因组学研究的整体速度。

大量的蛋白质和核酸数据的积累与理性地分析这些数据中所蕴涵的生物学意义的双重需要,产生了综合生物学研究与计算技术研究等领域最新成果的交叉性学科“生物信息学”。概述蛋白质与核酸测序技术应用以来,已积累了极大量数据。同时,基于典型西方哲学演绎与解析的分析思路而建立的组合化学数据库已经成为合理分子设计(ra-tional
molecular
esign)的重要支柱,为创造全新的非自然产物提供了可能。所以,将新颖的计算技术与方法应用于经验和理论生物学研究的时代已经到来,生物信息学由此诞生。但生物数据的海量性和复杂性又都是组合化学等其他数据密集型科学所不及的,这也是生物信息学所面临的更大挑战。一般意义上,生物信息学研究生物信息的采集、处理、存储、传布、分析和解释等各个方面,它通过综合数学、计算机科学与工程和生物学的工具与技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。它作为一个交叉学科领域而荟萃了数学、统计学、计算机科学和分子生物学的科学家,目标就是要发展和利用先进的计算技术解决生物学难题。
这里所说的计算技术至少包括机器学习(machine learning)、模式识别(pattern
recognition)、知识重现(knowledge
representation)、数据库、组合学(combinatorics)、随机模型(stochastic
modeling)、字符串和图形算法、语言学方法、机器人学(robotics)、局限条件下的最适推演(constraint
satisfaction)和并行计算等。而生物学方面的研究对象覆盖了分子结构、基因组学、分子序列分析、进化和种系发生、代谢途径、调节网络等诸多方面。许多研究与发展组织都预测:基因组学研究将会彻底革新未来鉴定生物学产物和选择更佳目标用于小分子生物功能筛选的过程。
随着基因组研究规模扩大,生物信息学将原始序列数据转换为有意义的生物学信息的重要性也随之增长。生物信息学各个分支都亟待改进和提高的3个方面是:更加有效地处理大规模的数据、建立通用的智能型工具、使所有的操作程序自动化。生物信息数据库目前,国际性合作的几个基因组计划已经积累了超大量的生物信息并以不同组织形式构成许多数据库。其中一些属于商业数据库需要预先注册和付费才能检索,而更多数据库是公开和免费的并可通过互联网络(Internet)访问。
随着研究深入,公共数据库越来越成为世界各地生物学家的重要给养。美国国家实验室(Brookhaven
National Lab-oratory, BNL)的蛋白质数据库(Protein data bank,
PDB)可同时提供蛋白质序列及其三维空间晶体学原子坐标。超文本版本的细胞系数据库(Hypertext
ver-sion of the cell line data base,
HyperCLDB)专门提供欧洲各家实验室和捐献站的人和动物细胞系的信息,已有3100种以上的品系。OWL混合蛋白质序列数据库(Composite
protein sequences
databas-es)是一非重复蛋白质序列数据库。欧洲分子生物学实验室(European
Molecular Biology Laboratory,
EM-BL)的TREMBL是对Swiss-Prot蛋白质序列数据库的增补,含有EMBL核酸序列数据库中尚未出现于Swiss-Prot的所有编码区(CDS)的翻译序列,可以看作是Swiss-Prot
的前言部分,今后都可能升级到标准Swiss-Prot
中。与生物催化和生物降解相关的数据库站点UM-BBD,即Minnesota大学生物催化和生物降解数据库(University
of minnesota biocataly-sis/biodegradation
database),提供关于微生物酶与代谢通路的信息;Eco-Cyc,即大肠杆菌基因和代谢百科全书(Encyclo-pedia
of Escherichia coli Genes and
Metabolism),是一个汇集了所有已知的关于大肠杆菌基因和中间代谢的数据的大型知识库;GenoBase
Selkov EMP,是GenoBase数据库通道(GenoBase Database
Gateway)中一个经过索引的、关于酶与代谢通路(Enzymes and Metabolic
Pathways)的数据;KEGG,日本的基因和基因组京都百科全书(Kyoto Encyclopedia
of Genes and
Genomes),内容包括代谢通路图谱、分子编目表、基因编目表、基因组图谱等数据;Swiss-Prot,是带有注释的、具有最小冗余的、与其他数据库的整合度很高的蛋白质序列数据库;
WIT (What is
there),是一个基于最近的关于细菌全基因组序列的足够了解、在WWW上设计实现的交互式代谢重构模型。基因组导航者(Genome
navigator)是提供到达含有关于人类基因组、鼠基因组和酵母基因组等的物理图谱和遗传图谱信息的主要数据库的视化的交互式通道。它使用基于Java小控件(applet)的通用性程序DerBrowser来显示和导引这些生物的多种不同类型的基因组图谱。IUBio档案是一个生物数据和软件的档案库,囊括了各种各样的大众化的浏览、检索和传输软件、分子数据、生物学新闻和文件,其互联网地址是iubio.bio.in-diana.edu
(magpie 129.79.225.200)
。生物计算就目前的数学和计算机科学的能力而言,对数据容量达到上十亿字节的数据库进行生物计算仍然是一项很艰巨的任务。理论上有希望的、通过量子化学算法预测蛋白质的空间折叠的方法靠现有的计算能力尚无法成为现实,
因此需要数学与纯计算机效能上的新突破。大分子设计和模建算法让曾经致力于分子力学和分子模型构建的应用数学家、物理学家、化学家和生物学家走到了一起。现在的重点和挑战在于如何获得高增益、高效率、高可信度的蛋白质、核酸和多聚体的模拟算法。分子图形和模型学是生物信息学和药物设计的重要部分。先是可在本地的个人机或工作站上运行的生物计算软件和程序,下一部分侧重于通过互联网络的在线计算。日常数据维护,为生命科学研究人员实现全方位计算能力的软件工具Prophet
5.0,提供适合于数据管理和视化、包括从简单描述性的统计处理到多元方差分析(Multi-factor
ANOVA),logistic回归和非线性模型分析等多种统计分析。序列对齐,基于“近似字符串匹配(Approxi-mate
string matching)”算法的Cleanup
1.8能够确定从核苷酸序列数据库中指定的任何一对序列间的整体同源性,并自动从冗余数据库中生成一组纯化的无冗余的核苷酸序列集萃。

会议简介:测序技术的普遍使用使得基因组学在基础科研、医学健康和农业生产中发挥的作用越来越大。在现代农业生产中,基因组学技术对于种质资源选育、品种改良、产量提升等方面的影响也进一步凸显。未来,农业基因组学研究在农业科学中发挥的引领作用将进一步增大,并将整体提升农业领域的竞争力。为加强农业基因组学领域的学术交流,本次大会将邀请农业基因组学研究领域的优秀专家学者进行学术报告。

位于剑桥的欧洲生物信息研究所(EMBL European Bioinformatics
Institute,EMBL-EBI)是全球重要的生物信息数据库,是英国最重要的生物信息基础设施,每天有来自全球科学家近4000万条的访问需求,在推动基因组学和分子生物学前沿研究方面发挥关键作用。此4500万英镑投资将增加该中心的计算、存储和共享能力。

英国剑桥的Repositive就是这样一个免费的在线平台。Repositive集结了来自全球各地的基因数据资源,用户通过这个平台就可以实现数据资源的搜索和访问。

(作者为军事医学科学院放射医学研究所研究人员
本文由傅萱整理,未经本人审阅)

主办单位:青岛农业大学园艺学院、安诺优达生命科学研究院

EMBL-EBI有英国重要的生物信息数据库:

金沙澳门官网手机版 1

承办单位:安诺优达基因科技有限公司

——Human Cell
Atlas,人类细胞图谱,是世界上第一个映射人体每个细胞的数据平台。科学家通过此平台能够确定哪些与疾病相关的基因在我们的身体的哪个部位活跃。

这样一个操作简单且轻松的平台,可以帮助研究人员更有效的寻找到可靠的数据信息,不仅能够帮助研究人员节省下大量数据挖掘的时间,还能帮助把这些数据的价值发挥到最大。

会议时间:2019年10月26日9:00-17:00

——UK
Bio-Bank,英国生物银行,收集了英国50多万名志愿者的健康数据,旨在为疾病预防和治疗提供基础生物信息。

Repositive创始人兼CEO Fiona
Nielsen毕业于南丹麦大学,曾是illumina的生物信息科学家,她认为精准医学的成功与否,实际上取决于数据信息的价值。因此,她认为Repositive所做的信息挖掘工作,将有可能改变基因组学研究的现状。

会议地点:学术会馆第一报告厅

此笔资金来自英国研究与创新署(UKRI)的战略重点基金(Strategic Priorities
Fund)。该基金支持政府的高质量研发优先事项。英国政府承诺到2027年将研发资金提高到GDP的2.4%。

挑战:数据访问是主要瓶颈

专家简介:

UKRI首席执行官表示:我们处理大数据的能力对于21世纪的科学发现至关重要,特别是在基因组学和分子生物学领域中正在推动的健康和生命科学方面。这笔资金将使EMBL-EBI继续保持其在大型生物数据库和生物信息学领域的全球领导地位。

在生物制药领域,无论是大型企业还是小公司,通过基因组学数据去评估药物风险和药物开发价值是必不可少的一步。这一步,基因组学数据是基础,这需要寻找到大量的基因组学数据集进行统计。如何获得及时且有效的数据资源,对这些公司来说非常重要。

胡松年,中国科学院微生物研究所,研究员,博士生导师。国际人类基因组计划中国部分总工程师。胡松年课题组所构建的四个物种基因组以及注释信息作为NCBI参考序列,被国际相关研究广泛采用。带领课题组完成水稻基因组精细图,登上Science封面。主持和参加国家重点研发计划、中国科学院先导专项、国家自然科学基金面上项目、科技部973计划、科技部863计划等多项科学研究。共发表SCI文章311篇,总引用量达到26410次。主编《基因组数据分析手册》,《基因表达序列标签数据分析手册》,《转录组学与精准医学》。因自然科学研究的突出贡献,享受国务院政府津贴;荣获中国科学院朱李月华优秀教师奖;浙江省科学技术一等奖;中国科学院优秀教师奖;河北省科学技术进步三等奖;中国科学院杰出科技成就集体奖;香港求是科技基金求是杰出科技成就集体奖。任中国遗传学会基因组学专业委员会副主任委员;中国康复技术转化及发展促进会精准医学与肿瘤康复专业委员会副主任委员;中国康复技术转化及发展促进会“高血压精准防治十万人队列计划”首席基因组学专家;中国科学院大学生命科学学院教学督导委员会委员;北京乳腺病防治学会转化医学专业委员会委员;遗传、BMC
Research Notes、Frontiers in Plant Genetics and Genomics、Nature Reviews
Genetics (Chinese Edition)编委;Genomics, Proteomics
Bioinformatics执行副主编。

背景信息:

然而,对基因组学数据研究人员来说,这些数据的查找和访问令人头疼的问题。全球领域开展了基因组学研究不计其数,一方面积累了丰富的数据资源,但另一方面,这些丰富的资源也给信息的查找带来了挑战:这些资源要如何访问?找到访问入口后要如何从海量的信息中查找到自己想要的信息?

梁承志,博士,中国科学院遗传与发育生物学研究所研究员。于1995年从中科院遗传所获得遗传学博士学位,并于2001年从加拿大滑铁卢大学获得数学与计算机科学硕士学位。2001-2012先后在加拿大生物信息公司,美国冷泉港实验室和国际水稻所从事生物信息研发工作。主要研究领域包括基因组组装和注释、比较基因组和群体基因组进化分析,及生物信息数据库和软件开发。最近工作包括构建水稻蜀恢498、小麦乌拉尔图、苦荞、金鱼草等多个高质量植物基因组和比较基因组分析;发展了一个利用三代单分子测序来构建高质量基因组的组装方法,分析了中国栽培稻群体基因组,并开发了一个水稻群体基因型到表型数据库。工作发表在Nature,、Science、Nature
Genetics、Nature Comm、Genome Res、NAR、Molecular
Plant、Bioinformatics等。

英国是EMBL(欧洲分子生物学实验室)的创始成员之一,EMBL是一个非盈利的政府间组织,成立于1974年,其经费来自26个成员国(包括欧洲和以色列的大部分国家)和两个准成员国(阿根廷、澳大利亚)。

无疑,在这样的模式下,信息查找是非常繁琐、费时的工作。

宋卫宁,西北农林科技大学农学院教授,博士生导师;旱区作物逆境生物学国家重点实验室遗传资源与基因方向主任。澳大利亚阿德莱德大学博士学位。主要从事麦类分子生物学、基因组学与遗传改良,以及植物逆境基因组学与植物起源驯化研究。在Science、PNAS、Nature
Communication、Genome Biology、Plant Biotechnology
Journal等国际学术期刊发表SCI论文数十篇,拥有多项国际专利。

EMBL-EBI是EMBL的6个站点之一,是生物信息库的全球领导者,支持多项大规模科学计划,例如:英国生物银行(UK
BioBank)从50万名志愿者那里收集基因组和健康数据;人类细胞图谱(Human
Cell Atlas)将绘制人体中的每一个细胞;地球生物基因库(Earth
BioGenome)旨在表征地球上所有真核生物多样性的基因组。

Nielsen从事过一些学术和商业研究工作,这种糟糕的经历她有过不少次。做了几年研究工作后她发现,基因组学临床解读的瓶颈其实并不在分析算法和设备上,而是缺少一个真正准确可靠的数据资源和查找方案。

孙伟,博士,中国中医科学院中药研究所副研究员,中药生物技术研究中心中药材鉴定及药用成分合成途径挖掘研究室副主任。毕业于中国科学院大学植物学专业,获得理学博士学位。作为课题负责人承担了国家自然科学基金、重大新药创制、科技部研发专项等科技项目4项,在Scientific
reports、Frointer in plant science、Annals of botany、Planta、Plos
one、IJMS、Journal of experimental botany、Molecular
Plant等杂志发表论文20余篇,主要研究方向:中药材鉴定及药用成分合成途径挖掘。

UKRI的战略重点基金(Strategic Priorities
Fund),旨在推动高质量的多学科和跨学科研究与创新的发展,确保UKRI的资助与政府确定的研究重点有效关联,并确保研发系统能及时响应战略重点和机遇。

金沙澳门官网手机版 2

张玉军,博士,中国中医科学院中药研究所研究员,中药生物技术研究中心副主任。1998年毕业于北京大学,2003年获中国科学院上海生命科学研究院博士学位,后被聘为副研究员,在国家基因研究中心开展水稻基因组研究,2006-2011年在桑格研究所做博士后。主要从事动植物基因组学和分子遗传学研究,在DNA测序技术、基因组结构变化、生物信息学等领域有深入的研究,作为主要完成人获上海市科技进步一等奖、中国科学院首届优秀博士学位论文奖、国家自然科学二等奖等奖励。在Nature系列杂志发表论文7篇。主要研究方向:药用植物基因组学;新测序技术在中药研究中的应用;医学分子遗传学等。

【金沙澳门官网手机版】全世界你的我的他的基因,都在这个小平台里。Repositive创始人兼CEOFiona Nielsen

【金沙澳门官网手机版】全世界你的我的他的基因,都在这个小平台里。张忠华,青岛农业大学,教授,博士生导师。入选中组部“万人计划”科技创新领军人才和青年拔尖人才,获“中国青年科技奖”,第二完成人获2018年国家自然科学二等奖,第一完成人获2018年中国农业科学院青年科技创新奖。中国园艺学会分子育种分会秘书长、青年分会常务理事,Journal
of Integrative Agriculture (JIA)、Horticultural Plant
Journal等期刊编委,中央国家机关青联委员,全国青联常委。在Nature、Science、Cell等期刊共发表SCI论文42篇,累计影响因子超过400,共被引用6000余次。主持国家重点研发计划课题1项,2013年获国家自然科学基金委“优秀青年”科学基金项目,主持国家自然科学基金面上项目3项,主持国家973和863计划子课题。

2013年12月,Nielsen做了个决定,她从illumina辞职,成立了慈善机构DNAdigest。Repositive就是DNAdigest的一个产品,希望通过帮助科研人员轻松实现基因组学数据的查找和访问,以加速基因组学研究。

杨效曾,北京市农林科学院,博士,研究员,北京市特聘专家。美国弗吉尼亚大学获得博士学位,先后在世界500强企业美国陶氏化学任项目主管和高级项目主管,北京市农林科学院第一批海外引进青年英才,北京农业生物技术研究中心组学平台负责人,入选北京市“海聚工程”青年项目。主要从事基因组学、生物信息学、表观遗传学和遗传育种方面的研究,曾获得留学基金委颁发的优秀自费留学生奖,主持陶氏化学重点研发项目多项。Frontiers
in plant science杂志编委,在Nature Plants、Nucleic Acids Research、Plant
Journal、Bioinformatics等期刊发表SCI论文多篇,拥有多项国际专利。

“我不是一个成功的科研人员。”Nielsen承认,“但我想我能做点其他的,让有能力的科研人员做的更好。”

【金沙澳门官网手机版】全世界你的我的他的基因,都在这个小平台里。张晓军,中国科学院海洋研究所实验海洋生物学重点实验室研究员。2001年获中国科学院海洋研究所海洋生物学博士学位,2006至2008年美国Texas
AM大学访问学者,博士后。主要从事海洋生物基因组学、遗传学、细胞生物学和基因工程等方面研究。构建了凡纳滨对虾和栉孔扇贝BAC文库及栉孔扇贝物理图谱;参与了火鸡基因组计划,作为主要研究骨干完成了对虾和海参基因组测序和组装,并开展了海洋生物基因组结构和进化分析以及功能基因开发与利用研究。主持国家重点研发专项和863课题2项,国家科学自然基金5项,参与国家级课题十余项。在Nature
Communications、PLoS Biology、BMC Genomics等杂志上发表SCI论文70余篇。

解决方法:数据资源整合

【金沙澳门官网手机版】全世界你的我的他的基因,都在这个小平台里。邵长伟,博士,中国水产科学研究院黄海水产研究所研究员。主要从事鱼类遗传资源开发与分子育种研究,作为主要完成人之一完成我国第一个鱼类基因组测序计划。担任国家重点研发计划项目首席科学家、国家产业技术体系岗位科学家。入选国家万人计划科技创新领军人才和青年拔尖人才,中国青年科技奖,科技部中青年科技创新领军人才等。先后在Nature
Genetics、Genome
Research等发表SCI论文60余篇(ΣIF240),上述论文被Cell,Science,Nature
Reviews Genetics等SCI引用2000余次。担任Frontiers in
Genetics等期刊编委。主持国家自然科学基金优秀青年基金等项目10余项,获中华农业科技奖、山东省科技进步奖等成果奖励6项。

很多人想知道,在这样一个数据资源整合平台建立之前,科研机构是如何实现资源访问的呢?现实中的科研工作并非像电影里那么炫酷,更多的是日复一日的试验,记录,重复。数据查找和访问更是份枯燥且繁琐的苦差。

祝光涛,云南师范大学,教授,博士生导师,2018年获云南省青年千人人才。2015年博士毕业于中国农业科学院,2015-2018年在中国农业科学院深圳农业基因组研究所从事博士后研究。近几年来,其利用基因组学的方法研究番茄群体的变异和驯化历史,并结合遗传学、分子生物学等技术手段揭示了番茄风味、营养物质的遗传与调控机制。近五年,以第一作者在国际著名学术期刊Cell、Science、Nature
Genetics、Annual Review of Plant
Biology上发表4篇重要论文,论文他引用次数超过300余次。番茄风味研究成果获Cell等杂志的专评,被评为2018年中国农业十大科技进展。番茄多组学研究揭示了遗传变异-基因表达-代谢物含量的三向关系,阐明育种如何改变了番茄果实代谢组获Cell专评,被Nat
Rev Genet评价为“对育种如何影响基因组、转录组和代谢组的一次综合检验”。

事实上,目前各家数据资源的标准都不一样。而要使用这些数据,首先要做的就是资源整合,把各家标准统一,工作量非常大。其次,全球范围类的数据集合那么多,要挨个去查找是极其麻烦的。如果要把所有的数据库都扒一遍,即便是HGNC、OMIM以及Uniprot这些明星科研机构的科学家们,恐怕也得皱一皱眉。

这就造成了两个现象:一是数据查找和访问花费了研究人员大量的时间和精力;二是即使信息无处不在,但许多信息其实是被闲置的。

Repositive则可以一劳永逸的解决这些问题。通过Repositive,用户可获得多个知名的基因数据库的访问权限,这其中包括全球知名的数据库,比如1000人基因组计划和基因表达图谱(Genome
Expression
Atlas);还有爱沙尼亚生物中心、GenomeAsia100K这些鲜为人知的数据源;甚至还包括了InSilico
DB 和 Xpressomics这样的企业数据。

目前,Repositive平台上已经集结了全球范围内超过100万个数据集,数据量每个月都在扩大。Nielsen透露,他们的目标不仅仅是公共的数据资源,同时还要把世界各地的大型数据库,科研机构、公司以及公益项目的数据也吸收进来。

据了解,Repositive已经与阿斯利康、默克以及未因生物等制药巨头和生物公司达成合作,将共同建立一个支持肿瘤研究的协同数据库。该项合作的目的是为从PDX模型到特定环境的肿瘤研究,提供数据发现和访问的入口。

金沙澳门官网手机版 3

【金沙澳门官网手机版】全世界你的我的他的基因,都在这个小平台里。(PDX模型:The Patient derived
xenograft,是一个功能强大的癌症研究模型,被广泛应用于药物发现和临床药物研究)

【金沙澳门官网手机版】全世界你的我的他的基因,都在这个小平台里。通过这样一个数据平台,受益最大的就是精准医学领域。精准医学根据个人的遗传背景来寻找适合的治疗方法,对疾病基因层面的认识是基础。要从基因层面认识疾病,没有强大且可靠的基因组数据资源,是无法实现的。

除了惠及各地的基因组学研究人员,Repositive也将为数据提供方带来福利。通过Repositive,他们可以扩大自己数据资源的影响力,同时还能获得更多的资源,推进科研研究。

在保证患者和数据捐赠者权益的前提下,Repositive希望向更多的研究人员提供数据访问解决方案,以此将这些信息的价值最大化。

下一步,Repositive还希望像研究人员提供更多具有人口多样性特点的数据,以保证研究结果的准确性和全面性。截止到2016年,Repositive已累计获得融资1200万美元。