人类的结构基因可分成以下几个部分:①编码区,包括外显子和内含子。②侧翼序列包括调控区、前导区和尾部区。调控区包括编码区上游(5’端)的启动子和增强子,以及其下游(3’端)的终止子等。前导区和尾部区分别为编码区外5’端和3’端的可转录的非翻译区。
1.外显子和内含子断裂基因中,编码序列被非编码序列所分隔。其中,编码序列称外显子(E),它是基因中可表达为多肽的部分;非编码序列称内含子(I),或插入序列(IVS)。
2.侧翼序列侧翼序列指第一个外显子和最末一个外显子外侧存在的非编码区,主要包含一些基因的调控序列,如启动子、增强子、终止子等结构。它们参与基因表达的调控。
(三)人类基因组结构
基因组指生物成熟生殖细胞(单倍体细胞)DNA分子上的全部基因总和。人类DNA分为核内DNA和线粒体DNA,所以,人类基因组包括细胞核基因组和线粒体基因组。
1.细胞核基因核基因组含有人类的绝大多数基因。这些基因分布在核内线状的DNA分子上,细胞分裂期则存在于染色体中。正常人类体细胞含两套染色体,为二倍体(2n),所以它们含有两个基因组。每个单倍体基因组约含3.2×109bp(碱基对)。按人类基因平均长度约1.3kb(千对碱基)计算,人类基因组约能编码2.5×106种蛋白质,而实际上人类大约只有10万(105)个编码蛋白质的结构基因,仅占整个基因组的4%。其余的DNA序列,包括基因内的插入序列、基因间的间隔序列以及重复序列等等。
2.线粒体基因组人类线粒体DNA(mtDNA)是存在于细胞质线粒体中的一种能自我复制、相对独立的小基因组。mtDNA是一个仅由16569个碱基对组成的环状双链DNA,只含37个基因,分别编码13种蛋白质、22种tRNA、2种rRNA。
mtDNA与核内DNA不完全相同,其结构排列非常紧密、高效。基因间隔很短,甚至无间隔。基因内无内含子序列,部分mtDNA的遗传密码与核内DNA的通用密码不同。每个细胞内mtDNA拷贝数多达几千。
基因组的大小通常用核苷酸碱基对数目来表示。比如,大肠杆菌DNA呈环状分子,含有4.7×1017碱基对。各物种中含碱基对最少的病毒SV40有5×103个碱基对,而最大的延龄草却含有1×1011个碱基对,最大与最小间竟相差8个数量级。以含碱基对的数量可以估算出DNA的实际长度,病毒SV40的DNA短于2μm;而延龄草中的DNA长度却达34m,其DNA含量比人体还多,但显然有大量结构基因不能表达。
三、染色质和染色体
染色质和染色体是细胞中重要的组成部分。在真核细胞中,染色质和染色体是一种由DNA、组蛋白、非组蛋白及RNA等组成的核蛋白复合物,是核基因的载体。它们是同一种物质在细胞周期的不同时期中所表现的两种不同存在形式。一般将细胞增殖周期分为细胞分裂期和细胞间期两大阶段。细胞间期又细分为G1期(间期1)、S期(合成期)、G2期(间期2)3个时期。在细胞间期细胞核中呈伸展(解螺旋)细丝状,易被碱性染料着色的核蛋白物质,称为染色质;在细胞分裂期,细丝状的染色质高度螺旋盘绕、折叠而缩短变粗,形成条状或棒状的特定形态,称为染色体。
(一)人类染色体
1.人类染色体的形态染色体的形态结构在细胞增殖周期中不断运动变化着,一般在有丝分裂中期,染色体的形态最典型、最清晰、最易辨认和区别,可用光学显微镜进行观察,常用于染色体研究及染色体病的诊断检查。
每一中期染色体都是由两条相同的染色单体构成,彼此互称为姐妹染色单体。两条染色单体在着丝粒处相连,类似X形。
2.人类染色体的数目每个物种不仅在染色体形态特征上具有其自身的特异性和相对稳定性,而且在染色体数目上也是如此。不同物种具有不同的染色体数目,同一物种染色体数目却是相对恒定的。这对维持物种的相对稳定性具有重要意义。染色体形态特征和数目是物种鉴定的重要标志之一。
在真核生物中,一个正常生殖细胞(配子)中所含的染色体数称为1个染色体组,其中所包含的全部基因称为1个基因组。具有一个染色体组的细胞或由这样的细胞组成的个体称为单倍体,以n表示。具有两个染色体组的细胞或个体称为二倍体,以2n表示。1956年证实了人类正常体细胞中染色体数为46条,即2n=46条,正常性细胞(精子或卵细胞)中染色体数为23条,即n=23条。不同生物的染色体数目不同。
3.人类染色体的核型和组型核型是指一个体细胞中的全部染色体,按其大小、形态特征顺序排列所构成的图像。通常,可通过显微摄影将一个细胞内的全部染色体照相放大,并将照片上的染色体一一剪下,按其大小、形态特征顺序配对,分组排列,所构成的图像即成核型图。对这些图像进行染色体数目、形态结构特征的分析称为核型分析。一般分裂中期的染色体作为分析的对象。在完全正常的情况下,一个细胞的核型一般可代表该个体的核型。如根据一个全体中一些正常个体许多细胞的核型分析,综合绘制而成的模式化核型图,称为染色体组型,它是指一个物种的染色体组成。
根据染色体的长度和着丝粒的位置,将人体细胞的46条染色体进行配对,顺序排列编号,其中22对为男女所共有,称为常染色体,编为1~22号,并分为A、B、C、D、E、F、G7个组,A组最大,G组最小。另一对随男女性别而异,称为性染色体。女性为XX染色体,男性为XY染色体。X染色体较大,为亚中着丝粒染色体,列入C组;Y染色体较小,为近端着丝粒染色体,列入G组。正常发育时,具Y染色体的个体发育为男性,无Y染色体的个体发育为女性。
正常女性核型描述为46,XX。正常男性核型描述为46,XY。在核型中每对染色体一条来自父方的精子,一条来自母方的卵子,在形态结构、大小上基本相同,称为同源染色体,而不同对的染色体彼此称为非同源染色体。
(二)染色质和染色体的分子结构
真核细胞染色质和染色体DNA和组蛋白(碱性蛋白)的含量比较稳定,两者的比率接近1∶1。而非组蛋白(酸性蛋白)的含量变动较大,常随着细胞生理状态的不同而改变,RNA含量很少。
一条染色体在复制前含有一条DNA双链分子。在复制后每条染色体由两条DNA双链分子构成,其中每条DNA双链分子分别构成一条染色单体。在正常人体二倍体细胞中具有46条染色体,长短不一,如将这46条染色体中DNA的长度相加起来,其总长度可达1.7m。这么长的DNA分子链,以及结合在这分子链上的许多组蛋白、非组蛋白等分子,在细胞分裂的间期它们是松散的丝状结构,即染色质是细丝状的、伸展开的。只是到细胞分裂期,松散的染色质才高度螺旋盘绕、折叠而变短变粗形成条状的染色体。其基本结构单位是核小体。每个核小体由核小体核心和连接丝组成,包括有200个碱基对(bp)的DNA链、8个组蛋白分子组成的八聚体及组蛋白分子H1。八聚体是由4种组蛋白H2A、H2B、H3和H4各两个分子组成。这些组蛋白分子互相挤在一起呈小圆盘状。146bp的DNA分子链绕在八聚体的小圆盘外,缠绕1.75圈。八聚体和146bp的DNA分子形成核小体核心。在两个相邻的核小体核心之间由50~60bp的DNA分子连接,称为连接丝,其长度变异较大,随细胞类型不同而不同,其上结合一个H1组蛋白分子。很多个核小体通过一条DNA分子串连起来,形成一条念珠状的纤维,直径为10~12mm,其上结合有非组蛋白和RNA等。研究发现有一类非组蛋白和H1结合,在螺旋化过程中起重要作用。这核小体串连的念珠状纤维为染色质(体)的一级结构。这条纤维的长度压缩为构成该纤维的DNA长度的1/7。
由核小体串连成的念珠状纤维进行螺旋盘绕,形成一条较粗短的中空螺线管,直径约为30nm。每周螺旋含有6个核小体,压缩为原来纤维长度的1/6。螺线管为染色质(体)的二级结构。由螺线管进一步螺旋盘绕,形成直径为400nm的超螺线管,压缩为原螺线管长度的1/40。这是染色质(体)的三级结构。超螺线管再螺旋化形成一条染色单体,压缩为原超螺线管长度的1/5,为染色质(体)的四级结构。总压缩程度(即包装率)为1/8400(1/7×1/6×1/10×1/5=1/8400)。
四、基因的功能
基因是DNA分子上的特定片断,基因的功能与DNA链上的核苷酸序列密切相关。基因的功能也就是DNA的功能。基因的基本功能包括三方面:①遗传信息的储存,反映在特定的核苷酸组合里。②遗传信息的扩增和传代,体现为DNA的自我复制以及在子代细胞中的再分配。③遗传信息的表达。DNA上的基因先转录成mRNA,再翻译成细胞内的蛋白质(酶),进而决定生物的性状。基因功能的实现,依赖于DNA复制、转录和翻译,可概括为遗传信息传递的“中心法则”。
(一)遗传信息的储存
生物性状由遗传物质DNA决定,控制性状的遗传信息通过DNA分子上的三联体密码表达。DNA上的3个相邻核苷酸构成一个三联体,决定多肽上的一个氨基酸,即特定的核苷酸三联体构成了遗传密码。DNA上有4种核苷酸,可组成43(64)种不同的三联体密码,或称密码子。其中61个密码子决定不同的氨基酸,另有3个密码子是终止信号,以DNA为模板转录出信息RNA(mRNA),mRNA多核苷酸链上的遗传密码中含有U(代表尿嘧啶核苷),若用DNA分子中的编码链表示,则应将U换成T(胸腺嘧啶核苷)。
(二)基因的复制
1.半保留复制基因的复制是伴随着DNA复制而实现的,DNA的复制方式为半保留复制。
首先,解旋酶松弛DNA超螺旋结构,解链酶解开DNA双链,然后每条单链各自作为模板,在引物酶催化下,按碱基互补原则(A-T、C-G),以游离的三磷酸脱氧核糖核苷为原料,在复制起始部位结合上互补的RNA引物,在DNA聚合酶和DNA连接酶作用下,在引物3’端后逐步合成出新的DNA互补链,其延伸方向为5’→3’,随后RNA引物被核酸酶切掉,DNA新链向5’端延伸并补上缺口,最终新合成的两条互补链分别与各自的模板链并列盘绕,形成稳定的DNA双螺旋结构。
上述过程中,两个新的DNA分子与原来的DNA核苷酸序列完全一样。每个子代DNA链中的一条链来自亲代,另一条链则是新合成的,所以称为半保留复制。研究证实,半保留复制是十分精确的,从而确保了遗传物质结构在世代相传中的稳定性。
2.参与复制过程的酶类
(1)DNA聚合酶它催化dNTP,通过碱基配对规律合成与模板互补的新DNA单链,因聚合要依赖原DNA模板,故又名DNA指导下的DNA聚合酶。
原核生物与真核生物中DNA聚合酶有几种类型,大肠杆菌中有DNA聚合酶I、II、III。DNA聚合酶I既有聚合酶作用,又有外切酶作用,所以具有绝对校正能力,可保证DNA复制的真实性。DNA聚合酶III活性大,速度快,是真正的复制酶。真核生物DNA聚合酶可分为α、β、γ、δ、ε五种,在核DNA复制中起主要作用的是DNA聚合酶α,相当于大肠杆菌的DNA聚合酶III。
(2)DNA拓扑异构酶、解链酶、DNA结合蛋白DNA双链沿一个公共轴旋转,解链也是沿相同的轴反向旋转。由于复制速度很快,这种旋转可达100次/s。高速的旋转势必造成下游打结现象,妨碍复制继续进行。拓扑异构酶的作用就是通过改变DNA分子的拓扑构象,从而克服打结现象。该酶广泛存在于原核及真核细胞内,分为DNA拓扑异构I型酶和II型酶两种。其作用是催化松弛超螺旋,复制完成后又可将DNA分子引入超螺旋,有利于DNA缠绕、折叠,最后组装成染色体。
DNA结合蛋白又称螺旋反稳定蛋白。它能和单链DNA紧密结合,结合后还使DNA有抗核酸酶水解的作用。因此,它可以保护稳定此单链,以利于发挥模板作用;它还可以与新合成的DNA单链结合,以保护其免受水解。
(3)引发酶和dnaB蛋白由于DNA聚合酶不能从头合成DNA,因此,在复制过程中,首先要合成一小段具3’-OH的RNA链作为引物。催化该引物合成的酶称为引发酶,又称引物酶,是一种特殊的RNA聚合酶。引物酶在模板的复制起始部位催化互补碱基的聚合,形成短片段的RNA。
(4)DNA连接酶DNA连接酶的作用与DNA聚合酶有一点相似,即催化磷酸二酯键的生成。连接酶连接DNA链的3’-OH末端和另一DNA链的5’-P末端,使二者生成磷酸二酯键,从而把两段DNA链连成完整的链。