遗传学之父孟德尔在对八年植物杂交实验进行统计分析的基础上,通过推理提出生物的性状是由遗传因子决定的,由此产生了基因的雏形概念。1903年,美国学者萨顿发现孟德尔假设的一对遗传因子,它们的分离与减数分裂中同源染色体的分离非常相似,进而推论出基因就在染色体上。1909年,丹麦生物学家约翰逊将孟德尔的“遗传因子”起名为“基因”,但是他只提出了基因这一名词,并没有提出基因的物质概念。
1909年,摩尔根和他的学生们开始潜心研究果蝇的遗传行为,于1926年出版了巨著《基因论》,用实验证实了基因确实存在于染色体上,并进一步诠释了基因概念,即基因以直线的形式排列在染色体上,能发生突变,能随同源染色体交叉互换而进行重组,基因不仅是决定性状的功能单位,而且还是一个突变单位和重组单位,确立了“三位一体”的基因概念。至此,基因概念得到了极大的扩充和丰富,但是基因的物质结构和化学组成如何?基因是如何决定生物性状的?人们对此仍然一无所知。
20世纪中期,人们发现染色体主要是由蛋白质和DNA组成的,但对哪一种是遗传物质有着激烈的争论。1944年,艾弗里首次用肺炎双球菌转化实验证实:DNA是遗传物质的载体。1952年,赫尔希和蔡斯用噬菌体侵染大肠杆菌实验进一步证实了艾弗里的观点。1953年,美国生物学家沃森和英国物理学家克里克提出了DNA的双螺旋结构模型,进一步说明基因的本质是DNA,它控制着蛋白质的合成,从而决定生物性状。
1957年,本泽尔以噬菌体为材料研究基因内部的精细结构,提出了顺反子、突变子和重组子的概念,一个顺反子决定一条多肽,是基因的同义词,顺反子是可分的,组成顺反子的核苷酸可以独自发生突变或重组,由此产生了突变子和重组子的概念,同时挑战了摩尔根提出的“三位一体”的基因概念,即基因是决定性状的最小单位,但不是突变和重组的最小单位。
1961年,法国遗传学家雅各布和莫诺提出了大肠杆菌乳糖操纵子模型,又进一步丰富了基因概念,他们发现有些基因不编码蛋白质,只起调控其他基因表达活性的作用。至此,人们知道,基因是可分的,不仅体现在结构上,在功能上也可分为结构基因和调控基因。
20世纪70年代后,随着学科间的渗透和实验手段的更新,基因概念又有了进一步的发展,出现了重叠基因、断裂基因、转座子、假基因等相关概念。基因具有重叠性,两个或两个以上的基因共有一段DNA序列,基因的重叠不仅节约了碱基,能更有效地利用DNA遗传信息量,更重要的可能是参与对基因的调控。
基因由数个彼此相间隔的外显子和内含子构成,这样的基因称为断裂基因,断裂基因在真核细胞中具有普遍性,在进化中的意义可能是更有利于变异和进化,增加了信息量和重组几率,此外,基因中的内含子对基因表达可能有一定的调控作用。
某些DNA序列能够从染色体的一个位点转移到另一个位点,这样的序列称为转座子,复制型转座的转座子在原位点并不切离,而是将它的序列复制到新位点,这样在原位点和新位点都有转座子的DNA序列,转座子可以引起插入突变,使插入位置的基因失活或者出现新的基因,转座子也可以从原来位置上切离,准确的切离使发生插入突变的基因发生回复突变,不准确的切离则不发生回复突变。由于转座子的特殊功能,因而成为分子遗传学研究中一个有用的工具。
假基因与正常基因具有相似的序列,但是不编码功能性产物,不产生表现型。假基因在人、动植物、微生物中广泛存在,近期的研究认为假基因是生物进化的遗迹。例如,基因每重复一次形成的两个基因,分化趋异,有用的基因作为真基因发挥功能,没用的基因成为假基因。科学家预言,随着时间的流逝,假基因终将遭到淘汰而趋于消失。