1-介绍
对gene的认识随时间的变化
本书对基因的理解
理解基因组织成染色体的关键是发现了遗传连锁:
同一染色体上的基因倾向于在后代中保持在一起,而不是像孟德尔原理所预测的那样独立分类。
在引入重组作为连锁的衡量标准后,遗传图谱的构建成为可能。
基因座之间的重组频率与基因座之间的物理距离成比例。
多细胞真核生物重组图谱的分辨率受到每次交配后获得的少量后代的限制。
重组很少发生在附近的点之间,以至于在同一基因的不同可变位点之间很少观察到。
因此,真核生物的经典连锁图可以将基因按顺序排列,但不能解析基因内可变位点的位置。
通过使用可以从每个遗传杂交中获得大量后代的微生物系统,研究人员可以证明重组发生在基因内,并且它遵循与基因间重组相同的规则。
2-DNA是原核和病毒
- 细菌转化提供了DNA是细菌遗传物质的第一个证据
- 经典实验:肺炎链球菌,小鼠,荚膜多糖,R型S型
- 噬菌体感染表明DNA是某些病毒的遗传物质
- 经典实验:T2噬菌体,P和S
3-真核
DNA可以将新的遗传特征引入动物细胞或整个动物
在某些病毒中,遗传物质是RNA
4-DNA链的结构
核苷酸的3个部分
- 碱基
- ATCG
- AUCG
- 糖
- 磷酸
结构
5-超螺旋
超螺旋:整条DNA的弯曲 topology
超螺旋只发生在没有自由末端的封闭的DNA中
封闭的DNA:环状or线形,末端固定
超螺旋的方向和双链螺旋的方向是否相同
- 相同:正超螺旋
- 相反:负超螺旋
DNA的拓扑操作是其所有功能活动的核心,所有涉及DNA双链合成活动都需要将双链分开
展开短的线性DNA是很简单的
但是通常染色体DNA不仅特别长,还和各种蛋白质锚定在一起,并不具有自由的末端,所以展开并不容易
如何解决呢?
- 在一条链中引入一个瞬时缺口
一个封闭的DNA有一个连接数L
一条链在空间中与另一条链交叉的次数
除了L之外都相同的DNA分子称为拓扑异构体
L由两部分组成
L=T(扭曲)+W(扭动)
- T:双螺旋结构本身的属性,表示双链的总匝数
- W:对应超螺旋的直观概念,松弛的分子W=0
经常关心的是L的变化
在们有蛋白质结合or其他闲置的情况下,DNA的扭曲不会发生变化
L更有可能是通过W产生变化
L的减少对应负超螺旋或欠卷
只有破坏和重组DNA骨架的键,才能改变L
6-DNA是双螺旋链
- 双螺旋的结构
- 直径是20A
- 相邻核苷酸之间的距离是3.4A
- 每34A一转
碱基配对:
氢键
原则:A-T,C-G
CG的比例可以描述DNA的特点
糖-磷酸骨架位于双螺旋外侧,在磷酸基团中带有负电荷
带正电荷的蛋白质在DNA中有组织作用
B型:DNA是两条反平行的多核苷酸链组成的双螺旋,右旋,顺时针
A型:也是右旋,更短厚
Z型:左旋
双螺旋有一个大沟和小沟
7-DNA半保留复制
半保留复制
两条链之间通过氢键连接,在不破坏共价键的情况下,就能分离
通过一个经典实验证明
8-聚合酶
D NA要复制,首先需要2条链分离。
双链的破坏是短暂的,随着子链双链的形成会被修复
在复制中的任何时刻,都只有一小段双链DNA变性
复制叉
- 分离亲本链的点
- 沿着亲本链移动
DNA聚合酶
- 合成DNA的酶
- 伴随着辅酶(解旋酶、引物引发酶等)
核酸酶是降解DNA的酶
- DNase(DNA)
- RNase(RNA)
包括内切的和外切的
- 内切:
- 破坏分子内单个磷酸二酯键
- 可能切一条链,也可能切两条链
- 外切:
- 从分子末端去除一个核苷酸残基,产生单核苷酸
- 只作用于单个链
- 参与修整反应
9-遗传信息可以由DNA或RNA提供
中心法则
不同生物基因组的代销有很大的差异m
10-碱基配对
加热会导致DNA双链的分离
Tm表示变性温度范围的中点
取决于GC含量,GC有3个氢键,更稳定
温度降低时,可以复性
变性、复性、杂交可以发生在DNA-DNA,DNA-RNA,RNA-RNA组合中
杂交能力是对两条链互补性的度量
可以通过UV吸光,测定杂交情况
11-突变改变DNA序列
所有突变都是DNA序列的变化
突变可以自发产生,也可以由诱导剂导致
自发突变的发生在不同物种之间有所不同,同一物种内组织类型之间也不同
突变是一种很罕见的时间
诱变剂:mutagens
影响:
- 修饰特定的DNA碱基
- 掺入核酸中
可以在不同级别的分辨率水平上对突变进行研究
- 整个基因组的突变
- 一个基因中的突变
- 特定核苷酸位点的突变
使基因功能失效的自发突变在噬菌体和细菌中发生的速率相对恒定
总体突变率受到选择性力量的影响
在极端环境中,并没有观察到显著的突变
12-突变影响单个的碱基对or更长的序列
点突变影响单个碱基
可能导致点突变的事件
- DNA的化学修饰,一个碱基变成另一个
- DNA复制错误导致错误的碱基插入其中
点突变的分类:
- 转换:嘧啶to嘧啶,嘌呤to嘌呤
- 颠换:嘧啶to嘌呤,嘌呤to嘧啶
插入or删除可以由转座因子的移动引起
点突变是改变个体基因的主要手段,短序列的插入也非常频繁
通常,插入是转座因子的结果
转座因子:能从一个位点转移到另一个位点的DNA序列
编码区的插入会破坏基因的活性,因为会改变阅读框
这种插入叫做移码突变
点突变和插入的显著区别:
诱变剂可以增加点突变的频率,但不影响转座的频率
13-突变的影响可以被逆转
正向突变改变基因的功能,反向突变(revertant)会逆转他们的影响
正向突变:使基因失活的突变
反向突变的类型:
- 真正的true reversion
- 原始突变的精确逆转
- 第二位点
- 发生在其他地方,可以产生补偿
反向突变必须将原始功能恢复喂改变的基因
- 插入可以通过删除恢复
- 删除不能恢复
抑制突变suppression mutation:
规避原始基因突变的影响
14-突变聚集在热点附近
突变的易感性与基因的大小成正比
那么一个基因内部所有碱基对突变频率相同嘛?
热点的频率高
其他碱基对的频率在一个数量级
自发突变通常发生在热点,不同诱变剂有不同热点
15-被修饰的碱基造成很多热点
自发突变的主要原因是DNA中存在一些不寻常的碱基
除了标准的ATCG,还有一些修饰的碱基
最常见的就是5-甲基胞嘧啶
热点的一个常见原因是修饰的碱基 5-甲基胞嘧啶,会自发脱氨基喂胸腺嘧啶
热点可能是由短的串联重复序列的不精确复制引起的
16-一些遗传部件非常小
一些非常小的遗传因子不编码多肽,而是由具有可遗传特性的RNA或者蛋白质组成。
类病毒Viroids是在某些植物中引起疾病的传染因子
是非常小的RNA环状因子,这种病毒仅由RNA分子组成
复制必须由宿主细胞的酶进行
类病毒会干扰正常的细胞过程
17-大多数基因编码多肽
一个基因-一个酶的假说总结了现代遗传学的基础:
一个典型的基因是一段编码单个多肽链的DNA
假说的实验依据:1940年的实验
一些基因并不编码多肽,而是编码具有结构or调节作用的RNA
编码序列中的许多突变会损害基因功能,并且对野生型等位基因是隐性的
大多突变都是隐性的,导致功能的消失
18-同一个基因中的突变不能互补
基因中的突变仅影响基因突变拷贝编码的产物,不影响其他等位基因编码的产物
两个突变未能互补(他们在杂合子中以反式构型存在时产生野生型表型)意味着他们是相同的等位基因
如何确定导致相似表型的两个突变是否发生在同一个基因中?
如果他们是在非常接近的位置(近的话重组的概率就低),他们就很有可能是等位基因。
但是也不能确定是等位基因,或许他们编码不同的蛋白质,但是这些蛋白质参与相同的功能。
互补测试
用于确定2个隐性突变是同一基因的等位基因,还是不同基因的等位基因。
测试内容:产生2个突变的杂合子观察表型
实验细节:
19-突变可能造成功能的损失或增加
隐性突变
多肽产物功能丧失
显性突变
功能的获得
测试一个基因是否对生存至关重要,需要一个无效突变(完全消除功能的突变)
同义突变没有对表型有影响,要么是因为碱基的变化没有影响多肽的序列or数量,要么是多肽序列的变化对最后的表型也没有影响
20-一个基因座可能又很多不同的突变等位基因
多个等位基因的存在,使得等位基因的组合有更多可能
不同功能丧失的突变等位基因具有不同的可变表型
21-一个基因座可能有多个野生型
🌰血型
22-重组通过DNA的物理交换产生
基因重组:
重组是减数分裂期间交叉的结果,涉及四分体中4个染色单体中的2个
在4个染色单体中,只有2个会发生重组
重组通过断裂和重聚发生,依赖于2条DNA链的互补性的异源双链DNA的中间体进行
在不损失材料的情况下,进行断开和重连,需要一种机制识别并在准确的对应位置对齐→碱基互补配对
即使存在微小差异,仍可以完美配对,异源双链DNA具有错配点
两个基因之间的重组频率与他们的物理距离成正比
对于相距很远的基因,重组的频率与物理距离就不成正比了,因为重组发生的非常频繁
23-密码子是三联的
每个编码蛋白质的基因编码一个特定的多肽链
DNA序列与相应多肽序列之间的关系被称为遗传密码
蛋白质的结构or活性的来源就是它的一级序列和整体构想
解释遗传密码的第一步是将DNA复制到RNA中。在任何特定区域,通常只有2条DNA链中的一条编码功能性RNA,因此遗传密码是碱基序列,而不是碱基对
🍉再某些情况下,两条链的某些区域都转录
三元组不重叠,从固定起点读取,编码序列的不同部分不能独立读取
- DNA 5’→3’
- 氨基酸序列 N→C
插入or删除单个碱基会导致移码突变
移码突变是由acridines诱导的(与DNA结合并扭曲双螺旋结构的化合物)
24-每一个编码序列都有3个可能的阅读框
由编码氨基酸的三联体组成的阅读框成为ORF
- 起始密码子AUG
- 终止密码子UAA,UAG,UGA
如果一个序列在所有3个阅读框中都是封闭的,就不能编码多肽
当得到一个未知够功能呢的DNA区域的序列时,可以分析每个可能的阅读框,确定是关闭的还是开发的。
通常3个可能的阅读框中只有一个被翻译,另外两个被频繁的终止信号关闭
长开放阅读框:该序列被翻译成多肽的初步证据
未鉴定出有蛋白质产物的ORF:URF
25-细菌基因和产物是共线性的
(也就是说没有内含子?)
该基因与其mRNA和多肽产物共线
共线:
基因中核苷酸序列是否与基因中的氨基酸序列完全对应
这种特性是在对大肠杆菌的实验中发现的
26-基因表达需要的几个过程
原核:
DNA → mRNA → Pr
真核:
还要有一个剪切的过程
mRNA的组成
- 非翻译的5’区
- 编码区
- 非翻译的3‘区
27-蛋白质是trans-acting但是DNA位点是cis-acting
所有基因产物都是trans-acting的
cis-acting突变识别作为反式作用产物识别目标的DNA序列。不以RNA或多肽形式表达,近影响连续的DNA片段