表2 大腸菌発現プロモーターのコンセンサス配列 | ||
プロモーター | -35 region | -10 region |
コンセンサス配列 | TTGACA | TATAAT |
lacUV5 | TTTACA | TACAATG |
tac | TTTACA | TTTAATG |
λPL | TTGACA | ATAAT |
lac | TTTACA | TATGTT |
trp | TTGACA | TTAACTA |
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2015/10/02 01:22:13」(JST)
この項目では、生物学用語について説明しています。興業師については「実業家」をご覧ください。 |
プロモーター(Promoter)とは転写(DNA からRNA を合成する段階)の開始に関与する遺伝子の上流領域[注釈 1]を指す。プロモーターに転写因子が結合して転写が始まる。
主に大腸菌の研究からプロモーターの中でも特に保存されている部分的配列(配列要素 element )が明らかになった[注釈 2]。これらの配列要素はRNAポリメラーゼが実際に結合する領域(大腸菌の場合60bp)にはない[1]。
転写開始点は90%以上の場合でプリン塩基である[1]。CATという塩基配列の中央であることが比較的多いが、よく保存されているとは言い難い。
真正細菌のプロモーターにはRNAポリメラーゼを強力に引き寄せる2つの仕組みがある。一つは転写開始点から35bp(35塩基対)上流にある-35ボックス -35 box (-35領域 -35 region または-35配列 -35 sequence とも)、もう一つは10bp、より正確には-18~-9上流[1]の-10ボックス -10 box (-10領域 -10 region または-10配列 -10 sequence とも当初は発見者のデビット・プリブノー David Pribnow にちなんでプリブノーボックス Pribnow box とも呼ばれていた[2])だ[注釈 1]。2つは15~19nt [3]、例外的に長いもので20nt離れる[1]
現在、数千ものプロモーターが調べられ、これら各ボックスにおける典型(共通配列、コンセンサス配列 consensus sequence )が明らかになっている。共通配列とは現れる頻度の顕著な塩基配列であり、下図1に示す。図2に、各構成塩基ごとの存在する確率を記す。各ボックスが共通配列に完全に一致すると転写開始は劇的に頻発するだろう。実際には一致する例は少ないが、類似度合いの大きさがプロモーターの強さ(転写の頻度)となる。実際、各ボックスを典型に近づける突然変異は優勢変異 up mutation といい、プロモーターを強力にして転写開始を促す[2]。逆に、類似性を下げる変異である劣勢変異 down mutation を受けたプロモーターは弱い[2]。劣性変異の様相は受けるボックスによって変わり、-35ボックスの場合は閉鎖型複合体を形成する速度を減少させる[4]。-10ボックスでは、閉鎖型複合体に問題はないがそこから開放型複合体になるのは遅い。このことから-35ボックスはRNAポリメラーゼに認識される部位、-10ボックスは二重らせんをほどくのに重要な部位だと考えられている。
例外的に、一方または両方のボックスを持たないプロモーターも存在する[4]。この場合、補助因子がRNAポリメラーゼの認識を助ける。また、両ボックス以外の、最初に転写される+1~+30の領域もRNAポリメラーゼとDNAの結合の安定性に影響する[4]。
大腸菌の中には、-35ボックスの代わりにいわゆる「延長した-10ボックス」を持つものもいる[5]。この配列とRNAポリメラーゼとの間の接触が-35ボックスの欠如を補う。例として、ガラクトース代謝に関与するgal 遺伝子群がある。
このほか、-10ボックスのすぐ下流にRNAポリメラーゼと結合する弁別要素 discriminator が発見された。酵素とプロモーターの作る複合体[注釈 3]の安定性に影響を与える。 プロモーターの各要素は サブユニットの一つであるσ因子と結合してRNAポリメラーゼを誘導する。どのように結合するのかはRNAポリメラーゼ#σ因子に詳述している。
上流 プロモーター mRNAに転写される領域 下流 5'----------|TTGACa(-35)|---------|TAtAaT(-10)|----------------------|T|------------3' 3'----------|AACTGt(-35)|---------|ATaTtA(-10)|----------------------|T|------------5' |転写開始点 |---------------------> mRNA 図1.プロモーター配列と転写開始位置の位置関係 by『ウィーバー 分子生物学第4版』p140 出現頻度が50%以上の塩基は大文字で、以下のものは小文字にして示す。 T; ターミネーター -10; -10ボックス -35; -35ボックス
-10ボックス:T(80)A(95)T(45)A(60)A(50)T(96) -45ボックス:T(82)T(84)G(78)A(65)C(54)A(45) 図2.-10ボックスと-35ボックスの共通配列および各塩基の存在確率 by『遺伝子第8版』p233 確率の百分率を各構成塩基の右に()内で記す。
コアプロモーターエレメント core promoter element という、-10ボックスも-35ボックスも含む極めて強いプロモーターには、さらに上流にUPエレメント UP element または上流要素 upstream element と呼ばれる特殊な塩基配列を含むものがある。これはαサブユニットに特異的に結合することで、転写開始段階において外れやすいRNAポリメラーゼのDNAとの結合を強化する[5]。たとえば、大腸菌にはrRNAをコードする7個の遺伝子(rrn gene )があるが、これらにはUPエレメントが存在する。結果、増殖など大量のrRNAが必要なときには7個のrrn geneだけで細胞中の転写の大部分を占める。そのうちの一つrrnB P1遺伝子はUPエレメントにより転写頻度が40倍増強されるという[2]。
-60 -50 -40 -30 -20 -10 +1 | | | | | | | 5’----T[CAGAAAATTATTTTAAATTTC]CTC[TTGTCA]GGCCGGAATAACTCCC[TATAAT]GCGCCACCACT---3' UPエレメント -45ボックス -10ボックス 図3.rrnB P1 プロモーターの概略 by『ウィーバー 分子生物学第4版』p140
rrn geneのプロモーターを制御するのはその塩基配列だけではない。開始NTP(iNTP)とグアノシン5'二リン酸3'二リン酸(ppGpp)の2つの小さな分子も外部から制御を行う[6]。iNTP存在下は転写産物の材料であるヌクレオチド濃度が高いようだ。INTPは開放型プロモーター複合体を安定化することで転写開始を促す。一方、細胞内のアミノ酸濃度が低く、タンパク質合成がしにくいときはrRNAの合成も必要なくなる。リボソームはアミノ酸を持たないtRNAが結合すると、アミノ酸の不足を感知する。すると、RelAというリボソーム関連タンパク質が警告を受け、ppGppを合成する。警告 alarm からppGppをアラーモン alarmone と呼ぶ。開放型プロモーターをさらに不安定にし、転写を抑制する。
真核生物の場合、真正細菌プロモーターの-10 領域に相当する、5'-TATAAA-3' の共通配列を持つ領域(TATAボックス、あるいは、ゴールドバーグ・ホグネスボックス (Goldberg-Hogness box) と呼ばれる)が-25 あるいはさらに上流に存在する。転写開始位置はこのTATA ボックスが決定している場合が多い。
この他、-100~-60 の範囲に存在する5'-CCAAT-3' の共通配列を持つ領域(CAAT ボックスと呼ばれる)や、-60~-40 の範囲に存在する5'-GGCGGG-3' の共通配列を持つ領域(GC ボックスと呼ばれる)がよく知られているが、これらは転写の促進に働いていると考えられている。
真核生物の場合、RNAポリメラーゼには3つの種類があり、Pol I、Pol II、Pol III と呼び分けられる。転写開始に必要となる因子、プロモーター領域の配列、転写の様式はそれぞれ異なる。それぞれが担当する遺伝子のプロモーターについて次の各項にて紹介する。
また、同じく転写開始を制御しながら転写開始点からとても離れたエンハンサーもある。プロモーターと同様に機能する配列を持ち、またプロモーターに結合するタンパク質と相互作用する。プロモーターとエンハンサーの違いはむしろ便宜的で、どちらに分類しても差し支えのない配列もある。
クラスIプロモーター class I promoter がコードするのはrRNA前駆体だけだ。例外として、トリパノソーマという原核生物で発見された2種類の遺伝子はRNAポリメラーゼIによりタンパク質を発現する[7]。そのため、1つのゲノムに何百とあるがその配列は全く同じ。しかし、生物種ごとの多様性は、配列要素をいくつも持つクラスIIプロモーターよりはるかに大きい。保存された配列は転写開始部位を囲むATが豊富なイニシエーター initiator:rINR だけしか確認されていない[注釈 2][7]。
2つの離れた領域からなり、その一つのコアプロモーター core promoter は転写開始点の周辺-45~+20にある[7][8]。rINR近くの配列を除くと、プロモーター中配列としては珍しくGCに富む。もう一つは-180~-107に位置する上流プロモーター配列 upstream promoter element:UPE だ[7][9]。どちらもGCに富む配列により転写効率を左右する[9]。取りうる塩基配列は幅広いものの、2つの配置は多くの真核生物で共通する。これらの領域を発見した錢澤南 Robert Tjian らはリンカースキャン変異導入解析を用いてヒトにおける2つの距離の重要性を証明した[7]。間の塩基配列をわずか16bp取り除いただけで、プロモーター活性は野生型の40%まで低下した。44bpならたったの10%に落ち込んだ。一方、28bp長くしても活性に変化はなかった。49bpまで加えて70%になった。プロモーター効率はDNAの除去に大きな影響を受けるようだ。
クラスIIプロモーター class II promoter は2つの配列から構成されている。その一つであるコアプロモーター core promoter はふつう40~60bpほどの大きさである[10]。4つ以下に細分化されており、-33位を中心に存在するTATAボックス TATA box[注釈 4]、そのすぐ上流のTFV IIB認識エレメント TF IIB recognition element:BRE、転写開始部位を中心とするイニシエーター initiator:Inr、さらに下流に下流プロモーターエレメント downstream promoter element:DPE のいくつかを含む[注釈 5]。DPEはさらに細分化され、同名のDPEのほか、下流コア配列 downstream core element:DCE、モチーフ10配列 motif ten element:MTE がある[10]コアプロモーターは基本転写因子と結合し、RNAポリメラーゼに与える[注釈 3]。一方、クラスIIプロモーターのもう一つの要素は上流プロモーターエレメント upstream promoter element:UPE (上流制御配列 upstream control element とも)で、転写開始に関与するほかの転写因子が結合する。次の項で各エレメントを詳しく紹介する。
RNAポリメラーゼIIは伝令RNA(mRNA)前駆体のヘテロ核RNA(hnRNA)と少数の核内低分子RNA)(snRNA)を転写する。
BRE TATA Inr DCE I DCE II DPE DCE III ---[(GGG/CCA)CGCCC][TATA(A/T)A(A/T)]---//---[(CC/TT)AN(TCC/ATT)]-[CTTC]----[CTGT]-------[(A/G)G(A/T)CGTG][AGC]--- TF2B TBP TF IID TF IID TF IID TF IID 図4.一般的なクラスIIプロモーター by『ワトソン 遺伝子の分子生物学』p397 上にプロモーターの配列要素の略称を、下に結合する基本転写因子を示す。[]の中は共通配列である。MTEは示さなかったが、 DPEのすぐ上流にある。
TATAボックスはクラスIIプロモーターの中でもっともよく研究されている。 原核生物の-10ボックスと相同だと考えられているが、10bp上流にある-10ボックスに対して25~30bp上流と、転写開始部位からの距離に大きな違いがある。非鋳型鎖[注釈 6]において共通配列TATAAAを含み、高等真核生物では右端のAが転写開始部位の25~30bp上流にある[11]。通常、この後にさらにAかTが続き、GCに富む配列に囲まれていることが多い[12]。共通配列には多くの例外があり、ウサギのβグロビン遺伝子の場合にはグアニンやシトシンが混ざっている[11]。始まりもTATAではなくCATAだ。また、特化遺伝子[注釈 7]には必ずTATAボックスはあるが、ないプロモーター(TATAレスプロモーター TATA-less promoter )もしばしば存在し、全プロモーターの50%かそれ以上である可能性が示唆されている[12]。これらには次の2種類でよくみられる[11]。
TATAボックスの役割は細胞により異なる。 クリストファー・ブノア Christopher Benoist とピア・シャンボン Pierre Chambon らの実験では、SV40の初期遺伝子で転写開始部位を正確に決定することを明らかにした[13]。これはTATAボックスからの距離に準拠し、開始部位の配列を本来から変えても転写開始に支障はない。また、この以前の1981年にTATAボックスを欠損させても、起点はバラバラになるが、やはり開始頻度は減少せずにむしろ増えることが確認された[11]。TATAボックスの一部は転写効率を調節しない。
一方で、スティーブン・マックナイト Steven Mcknight とロバート・キングズバリ Robert Kingsbury らはヘルペスウイルスのチミジル酸合成酵素がそのTATAボックスを除去することで大いに転写されにくくなることを発見した[13]。リンカースキャン変異導入解析でプロモーター全体から選んだ10bpを別の配列に置換した結果だ。もっともプロモーター活性が低くなった変異体(LS-29/-18)は、TATAボックス内のGCATATTAがCCGGATCCになったものだ[13]。このような遺伝子では発現にTATAボックスは必須である。
イニシエーターは高効率の転写に必要な、開始部位周辺の-3~+5位に存在する保存配列である[12][注釈 2]。哺乳類の共通配列はPyPyAN(T/A)PyPyで、ショウジョウバエはTCA(G/T)T(T/C)だ[14]。ここでPyはピリミジン塩基(CまたはT)、Nは不特定、そして下線付きAが転写開始点を示す。アデノウイルスの主要後期プロモーターに存在するイニシエーターはTATAボックスとともにあり、その下流のあらゆる遺伝子を(非常に弱くだが)活性化させる[14]。また、これは上流プロモーターエレメントやエンハンサーの影響を受けやすい。哺乳類の末端デオキシヌクレオチドトランスフェラーゼ(TdT)遺伝子はTATAボックスも上流プロモーターエレメントもないが、イニシエーターだけでその内部の転写開始部位から基本的な量を発現できる。このことを発表したスティーブン・スメール Stephen Smale とデイビッド・ボルチモア David Baltimore はSV40から移植したTATAボックスまたはGCボックスでこの遺伝子の転写を強く増幅できることも発見した[14]。
下流プロモーターエレメント(DPE)はショウジョウバエのゲノムに非常に多い。2,000年にAlan Kutach と James KadonagaはTATAボックスと同頻度に存在することを確認した[14]。これらは転写開始部位より約30bp下流にあり、共通配列はG(A/T)CGである[15]。
DPEはTATAボックスが欠損したとき、その機能を補う。実際にショウジョウバエでは、DPEがあるTATAボックス欠損プロモーターは数多い。2つは類似点が多く、ともにTF IIDという重要な基本転写因子と結合する。
重要な基本転写因子であるTF IIBが結合するためのプロモーター配列。共通配列は(G/C)(G/C)(G/A)CGCCである[15]。
クラスIIIプロモーター class III promoter は転写開始の過程をその構造により3つに分ける。
の三つの様式に分かれる。いずれも転写因子の認識配列だけを有するが、3つを次の各項で紹介する。
↓中間エレメント I型 --0--------------========---====----========----------- ボックスA ボックスC II型 --0------------========---------------========--------- ボックスA ボックスB III型 --======----//----========----------========----0------ DSE PSE TATAボックス 図5.3つのクラスIIIプロモーター * 0は転写開始部位
I型 クラスIIIプロモーターとは5S rRNA を発現するプロモーターである。最大の特徴は遺伝子の内部で働くことだろう。ドナルド・ブラウン Donald Brown はケニアツメガエル Xenopus borealis の5S rRNA遺伝子から世界で初めてクラスIIIプロモーターを解析したが、その結果は50~83位上流に存在するという驚くべきものだった。上流から欠失させていくと+55位まで、下流からなら+80位まで転写は影響を受けない[9]。しかし、これを踏み越えると転写は全く起きなくなるのだ。このプロモーターはRNAポリメラーゼIを自身の上流から転写を始めさせる[注釈 8]。その後、ロバート・ローダー Robert Roeder らがボックスA box A、中間エレメント intermediate element、ボックスC box C というI型プロモーターの3領域を発見した[16]。
ボックスAは基本転写因子のTF IIIAと、ボックスCはTF IIICと結合する。これには順番があり、まずTF IIIAから続いてTF IIICが来る。これらは構築因子と言われ、2つがそろうと転写開始点にTF IIIBが結合して転写は始まる。
II型クラスIIIプロモーターは tRNAやVA RNAなどの遺伝子といった、ほとんどのクラスIIIプロモーターに該当する。I型同様遺伝子の内部に存在する。I型の同名領域と酷似するボックスAとボックスB box B を持つ[17][18]。2つの距離はまちまちだが、普通あまり短すぎると機能を失う[18]。
AボックスにTF IIICが結合することでTF IIIBが転写開始点に結合する。
ほかの2つと異なり、III型は遺伝子上流にある。ヒト7SK RNAやヒトU6 RNAなどの核内低分子RNA(snRNA)を発現させる。1985年にElisabetta Ulluとアラン・ウィーナー Alan Weiner が7SL RNA遺伝子から発見したが、そのときの実験では、この領域の除去は転写効率を50~100分の1まで低下させた[17]。ただし、まったく転写されなくなるわけではないので、内部にII型プロモーターも含んでいると考えられる。このことから、ヒトゲノムにおいて何百もある7SL RNA偽遺伝子やそれに関連するAlu配列はあまり転写されない理由が考え出された[17]。これらには高頻度の転写に必要なIII型プロモーターがないのだろう。
III型プロモーターだけを持つ一つの例は7SK RNA遺伝子だ。この事実に気づいたマリアルイサ・メッリ Marialuisa Melli らは、-37位から下流なら欠損させても転写のレベルを維持できることを証明した[19]。この遺伝子をはじめ、U6 RNA遺伝子やEBER2遺伝子などはII型プロモーター同様にTATAボックスを持つという特徴がある[注釈 9]。実は、TATA結合タンパク質(TBP)はクラスIIプロモーターだけでなく、クラスIとクラスIIIの転写にも関与する。ほかにオクタマー octamer、近位配列因子 proximal sequence element:PSE と呼ばれる配列を含む。転写開始はTATAボックスだけを含む短い領域で行われるが、2つの配列が加わると転写効率は劇的に増す[20]。
プロモーター - 脳科学辞典
この節の加筆が望まれています。 |
この項目は、生物学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています(プロジェクト:生命科学/Portal:生物学)。 |
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
リンク元 | 「プロモーター領域」「発癌プロモーター」「初期プロモータ」「rRNAプロモーター」「ミドルプロモータ」 |
拡張検索 | 「プロモーター挿入仮説」「腫瘍プロモーター」「発がんプロモーター」「上流プロモーター要素」 |
関連記事 | 「プロ」 |
.