מהם מאפייני הגנים?
גן הוא רצף DNA, שממנו יכולה להיווצר מולקולת RNA. חלק מן הגנים מקודדים למולקולות RNA המתורגמות לחלבונים, הקובעים את התכונות בתא אחד או ביצור השלם.
רצפי DNA שהם גנים דומים מאוד לרצפי DNA שאינם גנים, וקשה מאוד להבחין ביניהם. קשה בערך כמו לחפש דוב לבן שאבד בקוטב הצפוני. אבל לפחות יש לנו מושג איך דוב לבן נראה. מישהו יודע איך גן "נראה"? להלן מדריך מפורט לזיהוי גנים המקודדים לחלבונים:
רצף DNA, שהוא גן המקודד לחלבון, מורכב משני אזורים, שלכל אחד מהם תפקיד ייחודי בתהליך יצירת החלבון:
אזור אחד בגן הוא אזור מבני – אזור זה מכיל את הרצף המקודד (cds, coding sequence), שממנו מתועתקת מולקולת mRNA שתעובד ותתורגם בשלב הבא לחלבון.
אזור נוסף בגן הוא אזור בקרה – אזור זה מכיל רצף שאינו מקודד. הרצפים באזור זה קובעים אם גן יתועתק (כלומר, אם תיווצר ממנו מולקולת RNA) ובאיזו מידה. לרוב נמצא אזור הבקרה לפני האזור המבני. באזור זה מזהים שני רצפי DNA קצרים, שאליהם נקשרים חלבונים הקשורים לתעתוק. שני האתרים הייחודיים באזור הבקרה הם:
- אתר מקדם (Promoter): רצף ב-DNA שאליו נקשרים האנזים המתעתק RNA- פולימראז וחלבונים נוספים, היוצרים ביחד את תצמיד התעתוק. המקדם מכיל רצף של מספר נוקלאוטידים מסוג T ו- A המכונה TATA BOX, הממוקם בין רצפים ארוכים של הנוקלאוטידים GC, שנקראים גם איי GC.
- אתר מעצם (Enhancer): רצף ב-DNA שאליו נקשרים חלבונים גורמי תעתוק ייחודיים היכולים להגביר את התעתוק של הגן, כך שמהגן ייווצר mRNA.
מאפיינים של הגן הקשורים בתעתוק
האנזים RNA -פולימראז נע על גבי ה-DNA עד שהוא מגיע אל אתר מקדם באזור בקרה של הגן. באתר זה ניתן האות לתחילת התעתוק של האזור המבני בגן. האנזים מתעתק את החלק המבני שהוא הרצף המקודד של הגן כרצף אחד.
תעתוק הגן נמשך עד לרצף שמסמן עצירה, והאנזים מפסיק את הארכת שרשרת ה- mRNA.
לאחר התעתוק עובר ה-mRNA עיבוד וחלקים ממנו נחתכים אל מחוץ למולקולת ה-mRNA, עוד לפני שהוא עוזב את הגרעין. החלקים שנחתכו והוצאו מה-mRNA נקראים אינטרונים. החלקים שנותרים (המקודדים בסופו של דבר לחלבון) נקראים אקסונים. רצף ה-DNA באינטרון, בנקודת החיבור עם האקסון, הוא קבוע.
מאפיינים של הגן שקשורים בתרגום
ה-mRNA המעובד שיצא לציטופלסמה מתורגם לחלבון על הריבוזומים. האות לתחילת התרגום, מ-mRNA לחלבון, ניתן על ידי הקודון AUG המקודד לחומצה האמינית מתיונין (Met). לכן בתחילת האזור המקודד בקטע ה-DNA שבו מצוי הגן, צריך להופיע הקודון ATG. האות לסיום התרגום ניתן על ידי אחד משלושת קודוני העצירה: UAA, UAG,UGA (הקודונים TAG או TGA או TAA בקטע ה-DNA המקודד בהתאמה).
מכיוון שכל שלושה בסיסים הם קודון לחומצה אמינית אחת, מספר הנוקלאוטידים המפרידים בין הקודון לתחילת התרגום ובין הקודון לסיומו חייב להתחלק ב-3.
שלושת הבסיסים מקודון תחילת התרגום ועד לקודון הסיום נקראים מסגרת הקריאה של הגן. במסגרת זו נקראים בכל פעם שלושה קודונים על ידי הריבוזום, בלי לדלג. גם אם בתוך הרצף יש קודון לסיום, אבל הוא חורג ממסגרת הקריאה, כך שלדוגמה, בסיס אחד שלו שייך לשלשה קודמת ושני הבסיסים האחרונים לשלשה הבאה – הוא לא יזוהה על ידי הריבוזום ולא תהיה עצירה בתרגום.
בעזרת המאפיינים שתוארו ניתן לאתר מיקום של גנים בגנום. באזור החשוד כגן צריכים להופיע רצפים שמאפיינים אזור בקרה בגן ורצפים שמאפיינים אזור מבני בגן, רצף שמאפיין תחילת תעתוק, רצף שמאפיין סיום תעתוק, רצפים שמאפיינים נקודות חיבור בין אקסונים ואינטרונים וכן רצפים המסמנים תחילת תרגום וסיום תרגום בתוך מסגרת קריאה.
אם המאפיינים האלה מופיעים ברצף ה-DNA, ייתכן שיש גן באזור.