שיפור באחסון מידע: כל היוטיוב בכפית DNA

החיבור בין תחום הטכנולוגיה לתחום הביולוגיה הוליד יישומים שימושיים ומחקריים רבים. ענף הביוטכנולוגיה מסייע להתקדמות מדעית המקדמת את המין האנושי לפיתוחים מעוררי הערכה במגוון היבטים רפואיים אולם תחום זה אינו מוגבל רק לפיתוחים בעולם הרפואה. כך לדוגמה השימוש בטכניקות אחסון מידע דיגיטלי בדי אן איי DNA.

מדענים מהטכניון ומהמרכז הבינתחומי בהרצליה הדגימו פרימת דרך שיפור משמעותי ביעילות התהליך הנדרש לאחסונו של מידע דיגיטלי ב- DNA דנ”א. המדענים הדגימו  אחסון מידע בצפיפות השקולה לאחסון של יותר מ-10 פטה-בייט (מיליון גיגה–בייט) בגרם בודד אחד של DNA וזאת באופן שמדגים תהליך הכתיבה יעיל במיוחד. לשם המחשה, צפיפות זו מאפשרת, באופן תאורטי, לאחסן בנפח של כפית את כל המידע השמור ב-Youtube.

כל היוטיוב בכפית DNA: קפיצת מדרגה משמעותית באחסון מידע

כמות המידע הדיגיטלי גדלה במהירות עצומה מאז המצאת ההארד-דיסק על ידי IBM בשנות ה-50. אחסונו של מידע זה הפך לאתגר גדול לא רק בהקשר הטכנולוגי אלא גם בהיבט הכלכלי והסביבתי, שכן כיום אחראיות חוות השרתים – מחסני המידע המשרתים את כולנו – לכ-2% מפליטת הפחמן העולמית (שיעור דומה לפליטה המצטברת של כל המטוסים בעולם) ולכ-3% מצריכת החשמל העולמית (יותר מצריכת החשמל של בריטניה כולה). על רקע כל אלה מתפתחת בעשור האחרון גישה טכנולוגית חדשה ומהפכנית: אחסון מידע בדי-אן-איי. טכנולוגיה זו מאפשרת מזעור משמעותי, שמירת המידע לטווח ארוך הרבה יותר (פי אלף) ועלות אנרגטית וכלכלית אפסית.

הרעיון הבסיסי בקידוד מידע על די-אן-איי הוא זה: מולקולת הדי-אן-איי היא שרשרת המורכבת מחוליות הנקראות נוקלאוטידים. הנוקלאוטידים מתחלקים לארבעה סוגים המסומנים באותיות A, C, G ו-T. כדי לאחסן מידע בדי-אן-איי יש לתרגם כל רצף בינארי (המורכב מהסימנים 0 ו-1) לרצף המורכב מאותיות אלה. בשלב הבא מיוצרות, בתהליך הקרוי סינתזה, מולקולות די-אן-איי ממשיות המייצגות את אותם הרצפים. כדי לקרוא את המידע נדרש ריצוף של מולקולות הדי-אן-איי. ריצוף זה מייצר פלט המייצג את רצף הנוקלאוטידים המרכיב כל מולקולה בקלט, ואת הפלט האמור מתרגמים לרצף בינארי המייצג את ההודעה המקורית שקודדנו. הטכנולוגיות המודרניות מאפשרות סינתזה של אלפי סדרות נוקלאוטידים שונות במקביל.

אחסון על די-אן-איי מהווה אתגר משמעותי. פריצת הדרך שהושגה על ידי חוקרי הטכניון והמרכז הבינתחומי הרצליה חשובה ונובעת מכך שבעוד שבקריאת מידע גנטי (ריצוף גנטי) חלה התקדמות אדירה במהפכת הגנום, בתחום כתיבת המידע ישנם עדיין קשיים. פריצת הדרך מאפשרת:

  • הפחתה משמעותית בסבבי הסינתזה הנחוצים לאגירת המידע בדי-אן-איי
  • הגדלת מספר האותיות המשמשות לקידוד המידע (מעבר ל-4 האותיות המקוריות);
  • שיפור של מנגנון תיקון השגיאות בקוד.

הDNA מורכב ממארבע אבני בניין, הן ארבע האותיות A, C, G ו-T . המדענים הגדילו את מספר האותיות לשימוש בפועל, כשכל אות חדשה מהווה צירוף ייחודי של האותיות המקוריות. הגדלת מספר האותיות מאפשר לקודד יותר מידע בכל עמדה ברצף של מולקולות הדי-אן-איי. לדברי פרופ’ יכיני, “בתהליכי הסינתזה והריצוף הנהוגים כיום מתקיימת יתירות מידע מובנית (redundancy), כיוון שכל מולקולה מיוצרת במספר גדול של עותקים ונקראת במספר גדול של עותקים במהלך הריצוף. הטכנולוגיה שפיתחנו מנצלת את היתירות הזאת להגדלת מספר האותיות האפקטיבי הרבה מעל ל-4 האותיות המקוריות, וכך מאפשרת לנו לקודד כל יחידת מידע בפחות מחזורי סינתזה.” למותר לציין כי הDNA המלאכותי ששימש את החוקרים ותוכנן על ידי הקבוצה יוצר על ידי חברת Twist Bioscience האמריקאית, ורוצף במרכז הגנומי של הטכניון.

המדענים הצליחו להפחית ב-20% את מספר סבבי הסינתזה הנדרשים ליחידת מידע. בנוסף, הם הראו שיהיה ניתן להפחית בעתיד את מספר סבבי הסינתזה ב-75% ללא מאמצי פיתוח משמעותיים. פירוש הדבר הוא שתהליך האחסון יהיה מהיר יותר ויקר פחות. “בעבודה הזאת יישמנו בצורה מעשית קידוד מידע ביעילות סינתזה הגדולה בעשרות אחוזים בהשוואה לקידוד המקובל,” מסביר פרופ’ עמית. “המחקר כלל יישום בפועל של שיטת הקידוד החדשה לשם אחסון מידע בנפח גדול על מולקולות די-אן-איי ושחזורו לשם בדיקת התהליך.” ואכן, על אחד המדפים במעבדתו של פרופ’ עמית בטכניון מונחת מבחנה קטנה המכילה בתוכה כ-10 ננוגרם (מיליארדית הגרם) של די-אן-איי, המקודדים אלפי עותקים של התנ”ך בגירסה דו-לשונית.

המדענים פיתחו מנגנון מתקדם המאפשר להתגבר על שגיאות שהן חלק בלתי נפרד מתהליך ביולוגי-פיזיקלי כמו זה המתרחש כאן. חלק מרצף הדי-אן-איי של המולקולות המאחסנות את המידע, שתוכננו על יד ליאון ענבי ופרופ’ יכיני, משמש לצורך מנגנון תיקון השגיאות האמור. לדברי ליאון ענבי, בשל שימוש בקודים לתיקון שגיאות, המותאמים לקידוד הייחודי שיצרו, הם יכלו לערוך קידוד יעיל במיוחד ולשחזר את המידע בהצלחה. לדברי ענבי “כשעובדים במערכת המורכבת ממיליוני מולקולות, מתרחשים גם אירועים נדירים ביותר (אירועים של אחד למיליון), שעלולים לשבש את הקריאה. הקידוד המוקפד איפשר לנו להתגבר על בעיות אלה.”

המחקר נתמך בין השאר במסגרת תוכנית Horizon 2020 של האיחוד האירופי. את המחקר שראה אור בכתב העת Nature Biotechnology הנחה הפרופסור זוהר יכיני מהטכניון ומבית ספר אפי ארזי למדעי המחשב במרכז הבינתחומי הרצליה והוא נערך בהובלת תלמיד המחקר ליאון ענבי מהפקולטה למדעי המחשב בטכניון, בשיתוף מעבדתו של הפרופסור רועי עמית מהפקולטה להנדסת ביוטכנולוגיה ומזון בטכניון. במחקר השתתפו גם ד”ר אורנה עטאר ותלמידת המחקר ענבל וקנין.

המדענים הישראלים מסכמים שלטכנולוגיה זו קיים פוטנציאל משמעותי ביעול תהליכים נוספים בביולוגיה סינתטית ובביוטכנולוגיה “אנו מאמינים שבשנים הקרובות נראה עלייה משמעותית בשימוש בD.N.A סינתטי במחקר ובתעשייה”.