توالی یابی کل اگزوم

طی دهه گذشته، تعیین توالی کل اگزوم امکان پیشرفت های چشمگیری را در زمینه تشخیص و تحقیق بیماری های مختلف فراهم کرده است. با هدف قرار دادن مناطق کد کننده پروتئین ژنوم، تعیین توالی کل اگزوم عمق دانش در مورد انواع پروتئین ها را تغییر می دهد. علاوه بر این، تعیین توالی کل اگزوم به عنوان ابزاری ارزشمند جهت کشف واریانت های ژنتیکی جدید دخیل در پاتوژنز بیماری ها محسوب می شود و علم پزشکی هم از لحاظ نظری و هم از نظر بالینی از استفاده مداوم این روش سود برده است. ژنوم انسان از سه میلیارد جفت باز تشکیل شده است که شامل هر دو نواحی کدکننده پروتئین و مناطق غیر کد کننده پروتئین است. پیشرفت در تکنیک های توالی یابی، از توالی یابی سنگر به روش های توالی یابی توان بالا موازی، سبب شده تا تعیین توالی ژنوم سریع تر و ارزان تر باشد و این امکان را برای درک جامع تری از ژنتیک انسانی فراهم می کند. در حال حاضر، تعیین توالی ژنوم به یک ابزار بالینی حیاتی برای شناسایی پایه ژنتیکی بسیاری از بیماری ها تبدیل شده است و این امر تسهیل کننده مدیریت و درمان بسیاری از شرایط به ظاهر غیرقابل حل می باشد. برای تعیین انواع آللی خاص در یک فرد، دو روش اصلی وجود دارد: توالی یابی کامل ژنوم (WGS) و توالی یابی کل اگزوم (WES). توالی یابی کامل ژنوم توالی یابی کل ژنوم است، در حالی که توالی یابی کل اگزوم در یک رویکرد هدفمند به طور خاص فقط بر روی توالی یابی مناطق کدکننده پروتئین ژنوم (اگزونیک) تمرکز دارد. از آنجاییکه هر دو روش رویکردی بی طرفانه برای شناسایی انواع مختلف واریانت ها را فراهم می کنند، ابزارهای ارزشمندی برای پزشکی شخصی می باشند. با این وجود، تجزیه و تحلیل ژنتیکی بیماری های مندلی و پیچیده بر این فرض استوار است که بیشتر اختلالات مندلی (بیش از 85٪) ناشی از نقص در توالی پروتئین است، بنابراین در حال حاضر توالی یابی کل اگزوم در ژنتیک تشخیصی و تحقیقی بسیار مورد استفاده قرار می گیرد. 

تاریخچه

توالی یابی کل اگزوم در سال 2009 به عنوان تکنیکی که به فرد اجازه می دهد تا توالی اگزوم را، که شامل مناطق کد کننده پروتئین (اگزون ها) است، معرفی شد. جذابیت توالی یابی کل اگزوم از این واقعیت ناشی می شود که اگرچه تنها حدود 1.5٪ ژنوم را در بر می گیرد، اما این نواحی حدود 85% عوامل ژنتیکی ایجاد کننده اختلالات ژنی را در خود جای داده اند. در همان سال تشخیص افتراقی اسهال مادرزادی همراه با از دست دادن کلرید با سندرم بارتر، به عنوان اولین کاربرد بالینی توالی یابی کل اگزوم گزارش شد. به تدریج گزارشی مبنی بر تشخیص و درمان چشمگیر بیماری التهابی شدید روده با استفاده از توالی یابی کل اگزوم، پتانسیل این فناوری را نه تنها برای تشخیص بلکه برای درمان نیز نشان داد.

در سال 2011 آزمایشگاه آمبری، به عنوان اولین آزمایشگاه دارای مجوز CLIA، انجام توالی یابی اگزوم را همراه با تفسیر پزشکی برای اهداف بالینی ارائه کرد. در اکتبر 2014، وب سایت ژن_تست شانزده آزمایشگاه ارائه دهنده خدمات تعیین توالی یابی اگزوم بالینی را فهرست کرد. زمان تحویل در اکثر موارد 12-13 هفته، که البته کوتاهترین آنها 4 تا 8 هفته به طول می انجامید، و هزینه انجام آزمایش 4000-5500 دلار آمریکا بود. قابل توجه است که هزینه توالی یابی کل اگزوم ممکن است تنها دو تا چهار برابر هزینه برخی از پنل های انتخابی باشد. اکثر آزمایشگاه ها همچنین خدمات تفسیر داده ها را نیز ارائه می دهند.

کاربردها

در سال های اخیر، تعیین توالی اگزوم به عنوان ابزاری قدرتمند برای بررسی خصوصیات ژنومی ظهور کرده است و با موفقیت برای شناسایی انواع واریانت های ژنتیکی خاص در مناطق کد کننده پروتئین که در بیماری های مختلف دخیل هستند مورد استفاده قرار گرفته است. از جمله این بیماری ها می توان به سندرم میلر، سندرم شینزل-گیدیون، کاهش شنوایی غیرسندرومیک، سندرم سنسنبرنر، سندرم کابوکی، سندرم پروژروئید و بسیاری بیماری های دیگر پیچیده که هر یک از آنها ناشی از جهش های مشخص پروتئین های خاص است اشاره نمود. 

توالی اگزوم 100٪ از ژن های ژنوم انسان را هدف نمی گیرد؛ تقریباً 97% اگزون ها با استفاده از توالی یابی کل اگزوم هدف قرار گرفته می شوند. با این حال، حدود 10% از اگزون ها ممکن است در سطوح کافی تحت پوشش قرار نگیرند تا انواع واریانت های هتروزیگوت با اطمینان بیشتری شناسایی شوند. علاوه بر این، توالی یابی کل اگزوم در تشخیص انواع جهش های زیر محدود است (لیست حاضر ممکن است جامع نباشد): 

  • بازآرایی بزرگ
  • جهش های مربوط به CNV 
  • جهش های ژنوم میتوکندری
  • عوامل اپی ژنتیک
  • جهش های موزاییک
  • جهش در مناطق غنی از GC
  • جهش در سودوژن ها

مفهوم توالی یابی اگزوم

اصطلاح اگزون از حالت بیان شده ناشی می شود، یعنی مناطقی از رونوشت RNA که به محصولات پروتئینی ترجمه می شوند. تنها 2-1% از کل ژنوم موجودات انسانی شامل قسمت های کدکننده پروتئین است، اما این مناطق به طور کلی بهترین مناطق مورد مطالعه برای درک ژنوم هستند و بروز هر گونه جهش در آن ها توانایی اختلال در عملکرد طبیعی پروتئین و در نتیجه ایجاد بیماری را دارد. تعیین توالی یابی کل اگزوم شامل توالی یابی تمام توالی های شناخته شده کدگذار پروتئین یا اگزوم است. در بیشتر موارد، تعیین توالی یابی کل اگزوم تقریباً 22000 ژن رمزگذار پروتئین رمزگذاری شده در ژنوم انسان را پوشش می دهد. بنابراین تعیین توالی یابی کل اگزوم انقلاب گسترده ای را برای شناسایی جهش های مرتبط با بیماری ها و در نهایت درمان آنها فراهم کرده است.

اساس روش توالی یابی اگزوم

توالی یابی اگزوم شامل دو فرایند اصلی، یعنی غنی سازی هدف و تعیین توالی، می باشد. غنی سازی هدف، انتخاب و گرفتن توالی اگزون ها از نمونه های DNA است. دو روش عمده برای دستیابی به غنی سازی اگزوم وجود دارد. روش غنی سازی اگزوم بر اساس آرایه از پروب های متصل به ریزآرایه هایی با چگالی بالا برای گرفتن اگزوم استفاده می کند. ریزآرایه (microarray) یک آرایه دو بعدی روی اسلاید شیشه ای یا فیلم نازک سیلیکون است که حاوی الیگونوکلئوتیدهای مکمل برای هدف قرار دادن قسمت هایی از ژنوم است. در حالی که قطعه های اگزونی مربوط به نمونه های DNA از طریق ریزآرایه به توالی مکمل خود متصل می شوند و سایر قسمت های  ژنوم اتصال نمی یابند. این امر منجر به جدا شدن توالی اگزوم از سایر قسمت های ژنوم می شود. روش دیگر جذب در محلول بر اساس ذرات کروی (بید) مغناطیسی است. مهره مغناطیسی نوعی نانوذرات مغناطیسی است که حاوی اجزای شیمیایی عملکردی برای ترکیب با مواد هدف است. در این مورد، از مهره های مغناطیسی (bead) که می توانند به اگزوم متصل شوند استفاده می شود. این روش مشابه روش مبتنی بر آرایه است بدین ترتیب که اگزوم جذب یا کپچر می شود و به دانه های مغناطیسی متصل می شود، و سایر قسمت های ژنوم جدا باقی می مانند. مزیت روش جذب در املاح این است که استفاده از مهره مغناطیسی باعث می شود واکنش با تکان دادن یا گرم کردن سیستم موثرتر عمل کند. هر دو روش از روش های مناسبی در جداکردن توالی اگزوم از توالی ژنومیک است و حساسیت هر دو به اندازه کافی بالا است. با این حال، نکته ایی در مورد ویژگی وجود دارد که بخش هایی از ژنوم توالی هایی مشابه برخی از اگزون ها دارند و همین امر باعث می شود که این قسمت از توالی های ژنوم به ریزآرایه یا مهره های مغناطیسی متصل شوند و در نتیجه مثبت کاذب ایجاد شود. 

روش آزمایشگاهی توالی یابی کل اگزوم

توالی یابی کل اگزوم معمولاً با استفاده از غنی سازی های مبتنی بر هیبریداسیون با استفاده از کیت های Agilent Technologies ، Roche NimbleGen ، Illumina یا سایر مواردی از این قبیل انجام می شود. اگرچه همه کیت های ارائه شده توالی یابی کل اگزوم را انجام می دهند، اما تفاوت هایی در طراحی و عملکرد آنها وجود دارد. در برخی موارد کیت ها فقط اگزون های کد کننده پروتئین را پوشش می دهند، در حالی که برخی دیگر از کیت ها دارای جایگاه های RNA های غیرکدکننده (نظیر microRNA) و همچنین جایگاه های غیر قابل ترجمه در 3 و 5 می باشند. تفاوت های ناشی از اندازه هدف تفاوت های قابل توجهی را تا سه برابر در هزینه توالی یابی نشان می دهد.

مراحل انجام توالی یابی کل اگزوم

  1. پس از جداسازی و خالص سازی، DNA به قطعات حدود 150-200 جفت باز تبدیل می شود و سپس قطعات DNA از نظر کمی و کیفی مورد ارزیابی قرار می گیرند. برای ارزیابی کمی و کیفی می توان از دستگاه هایی همانند Qubit استفاده کرد. (از اینجا دستورالعمل استفاده از کیوبیت را دریافت بفرمایید). بایستی در نظر داشت که DNA ژنومی استخراج شده بایستی از کیفیت بالایی برخوردار باشد. برای شکستن DNA از انواع مختلفی از روش ها که به دو دسته کلی روش های فیزیکی و روش های آنزیمی دسته بندی می شوند استفاده می شود. 
  2. با استفاده از کیت کپچر مانند Agilent SureSelect، به دو انتهای هر قطعه آداپتورهای اختصاصی متصل می شود.
  3. برای غنی سازی نواحی اگزونی، مجموعه ای از اولیگونوکلئوتیدهای بیوتینیله شده که مکمل نواحی هدف هستند به محتوای قطعات DNA اضافه می گردند (مرحله هیبریداسیون).
  4. سپس در مرحله بعد اگزون هایی که به اولیگونوکلئوتیدهای بیوتینیله شده متصل شده اند با استفاده از ذرات مغناطیسی پوشانده شده با استرپتاویدین مخلوط می شوند. نواحی هدف متصل به استرپتاویدین با استفاده از آهن ربا جدا می شوند. سپس بید های مغناطیسی که به توالی هدف خود اتصال یافته اند، شسته می شوند. در ادامه توالی های هدف شسته شده با استفاده از پرایمرهای اختصاصی برای توالی های آداپتور، تکثیر می شوند.
  5. سپس، از هر قطعه DNA، هزاران کپی ایجاد می شود که کلاستری ایجاد شود که دقیقا کپی قطعه اصلی باشد که به این مرحله کلاسترینگ گویند. کلاسترینگ قطعات DNA با روش Bridge-PCR در سطوح فلوسل ها اتفاق می افتد. در هر لاین فلوسل، میلیون ها اولیگونوکلئوتید مکمل با آداپتورها وجود دارد که قطعات DNA به این پرایمرها متصل و در نهایت میلیون ها کپی از هر قطعه از DNA ایجاد می شود. سپس این کلاسترها وارد مرحله توالی یابی می شوند. تعیین توالی به روش خاتمه ی برگشت پذیر است، به این دلیل که کربن شماره 3 در حلقه قند دئوکسی ریبوز امکان برقراری پیوند فسفودی استر نداشته و فرایند پلیمریزاسیون را خاتمه می دهد. بعد از شناسایی نوکلئوتید اضافه شده در رشته در حال سنتز، عامل شیمیایی بلاکه کننده همراه با فلوئورفور از انتهای ´3 نوکلئوتید برداشته شده و نوکلئوتید استاندارد به جا می ماند. بنابراین سنتز رشته DNA از سر گرفته شده و به همین ترتیب نوکلئوتید بعدی اضافه و شناسایی می شود.

آنالیز داده های توالی یابی اگزوم

ویژگی های فایل بدست آمده از توالی یابی

بعد از تعیین توالی، فایل های خوانش های کوتاه یا داده های خام بدست می آیند، که فرمت آنها معمولا به صورت  fq، fastq و یا fq.gz می باشد. فایل های بدست آمده از نوع متن است و می تواند با نرم افزارهای ویرایش متن همانند Notepad و ++Notepad و یا EmEditor.Professional باز شود.

شکل زیر محتوای فایل fastq را نشان می دهد که شامل 4 ردیف می باشد. ردیف اول، شناسه نامیده می شود و با علامت @ آغاز می گردد و توالی را توصیف می کند. ردیف دوم، خوانش یا توالی نوکلئوتیدی توالی یابی شده را نشان می دهد. ردیف سوم نیز یک شناسه دیگر که با علامت + نشان داده می شود. ردیف چهارم، کیفیت هر نوکلئوتید خوانش شده را در خوانش ها نشان می دهد. این کیفیت بر اساس کاراکترهای استاندارد ASCII شده است. هر کدام از این کاراکترها معادل یک عدد کدگزاری شده می باشند که کیفیت خوانش هر نوکلئوتید را نشان می دهد. 

ساختار فایل FASTQ

کنترل کیفی

برای بررسی داده های fastq قبل از مراحل بعدی، توسط یکی از نرم افزارهای کنترل کیفی همانند FastQC مورد بررسی قرار می گیرد. در صورتی که توالی یابی از کیفیت مناسبی برخوردار باشد مراحل بعدی برای محاسبه واریانت ها ادامه می یابد. خوانش هایی با کیفیت پایین، پرایمرهای مورد استفاده در PCR قبل از تعیین توالی، آداپتورها، داپلیکیت ها و دیگر آلودگی ها که داده های خام یافت می شوند و ممکن است آنالیزهای ادامه این فرایند را تحت تاثیر قرار دهند، بایستی در این مرحله پیرایش (trim) شوند.

کنترل کیفی یکی از مرحل اساسی در شناخت توالی یابی بدست امده و همچنین تاثیر گذار در تصمیم گیری برای مراحل بعدی است. عدم شناسایی خطاها در این مرحله، منجر به بروز نتایج کاذب در فرایند تحلیل داده می شود. (مطالعه بیشتر)

انتخاب پایپلاین آنالیز

پژوهشگران بایستی پیش از شروع آنالیز داده خود، بر اساس قدرت پردازش سیستم سخت افزاری و هدف زیستی خود زنجیره ای از الگوریتم ها و نرم افزارها را انتخاب کرده و سپس آنالیز خود را شروع کنند. به مجموعه ای از ابزارها که به صورت پشت سر هم عمل می کنند، به صورتی که خروجی هر ابزار به عنوان ورودی ابزار بعدی عمل می کند، پایپلاین (pipeline) می گویند.

همردیفی با ژنوم مرجع

بعد از کنترل کیفی داده ها، یکی از مراحل مهم همردیفی داده های تعیین توالی با ژنوم رفرانس است. برای آنالیز توالی یابی اگزوم از پایپلاین های مختلفی استفاده می شود که بر معمولا بر پایه سیستم عامل لینوکس قابل اجرا می باشند. در این پایپلاین ها، ابتدا خوانش های حاصل از توالی یابی با استفاده از نرم افزارهای همردیفی مختلفی مانند BWA یا Bowtie2 با ژنوم رفرانس همردیف می شوند. بعد از همردیفی فایلی با پسوند “bam.” به دست می آید. داده ی این فایل با نرم افزارهای مختلف نمایش ژنوم همانند IGV قابل مشاهده است.

حذف خوانش های تکراری

بعد از همردیفی خوانش ها با ژنوم رفرانس، خوانش های تکراری حذف می شوند. هدف این کار حذف خوانش هایی با کپی کاملا یکسان است. برای این مرحله نیز نرم افزارهای متعددی وجود دارند که یکی از نرم افزارهای پرمخاطب Picard است.

شناسایی واریانت ها

مرحله بعد از حذف خوانش های تکراری، واریانت های ژنومی مختلف مانند واریانت های تک نوکلئوتیدی (SNVs) و حذف و اضافه های کوچک (Indels) شناسایی می شوند. این فرایند اصطلاحا شناسایی یا فراخوانی واریانت (variant calling) نامیده می شود. با استفاده از نرم افزارهای شناسایی کننده واریانت ها مانند GATK هر موقعیتی در طول ژنوم اسکن می شود و ژنوتایپ احتمالی در خوانش های همردیف شده تخمین زده می شود. همچنین احتمالی که هر کدام از این ژنوتایپ ها واقعی و صحیح هستند نیز محاسبه می شود. در نهایت واریانت های تغییر یافته و موقعیت کروموزومی آنها مشخص می شوند و این اطلاعات به صورت فایلی با فرمت vcf آماده می شود.

فایل vcf ایجاد شده دارای 8 ستون اصلی می باشد که هر یک اطلاعاتی در زمینه وارایانت شناسایی شده را در داده های توالی یابی نشان می دهد:

  1. ستون اول: شماره کروموزوم مربوط به واریانت،
  2. ستون دوم: موقعیت واریانت بر روی کروموزوم،
  3. ستون سوم: شناسه واریانت مورد نظر،
  4. ستون چهارم: توالی واریانت در ژنوم رفرانس است،
  5. ستون پنجم: توالی واریانت در ژنوم مورد بررسی،
  6. ستون ششم: کیفیت خوانش مربوط به باز (بر اساس مقیاس Phred score که توسط ابزار variant calling بررسی شده است)،
  7. ستون هفتم: اطلاعات مربوط به رد یا تائید فیلترهای کنترل کیفی را دربر دارد. در صورتی که در هر جایگاه خوانش، کیفیت مناسبی گزارش شده باشد، بر چسب PASS زده می شود،
  8. ستون هشتم: شامل اطلاعات اضافی درباره وارایانت شناسایی شده می باشد.
ساختار فایل VCF

تفسیر واریانت های احتمالی

حاشیه نویسی واریانت ها

بعد از مرحله شناسایی واریانت ها، جهت بدست آوردن اطلاعات بیشتر در مورد واریانت ها باید حاشیه نویسی (variant annotation) انجام شود. منظور از حاشیه نویسی، ارایه اطلاعات تکمیلی در مورد ژن های مربوط به وارایانت های شناسایی شده می باشد. بعد از شناسایی واریانت ها با استفاده از ابزارهای مختلف اثر واریانت ها بر روی ژن ها مانند تغییرات آمینواسیدی، درجه اهمیت و تغییرات عملکردی که بر فعالیت محصول ژنی ایجاد می شود مورد بررسی قرار می گیرند. در این مرحله اثر ورایانت ها و در نهایت شناخت ما از بیماری زایی و درجه اهمیت آنها در ایجاد بیماری مشخص می شود. همچنین اطلاعاتی مانند ترتیب ژنومیک، موقعیت ژن ها و نوع جهش، فراوانی واریانت ها و نتیجه پیش بینی اثر واریانت ها و مواردی از این قبیل را شامل می شود.

علاوه بر حاشیه نویسی پایه ای، پایگاه های داده و پایپلاین هایی هستند که اطلاعات بیشتری را فراهم می کنند. به عنوان مثال، ANNOVAR ابزار قدرتمندی است که برای حاشیه نویسی بیشتر واریانت ها استفاده می شود. پیش بینی فراوانی آلل مینور (MAF)، پیش بینی آسیب زایی واریانت، پیش بینی حفاظت شدگی موقعیت جهش، اثرات و مدارک آزمایشگاهی در مورد بیماری زایی واریانت و امتیازات پیش بینی با استفاده از نرم افزارهای GERP، Polyphen و … از جمله اطلاعاتی هستند که می تواند به پژوهشگران در بررسی عمیق تر اثرات واریانت ها کمک بکند. 

نمایی از اطلاعات موجود در فایل Annotation

انتخاب واریانت های موثر

داده حاصل از توالی یابی اگزوم شامل هزاران واریانت کاندید می باشد. تعداد این واریانت ها در مرحله فیلترینگ و اولویت بندی واریانت ها کاهش می یابد. در مرحله فیلتر کردن، واریانت هایی که احتمالا اهمیت ندارند حذف می شوند. به طور متوسط تعداد وارایانت های بدست آمده از مرحله Annotation حاوی بیش از 100 هزار واریانت SNP-InDel است. این تعداد در پایپلاین های مختلف با توجه به تنظیماتی که واریانت ها شناسایی می شوند، ممکن است متفاوت باشد. اولویت بندی و فیلترینگ شامل چند مر حله است: 

  1. حذف واریانت هایی با درجه اهمیت کمتر:
    1. واریانت هایی که شماره کروموزوم و یا ژن مربوط به آنها نامشخص است،
    2. واریانت هایی که در مناطق غیر کد کننده ژنوم (نظیر واریانت هایی که در محل اینترون ها واقع شده اند) قرار گرفته اند،
    3. حذف واریانت هایی که منجر به تغییرات بی اثر (نظیر موتاسیون های هم معنی) می شوند.
  2. حذف واریانت های رایج: با فرض اینکه واریانت های نادر با احتمال بیشتر علت بیماری هستند، واریانت های رایج حذف می شوند. به عبارتی، واریانت هایی که در پایگاه داده های مختلف که حاوی اطلاعات فراوانی آلل ها در جمعیت های مختلف هستند و دارای فراوانی الل مینور (MAF) بیش از 0.05 هستند، حذف می شوند. از جمله این پایگاه ها می توان به 1000GP، ESP6500، ExAC و gnomAD اشاره کرد.
  3. خالص سازی: جدا کردن و حفظ واریانت هایی که مرتبط با بیماری یا فنوتایپ بیماری است.
  4. بررسی الگوی توارث: سپس بر اساس الگوی توارث در خانواده ها، واریانت های هموزیگوت و یا هتروزیگوت در هریک از افراد در ستون مربوط به زایگوسیتی فیلتر می شود:
    1. الگوی توارث مغلوب (AR): در این حالت هدف یافتن واریانت هایی است که در فرد بیمار به صورت هموزیگوت و در فرد سالم به صورت هتروزیگوت باشند، 
    2. الگوی توارث غالب (AD): در این حالت هدف یافتن واریانت هایی است که در فرد بیمار به صورت هتروزیگوت و در فرد سالم به صورت هموزیگوت آلل رفرانس باشند.

 ابزارهایی که در مرحله اولویت بندی و فیلترینگ واریانت ها قابل استفاده هستند می توان به موارد ذیل اشاره کرد:

  1. VAAST2
  2. VarSifer
  3. KGGseq
  4. PLINK/SEQ
  5. SPRING
  6. GUI tool
  7. Gnome Ingenuity Variant Analysis

اولویت بندی و تفسیر نهایی واریانت ها

مرحله نهایی تفسیر واریانت های باقی مانده از مرحله فیلترینگ است. در تفسیر واریانت ها از دستورالعمل ACMG استفاده می شود تا اثر بیماری زایی و احتمالی واریانت بر بیماری بررسی و تصمیم گیری شود. در ادامه، علاوه بر استفاده از گایدلاین ذکر شده، لازم است برای واریانت هایی که در هر یک از گروه های پاتوژنیک، احتمالا پاتوژنیک و واریانت هایی با اهمیت نامشخص (VUS) قرار می گیرند، بررسی های بیشتری مانند بررسی segregation و بررسی ارتباط فنوتیپ-ژنوتیپ انجام شود.

گاهی در مرحله آنالیز داده اگزوم واریانتی مرتبط با فنوتایپ بیمار شناسایی نمی کنیم که لازم است آنالیز مجدد انجام شود و cut-offها را در مراحل مختلف آنالیز تغییر داده شود و یا بررسی واریانت ها در ژن هایی که فنوتایپ مشابه بیماری ایجاد می کنند انجام شود. توصیه می شود در چنین مواردی، هر 6 ماه آنالیز مجدد صورت گیرد زیرا که ابزارها و دیتابیس ها به مرور زمان آپدیت می شوند و اطلاعات در مورد ژن ها و واریانت ها افزایش می یابد.

پس از مواجهه با هر تغییر جدیدی که تا کنون در پایگاه های داده گزارش نشده باشد، بایستی وضعیت بیماری­زا بودن/ نبودن آن مشخص شود. به منظور تعیین این وضعیت برای هر واریانت جدید 3 اقدام لازم است انجام گیرد:

  1. آنالیز هم تفکیکی: برای انجام آنالیز هم تفکیکی و بررسی نحوه به ارث رسیدن تغییر ژنتیکی، بایستی اعضا خانواده از نظر وجود/عدم وجود واریانت مورد نظر بررسی قرار گیرند.
  2. بررسی بیوانفورماتیک و پیش­ بینی میزان تأثیر واریانت.
  3. مطالعه جمعیتی؛ بررسی حضور/عدم حضور واریانت در جمعیت کنترل طبیعی.

در نهایت باید دقت شود که تمام واریانت هایی که از طریق توالی یابی کل اگزوم به عنوان کاندید بیماری زایی انتخاب می شوند لازم است با انجام توالی یابی سنگر مورد تایید قرار بگیرند.

پایگاه های داده و ذخیره سازی داده های توالی یابی اگزوم

ExAC

پایگاه داده ExAC، اطلاعات حاصل از تعیین توالی نواحی اگزونی بیش از 60 هزار فرد غیر خویشاوند از جمعیت های مختلف که با ژنوم رفرانس GRCh37/hg19 الاین (هم تراز) شده اند را جمع اوری کرده است. 

GenomAD 

دیتابیس GnomAD منبع اطلاعات داده های تعیین توالی اگزوم و ژنوم با استفاده از پروژه های تعیین توالی در سطح وسیع است. داده های این دیتابیس شامل موارد زیر است:

  1. مجموعه داده شامل 125748 توالی اگزوم و 15708 توالی ژنومی افراد غیرخویشاوند که به ژنوم رفرانس GRCh37/hg19 همردیف شده اند.
  2. مجموعه داده شامل 76156 توالی ژنوم که با ژنوم رفرانس GRCh38 همردیف شده اند.

1000 Genomes Project

پروژه ی 1000 ژنوم که در ژانویه ی 2008 آغاز شده و یک مطالعه ­ی بین المللی است که با هدف ایجاد یک کاتالوگ دقیق و جامع از تغییرات ژنتیکی در انسان ایجاد شده است. این منبع اطلاعاتی حاوی اطلاعات جمعیتی واریانت های مختلف می باشد که حاصل تعیین توالی کل ژنوم 2504 فرد سالم از 26 جمعیت مختلف می باشد. 

ICGC and TCGA

 اطلس ژنوم سرطان (TCGA) و کنسرسیوم بین المللی ژنوم سرطان (ICGC) به ترتیب دارای اطلاعات تعیین توالی اگزوم و ژنوم می باشند. کنسرسیوم بین المللی ژنوم سرطان برای هماهنگی مطالعات ژنوم سرطان در مقیاس بزرگ در تومورهایی از 50 نوع مختلف سرطان و/یا زیرگونه هایی از سرطان که اهمیت بالینی و اجتماعی در سراسر جهان دارند، راه اندازی شد. بیش از 25000 داده مرتبط با سرطان در سطوح ژنومی، اپی ژنومی و ترانسکریپتومی، مجموعه جهش های سرطان زا و ردپایی از تأثیرات جهش زا را آشکار می کنند و هم چنین مطالعات بالینی مرتبط با پیش آگهی، مدیریت درمان و توسعه درمان های جدید سرطان را ممکن می سازد. اطلس ژنوم سرطان، برنامه ای مهم در ژنومیک سرطان است که بیش از 20000 سرطان اولیه را از نظر مولکولی بررسی کرده است. این تلاش مشترک بین NCI و موسسه ملی ژنوم انسانی در سال 2006 آغاز شد و محققان رشته های مختلف و موسسات متعدد را گرد هم آورد. در طول دوازده سال آینده، TCGA بیش از 2.5 پتابایت اطلاعات ژنومی، اپی ژنومی، ترانسکریپتومی و پروتئومی تولید خواهد کرد. این داده ها، برابر بهبود توانایی روند تشخیص، درمان و پیشگیری از سرطان شده است، برای استفاده همه افراد جامعه تحقیقاتی در دسترس عموم قرار می گیرد.

EVS

منبع حاشیه نویسی EVS شامل انواع توالی یابی اگزوم است و از سرور Exome Variant و پروژه توالی یابی Exome NHLBI (ESP) بازیابی شده است. منبع EVS دارای 2500 داده اگزوم و ورژن evs_5400 دارای 5400 داده اگزوم می باشند و در چند ماه آینده 7500 داده اگزوم اضافه می شود. در حال حاضر فرکانس آلل های مینور برای جمعیت های اروپایی آمریکایی و آفریقایی تبار درج شده است.

این مطلب را پسندیدید؟

-

به اشتراک بگذارید

یک پاسخ بنویسید

نشانی ایمیل شما منتشر نخواهد شد.فیلد هایی که با علامت ستاره 8 مشخص شده اند، الزامی هستند

X