معلومة

كيف يمكنني العثور على SNP الأكثر دراسة للجينات؟

كيف يمكنني العثور على SNP الأكثر دراسة للجينات؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

كيف يمكنني العثور على النيوكلوتايد SNP الأكثر دراسة للجينات والأمراض التي ارتبطت بها أكثر أشكال النيوكلوتايد التي تمت دراستها؟

أبحث في قاعدة بيانات dbSNP لكن لا يمكنني العثور عليها.

ما هي العملية؟


هل يمكنك توفير جين الاهتمام؟

يمكنك عادةً البحث في Entrez عن رمز الجين في قاعدة بيانات dbSNP ، والتي ستسحب صفحة NCBI Entrez بحثًا عن SNPs الموجودة في الجين وستعطي أيضًا إشارة إلى أهميتها السريرية (حميدة أو غير ذلك).

بدلاً من ذلك ، إذا كان لديك مرض معين في الاعتبار ، فيمكنك التحقق من قواعد بيانات أكثر تحديدًا لـ SNP ، مثل COSMIC لـ SNPs المرتبطة بالسرطان.

أخيرًا ، سيؤدي مجرد البحث عن الجين محل الاهتمام على Google (على سبيل المثال ، "EZH2 SNP") في Google Scholar إلى عرض المقالات التي تعرض تعدد الأشكال محل الاهتمام.

يجب أن ينتج عن مزيج من هذه الأساليب ما تريده ، لكن قد أتمكن من تقديم إجابة أفضل بمزيد من المعلومات.


الأساس الجيني للحجم في الكلاب الأليفة: دراسة التباين الجيني الكمي في مختبر جامعي عملي

قد يكون تدريس التباين الجيني الكمي في البيئة العملية للمختبر الجامعي صعبًا ، لأنه بالنسبة للأنماط الظاهرية الكمية التي تخضع لسيطرة مواقع متعددة ، فإن اكتشاف الاختلافات المظهرية التي تسببها المتغيرات الفردية يمثل مشكلة بدون عينات كبيرة ، وهو أمر غير عملي في مثل هذه الفئات. تقدم الكلاب الأليفة مثالًا واضحًا على التباين الجيني الكمي مع سلالات فردية تتراوح في الحجم من 1 إلى 70 كجم من الوزن ولكن مع القليل من التباين الداخلي. على عكس البشر حيث يوجد عدد قليل من المتغيرات الجينية التي تم تحديدها والمعروفة بأنها متورطة في النمط الظاهري للحجم المتحكم فيه وراثيًا ، في الكلاب ، تم إثبات سبعة أشكال متعددة الأشكال للنيوكليوتيدات (SNPs) في ستة جينات لتفسير نصف التباين الظاهري. في العملية الموصوفة هنا ، يوجد G-A SNP واحد (داخل intron 2 من عامل النمو الشبيه بالأنسولين 1 الجين) من خلال تفاعل البوليميراز المتسلسل ، والتسلسل ، والمعلوماتية الحيوية. يُظهر متوسط ​​وزن سلالة الكلاب ذات الأنماط الجينية المختلفة في هذا SNP اختلافات كبيرة في الحجم (متوسط ​​[معدل الذكاء] من AA = 10 كجم [6-15 كجم] ، AG = 23.75 كجم [14-30 كجم] ، GG = 30 كجم [24.5 - 37 كجم] من بيانات الفصل لدينا) بتقدير ≈ فقطن = 16 كلبًا بحاجة إلى التنميط الجيني لإظهار اختلاف كبير في الحجم بين الكلاب التي تأوي نمطين وراثيين متماثلين. في العملية الموصوفة هنا ، من مختبر واحد وجلسة كمبيوتر واحدة ، يمكن للطلاب رؤية التأثير الواضح للنمط الجيني على سمة كمية. يتيح فحص المتغير في متصفح Ensembl (www.ensembl.org) للطلاب فهم الأساس الجيني لهذا المتغير وتقدير ثروة البيانات والمعلومات المتاحة للجمهور في متصفحات الجينوم. © 2018 الاتحاد الدولي للكيمياء الحيوية والبيولوجيا الجزيئية، 46 (6): 623-629 ، 2018.


كيف يمكنني العثور على SNP الأكثر دراسة للجينات؟ - مادة الاحياء

يتم توفير جميع المقالات المنشورة بواسطة MDPI على الفور في جميع أنحاء العالم بموجب ترخيص وصول مفتوح. لا يلزم الحصول على إذن خاص لإعادة استخدام كل أو جزء من المقالة المنشورة بواسطة MDPI ، بما في ذلك الأشكال والجداول. بالنسبة للمقالات المنشورة بموجب ترخيص Creative Common CC BY ذي الوصول المفتوح ، يجوز إعادة استخدام أي جزء من المقالة دون إذن بشرط الاستشهاد بالمقال الأصلي بوضوح.

تمثل الأوراق الرئيسية أكثر الأبحاث تقدمًا مع إمكانات كبيرة للتأثير الكبير في هذا المجال. يتم تقديم الأوراق الرئيسية بناءً على دعوة فردية أو توصية من المحررين العلميين وتخضع لمراجعة الأقران قبل النشر.

يمكن أن تكون ورقة الميزات إما مقالة بحثية أصلية ، أو دراسة بحثية جديدة جوهرية غالبًا ما تتضمن العديد من التقنيات أو المناهج ، أو ورقة مراجعة شاملة مع تحديثات موجزة ودقيقة عن آخر التقدم في المجال الذي يراجع بشكل منهجي التطورات الأكثر إثارة في العلم. المؤلفات. يوفر هذا النوع من الأوراق نظرة عامة على الاتجاهات المستقبلية للبحث أو التطبيقات الممكنة.

تستند مقالات اختيار المحرر على توصيات المحررين العلميين لمجلات MDPI من جميع أنحاء العالم. يختار المحررون عددًا صغيرًا من المقالات المنشورة مؤخرًا في المجلة ويعتقدون أنها ستكون مثيرة للاهتمام بشكل خاص للمؤلفين أو مهمة في هذا المجال. الهدف هو تقديم لمحة سريعة عن بعض الأعمال الأكثر إثارة المنشورة في مجالات البحث المختلفة بالمجلة.


مقال أحادي النوكليوتيدات متعدد الأشكال في علم الأحياء

تعدد أشكال النوكليوتيدات المنفردة هو تناقض نيوكليوتيدات عن التسلسل الطبيعي ، مع تردد سكاني أكبر من 1٪ (بيركل ، 2008). عادة ما يكون هناك نوعان من allelomorphs متورطان في SNPs. تاريخ الأليلات T و C لطبقتين من تغييرات الأليل في العوالم بسبب التحيز المتحولة. يمكن أن تتغير أعداد النيوكلوتايد داخل المجموعات السكانية وفيما بينها. يمكن تصنيف SNPs إلى مرادف (لا يوجد تغيير في الأحماض الأمينية التي ينتجها الكسترون) محافظ (تغيير الأحماض الأمينية إلى حمض أميني مشابه كيميائيًا) وغير متحفظ (تغيير الأحماض الأمينية إلى حمض أميني مختلف كيميائيًا).

يمكن أن تكون SNPs بالإضافة إلى الاستيفاء أو الحذف المعروفة عادةً باسم & # 8220 omission interpolation polymorphisms (DIPs) & # 8221 (McEntyre، 2002). بالإضافة إلى ذلك ، يمكن استخدام النيوكلوتايد في تخطيط الأدوية للتدخلات ولعب دور مهم في تطوير الأدوية للتعامل مع الأمراض العائلية (Twyman and Primrose ، 2003) يمكن اكتشاف SNPs بعدة طرق جزيئية يمكن من خلالها تحديد جزيئات حمض الديوكسي ريبونوكليك المتغيرة. هذه الأساليب لها فكرة أساسية عن تكبير جزء المشاركة بواسطة PCR والبحث عن ممتلكات فيزيائية وكيميائية مماثلة / متطابقة ، أي إذا كان هناك تغيير أساسي فردي.

للتوضيح ، تحليل تعدد الأشكال المطابق (SSCP) الفردي الذي تقطعت به السبل وتغيير طبيعة عملية الترحيل الهلامي المتدرج (DGGE). يتضمن SSCP تغيير طبيعة الحمض النووي مزدوج الشريطة إلى شكل أحادي الخيط يتم طيه إلى شكل كروي. الصعود يحدد التناقضات في الحمض النووي.

على الرجل الآخر ، DGGE ينطوي على تغيير طبيعة الحمض النووي لتغيير الحركة. ومع ذلك ، يتم اكتشاف تعدد الأشكال باستخدام تقنيات التسلسل مثل التسلسل الحراري لفيتامين E ، g ، 454 لأنها أرخص ويمكن الاعتماد عليها (Chang et al. ، 2010). تتضمن هذه التقنية انبعاث إشارة كيميائية عندما يتم دمج dNTP غريب.

يتم تحديد ترتيب dNTPs الذي تم إصداره بواسطة pyrogram ويمكن أن يعتمد على SNP المعروف. الإشارة الكيميائية الناتجة هي نسبة إلى رقم dNTPs المدمجة (Chang et al.، 2010). يجب أن تكون طرق التنميط الجيني لـ SNP سريعة وغير مكلفة ودقيقة (Kim and Mishra، 2007).

هناك العديد من أساليب التنميط الجيني SNP المستخدمة على سبيل المثال فحص الغازي ومطياف الكتلة. على الرغم من أن القواعد الأساسية لجميع الطرق هي تفضيل الأليل واستشعار الأليل (Twyman and Primrose ، 2003). تعتمد الطريقة المستخدمة على SNP وجدول الجينوم المتدرج. للحالة ، الأساليب القائمة على المصفوفة ، أي

تُستخدم تقنيات عالية الإنتاجية لتحديد التركيب الجيني للنقاط المتعددة الأشكال على مستوى الجينوم. Illumina هي إحدى الطرق الشائعة الاستخدام. يتضمن ذلك تغيير طبيعة حمض الديوكسي ريبونوكلييك الجينومي إلى حمض الديوكسي ريبونوكلييك الذي تقطعت به السبل والمرتبط بمنصة مصفوفة الخرزة & # 8220 & # 8221 أو & # 8220 Beadxpress & # 8221. يتم تلدين مجموعة من النيوكليوتيدات الزيتية إلى الحمض النووي الجيني الذي يجلب البئر. ثم & # 8220 الامتداد والربط الخاصين بالأليل & # 8221 يأخذ النقطة الطبوغرافية. يتم تضخيم التسلسلات بواسطة تفاعل البوليميراز المتسلسل مع إضافة من البادئات ذات العلامات الفلورية (Chen، Kowk and Levine، 1999) لإنتاج & # 8220 amplicons & # 8221 التي تحتوي على العديد من SNPs. يتم تهجينهم على حبات الإضاءة التي لها تسلسلات تكميلية.

عندما يتم تهجين التسلسل الصحيح والغريب مع التسلسل في حبة الإضاءة ، يتم إنتاج إشارة منفردة مطابقة للتسلسل الذي يتم تهجينه وإيجاد النمط الجيني لـ SNP. الطريقة الأخرى المستخدمة عادة هي & # 8220 Affymetrix GeneChip 500K Mapping Array Set & # 8221 ويمكن أن يتراوح بين حوالي 500000 تعدد الأشكال المختلفة في مقطع ذو كفاءة مقطع (Butcher et al. ، 2007). يتم شق حمض Deoxyribonucleic الجيني باستخدام إنزيمات محدودة (& # 8220 NspI أو StyI) وبالتالي يتم ربط المحولات بالشظايا. يتم تضخيم الشظايا بواسطة تفاعل البوليميراز المتسلسل في ظل الظروف المثلى ويتم تمييز المحطات بحيث يمكن تهجينها على الرهبة الفرنسية (AFFYMETRIXA® ، 2005). يحدد كل مكان التركيب الوراثي الوحيد للنيوكلوتايد في عينة حمض الديوكسي ريبونوكلييك الذي تم تهجينه في الرهبة الفرنسية. ومع ذلك ، فإنه يتطلب دفعة من الحمض النووي وأحيانًا لا يمكن الحصول على أطنان من الحمض النووي.

هناك طرق أخرى لا تعتمد على المصفوفة وتستخدم لوضع مجموعة محددة من النيوكلوتايد في سيترات معينة. يتضمن ذلك التهجين النوعي الديناميكي (DASH). هذه طريقة أكثر فاعلية حيث يمكن تخصيص المصفوفات ومع ذلك فإن هذه الطريقة تعمل فقط مع عدد قليل من SNPs. يستخدم هذا شروطًا ضيقة ليحدث تسلسل الحمض النووي للتورط الذي لا يتطابق مع التحقيق المختلط. (Brookes et al.، 1999) .تم إجراء مطاردة طريقة BLAT على تسلسل الأسئلة لكل مكان في مقطع في متصفح UCSC.

تم الوصول إليه في محدد موقع الموارد الموحد الذي تم تحديده أدناه: بروتوكول نقل النص التشعبي: /genome.ucsc.edu/.

تم النقر على & # 8220 Browser & # 8221 nexus من النتيجة الأولى. أعطى هذا معلومات حول موقع SNP في الكروموسوم والعديد من معرفات SNP. تم استخدام مكان الكروموسومات ليحدث الكسترون الذي يقع فيه SNP. تم ذلك عن طريق الوصول إلى NCBI mapviewer في محدد موقع الموارد الموحد الذي تم تحديده أدناه: بروتوكول نقل النص التشعبي: /www.ncbi.

تم إدخال مكان الكروموسومات في & # 8220 جزء على الكروموسوم & # 8221 nexus علاوة على ذلك ، تم تحديد معرف SNP الصحيح عن طريق اختيار & # 8220 المعلومات الداخلية & # 8221 الرابطة من النتيجة الأولى. كانت هناك قاعدتان باللون الأزرق الفاتح مع قاعدة سوداء في الوسط ، تقترح موقع SNP في التسلسل. تم وضع مكان SNP في الكروموسوم وبالتالي انتقل إلى صفحة المتصفح & # 8220 & # 8221 ودخل المكان في & # 8220 place box & # 8221 والنقر على & # 8220 leap & # 8221.

أعطى هذا معرف SNP واحدًا يتوافق مع SNP في كل مكان. من خلال الالتقاط على معرّف SNP هذا ، أعطى هذا الكثير من المعلومات حول allelomorphs والإثبات وجزء الترميز والمزيد.

ncbi.nlm.nih.gov/projects/SNP/ للتحقق مما إذا كان معرف SNP هو الصحيح 1. تم إدخال معرف SNP في مربع البحث وهذا أعطى الكثير من المعلومات المرتبطة بتكرار السكان والأليلومورف وجزء الترميز.

لحدوث مكان جزء الترميز لبعض المكان ، تم اختيار مكان النيوكليوتيدات في & # 8220 Gene position & # 8220 التقسيم الفرعي. بالإضافة إلى ذلك ، من خلال التقاط & # 8220 الرابطة السريرية & # 8221 nexus ، تم العثور على خريطة SNP. العواقب تقع جميع SNPs في المكان في CFTR cistron وجميع التسلسلات مترجمة إلى 7q31.2. يقع في DNA الترميز.

خريطة SNP خاطئة مثل تغيرات الأحماض الأمينية من الفالين إلى الميثيونين. مكان SNP في الكروموسوم هو 117199533 ، ومعرف SNP هو rs_213950. التقليب هو شعور إيجابي. إنه في إكسون 11 من سيسترون CFTR ، تم العثور عليه عبر dbSNP عن طريق الالتقاط على مكان النيوكليوتيدات (84517). علاوة على ذلك ، يعتبر منظم غشاء التليف الكيسي.

تم تسلسله في 1000 جينوم. allelomorphs الوراثية لـ SNP هو A ، والأليلومورف المشتق هو G. وكان هناك العديد من ترددات الأليل من مجموعات سكانية مختلفة. بعضها مأخوذ من نفس السكان في حين أن البعض الآخر لم يكن عدد السكان 8217 لأنه مأخوذ من فرد واحد فقط. لذلك ، تم أخذ تردد أليل تمثيلي لمختلف المجموعات السكانية. ترددات الأليل للأليلومورف A و G في عدد السكان الأوروبيين هي 50.

8٪ و 49.2٪ بشكل منفرد. ترددات الأليل للأليلومورف A و G في الصينيين هي 40.

5٪ و 59.5٪ منفردة. ترددات الأليل للأليلومورف A و G في سكان نيبون هي 32.6٪ و 67.4٪ منفردة. تبلغ ترددات الأليل للأليلومورف A و G في سكان إفريقيا جنوب الصحراء 97.5 ٪ و 2.

5٪ على حدة. ترددات الأليل للأليلومورف A و G في السكان الأمريكيين من أصل أفريقي هي 89.1٪ و 10.9٪ على حدة.

الأفريقي لديه تردد أعلى من allelomorph A في حين أن الآسيويين لديهم عدد متساوٍ من allelomorphs A و G. وهذا يشير إلى أن التنوع العائلي بدأ من إفريقيا وأنه تم الاحتفاظ به في إفريقيا. التركيز B يقع SNP في الحمض النووي غير المشفر. مكان SNP في الكروموسوم هو 117163616. معرف SNP هو rs_7802924. تم التحقق من صحة SNP من خلال تردد مجموعة ، تعهد HapMap وتعهد 1000 جينوم.

الأليلومورفات الوراثية والمشتقة هي A و G بشكل منفرد ، وكان هناك ثلاثة مجموعات مجتمعة. ومع ذلك ، كان اثنان منهم من فرد واحد ومن ثم فإنه لا يمثل n & # 8217t لجميع السكان. تم أخذ تردد الأليل من مجموعة سكانية متعددة بما في ذلك النيبونية والصينية والأفريقية وما إلى ذلك. ترددات أليل A و G هي 90.9٪ و 9.1٪ على حدة.

نظرًا لأن تردد allelomorph A مرتفع بشكل معقول ، فإن هذا يشير إلى أنه تم حفظه بشكل كبير عبر مجموعات سكانية متعددة على الرغم من أن حجم العينة كان ضئيلًا. مكان SNP في الكروموسوم هو 117282644. معرف SNP هو rs_1800130. تم التحقق من صحة SNP من خلال تردد مجموعة 2 hit-2 allelomorph و 1000 جينوم.

يوجد معدل مرتفع بالفعل للأليلومورف بنسبة 100٪ في أوروبا وآسيا. هذا بالإضافة إلى أن معظم السكان الذين لديهم الأليل A قد انتقلوا من إفريقيا. ومع ذلك ، فإن تردد الأليل A في أفريقيا جنوب الصحراء الكبرى والسكان الأمريكيين من أصل أفريقي هو 78.8٪ و 88.1٪ على حدة بينما ترددات أليل G هي 21.2٪ و 11.9٪ على حدة.

الموقع D: يقع SNP في الحمض النووي غير المشفر. مكان SNP في الكروموسوم هو 117173231 ، معرف SNP هو rs_213943. تم التحقق من صحة SNP من خلال مقدم الترددات 2 hit-2 allelomorph و 1000 جينوم. ترددات الأليل للأليل C و T في سكان أوروبا هي 51.

7٪ و 48.3٪ بشكل منفرد. ترددات الأليل للأليل C و T في الصينيين هي 39.5٪ و 60.5٪ على حدة. ترددات الأليل للأليل C و T في سكان نيبون هي 32.1٪ و 67.


محتويات

تحرير الارتباط الاختلال

يقال أن موقعين في توازن الارتباط (LE) إذا كان ميراثهما حدثًا مستقلاً. إذا كانت الأليلات الموجودة في تلك المواقع غير موروثة بشكل عشوائي ، فإننا نقول إنها تعاني من اختلال توازن الارتباط (LD). تحدث صعوبة التعلم الأكثر شيوعًا بسبب الارتباط المادي للجينات. عندما يتم توريث جينين على نفس الكروموسوم ، اعتمادًا على المسافة بينهما واحتمالية إعادة التركيب بين الموقع ، يمكن أن يكونا عند LD عالي. ومع ذلك ، يمكن أيضًا ملاحظة صعوبة التعلم بسبب التفاعلات الوظيفية حيث يمكن للجينات من الكروموسومات المختلفة أن تمنح بشكل مشترك نمطًا ظاهريًا محددًا تطوريًا أو يمكن أن تؤثر على قابلية النسل المحتمل للحياة.

في العائلات ، يكون LD أعلى بسبب أقل عدد من أحداث إعادة التركيب (أقل أحداث الانقسام الاختزالي). هذا صحيح بشكل خاص بين السلالات الفطرية. يوجد صعوبة التعلم في المجموعات السكانية بسبب الانتقاء أو التقارب المادي للجينات الذي يتسبب في انخفاض معدلات إعادة التركيب أو بسبب التهجين أو الهجرة الأخيرة. على مستوى السكان ، تشمل العمليات التي تؤثر على اختلال التوازن الترابط الجيني ، والانتقاء الطبيعي المعرفي ، ومعدل إعادة التركيب ، والطفرة ، والانحراف الجيني ، والتزاوج العشوائي ، والتوصيل الجيني ، وتدفق الجينات. [2]

عندما يتم توريث مجموعة من النيوكلوتايد معًا بسبب صعوبة التعلم المرتفعة ، تميل المعلومات الزائدة عن الحاجة. يؤدي اختيار علامة SNP كممثل لهذه المجموعات إلى تقليل مقدار التكرار عند تحليل أجزاء من الجينوم المرتبطة بالسمات / الأمراض. [3] تُعرف أيضًا مناطق الجينوم ذات LD المرتفع والتي تؤوي مجموعة محددة من SNPs الموروثة معًا باسم أنماط الفردانية. لذلك ، تعد علامة SNPs ممثلة لجميع SNPs داخل النمط الفرداني.

تحرير Haplotypes

اختيار علامة SNPs يعتمد على الأنماط الفردانية الموجودة في الجينوم. توفر معظم تقنيات التسلسل معلومات النمط الجيني وليس الأنماط الفردانية ، أي أنها توفر معلومات عن القواعد المحددة الموجودة ولكنها لا توفر معلومات مرحلية (حيث يظهر كروموسوم محدد كل قاعدة). [4] يمكن تحديد الأنماط الفردانية من خلال الطرق الجزيئية (تفاعل البوليميراز المتسلسل النوعي لأليل ، وهجائن الخلايا الجسدية). تميز هذه الطرق أي الأليل موجود في أي كروموسوم عن طريق فصل الكروموسومات قبل التنميط الجيني. يمكن أن تكون مستهلكة للوقت ومكلفة للغاية ، لذلك تم تطوير طرق الاستدلال الإحصائي كخيار أقل تكلفة وآلي. تستخدم حزم برامج الاستدلال الإحصائي هذه البخل ، والاحتمالية القصوى ، وخوارزميات بايز لتحديد الأنماط الفردانية. عيب الاستدلال الإحصائي هو أن نسبة من الأنماط الفردانية المستنبطة قد تكون خاطئة. [5]

الاختلافات السكانية تحرير

عند استخدام الأنماط الفردانية في دراسات الارتباط الواسع للجينوم ، من المهم ملاحظة السكان قيد الدراسة. غالبًا ما يكون للمجموعات السكانية المختلفة أنماط مختلفة من صعوبة التعلم. أحد الأمثلة على أنماط التمايز هو السكان المنحدرين من أصل أفريقي مقابل السكان المنحدرين من أصل أوروبي وآسيوي. نظرًا لأن البشر نشأوا في إفريقيا وانتشروا في أوروبا ثم القارات الآسيوية والأمريكية ، فإن السكان الأفارقة هم الأكثر تنوعًا وراثيًا ولديهم مناطق أصغر من صعوبة التعلم بينما السكان الأوروبيون والآسيويون لديهم مناطق أكبر من صعوبة التعلم بسبب تأثير المؤسس. عندما تختلف أنماط صعوبة التعلم في السكان ، يمكن أن تنفصل تعدد الأشكال SNP مع بعضها البعض بسبب التغيرات في كتل النمط الفرداني. هذا يعني أن علامة SNPs ، كممثلين لكتل ​​النمط الفرداني ، فريدة من نوعها في السكان ويجب أن تؤخذ الاختلافات السكانية في الاعتبار عند إجراء دراسات الارتباط. [6]

تحرير GWAS

تقريبا كل سمة لها تأثير وراثي وبيئي. التوريث هو نسبة التباين المظهرى الموروث من أسلافنا. تستخدم دراسات الرابطة لتحديد التأثير الجيني على العرض المظهرى. على الرغم من أنها تستخدم في الغالب لرسم خرائط للأمراض إلى المناطق الجينومية ، إلا أنه يمكن استخدامها لرسم خريطة وراثية لأي نمط ظاهري مثل الطول ولون العين وما إلى ذلك.

تستخدم دراسات الارتباط على مستوى الجينوم (GWAS) تعدد أشكال النوكليوتيدات المفردة (SNPs) لتحديد الارتباطات الجينية مع الحالات السريرية والسمات المظهرية. [8] فهي خالية من الفرضيات وتستخدم نهج الجينوم الكامل للتحقيق في السمات من خلال مقارنة مجموعة كبيرة من الأفراد الذين يعبرون عن نمط ظاهري مع مجموعة كبيرة من الأشخاص لا يفعلون ذلك. الهدف النهائي من GWAS هو تحديد عوامل الخطر الجينية التي يمكن استخدامها لعمل تنبؤات حول الأشخاص المعرضين لخطر الإصابة بمرض ما ، وما هي الأسس البيولوجية لقابلية المرض وإنشاء استراتيجيات جديدة للوقاية والعلاج. [1] ينشر المعهد القومي لبحوث الجينوم البشري والمعهد الأوروبي للمعلومات الحيوية كتالوج GWAS ، وهو كتالوج لدراسات الارتباط الجينومية المنشورة التي تسلط الضوء على الارتباطات ذات الدلالة الإحصائية بين المئات من تعدد الأشكال مع مجموعة واسعة من الأنماط الظاهرية. [9]

نظرًا للعدد الكبير من متغيرات SNP المحتملة (أكثر من 149 مليونًا اعتبارًا من يونيو 2015 [10] [11]) ، لا يزال ترتيب تسلسل جميع أشكال النيوكلوتايد (SNPs) مكلفًا للغاية. هذا هو السبب في أن GWAS تستخدم المصفوفات القابلة للتخصيص (رقائق SNP) لتكوين مجموعة فرعية فقط من المتغيرات المحددة على أنها علامة snps. تستخدم معظم GWAS منتجات من منصتي التنميط الجيني الأساسيين. تقوم منصة Affymetrix بطباعة مجسات الحمض النووي على شريحة زجاجية أو سيليكون تهجين إلى أليلات معينة في عينة الحمض النووي. تستخدم منصة Illumina تقنية قائمة على حبة ، مع تسلسل DNA أطول وتنتج خصوصية أفضل. [1] كلا النظامين قادران على التركيب الجيني لأكثر من مليون علامة SNPs باستخدام أوليجوس DNA مسبقة الصنع أو مخصصة.

تعتمد الدراسات على مستوى الجينوم على فرضية المتغير الشائع للمرض (CD / CV) التي تنص على أن الاضطرابات الشائعة تتأثر بالتنوع الجيني الشائع. يجب أن يكون حجم التأثير (الاختراق) للمتغيرات الشائعة أصغر بالنسبة لتلك الموجودة في الاضطرابات النادرة. هذا يعني أن SNP المشترك يمكنه تفسير جزء صغير فقط من التباين بسبب العوامل الوراثية وأن الأمراض الشائعة تتأثر بأليلات مشتركة متعددة ذات حجم تأثير صغير. فرضية أخرى هي أن الأمراض الشائعة تسببها متغيرات نادرة مرتبطة اصطناعيًا بمتغيرات شائعة. في هذه الحالة ، تكون الإشارة الناتجة من GWAS عبارة عن ارتباط غير مباشر (اصطناعي) بين واحد أو أكثر من المتغيرات السببية النادرة في اختلال توازن الارتباط. من المهم أن ندرك أن هذه الظاهرة ممكنة عند اختيار مجموعة للعلامة SNPs. عندما يتم العثور على مرض مرتبط بنمط فرداني ، فإن بعض تعدد الأشكال في هذا النمط الفرداني سيكون لها ارتباط تركيبي بالمرض. لتحديد تعدد الأشكال السببية ، نحتاج إلى دقة أكبر في اختيار كتل النمط الفرداني. نظرًا لأن تقنيات تسلسل الجينوم بالكامل تتغير بسرعة وتصبح أقل تكلفة ، فمن المحتمل أنها ستحل محل تقنيات التنميط الجيني الحالية التي توفر الدقة اللازمة لتحديد المتغيرات السببية.

تحرير HapMap

نظرًا لأن تسلسل الجينوم الكامل للأفراد لا يزال باهظ التكلفة ، فقد تم إنشاء مشروع HapMap الدولي بهدف تعيين الجينوم البشري لتجمعات النمط الفرداني (كتل النمط الفرداني) التي يمكن أن تصف الأنماط الشائعة للتنوع الجيني البشري. من خلال تعيين الجينوم بأكمله للأنماط الفردانية ، يمكن تحديد علامات SNPs لتمثيل كتل النمط الفرداني التي تم فحصها بواسطة الدراسات الجينية. عامل مهم يجب مراعاته عند التخطيط لدراسة جينية هو التكرار والمخاطر التي تتكبدها أليلات معينة. يمكن أن تختلف هذه العوامل باختلاف المجموعات السكانية ، لذلك استخدم مشروع HapMap مجموعة متنوعة من تقنيات التسلسل لاكتشاف وتصنيف النيوكلوتايد من مجموعات مختلفة من السكان. في البداية ، قام المشروع بتسلسل الأفراد من سكان اليوروبا المنحدرين من أصل أفريقي (YRI) ، وسكان ولاية يوتا من أصول أوروبية غربية (CEU) ، وأفراد غير مرتبطين من طوكيو ، اليابان (JPT) وأفراد من الصينيين الهان غير المرتبطين من بكين ، الصين (CHB). تم مؤخرًا توسيع مجموعات البيانات الخاصة بهم لتشمل مجموعات سكانية أخرى (11 مجموعة) [1]

خطوات تحديد علامة SNP تحرير

اختيار أكبر علامة بالمعلومات SNPs هو مشكلة NP كاملة. ومع ذلك ، يمكن تصميم الخوارزميات لتوفير حل تقريبي ضمن هامش الخطأ. [12] المعايير اللازمة لتحديد كل علامة من خوارزمية اختيار SNP هي التالية:

  1. تحديد منطقة للبحث - ستحاول الخوارزمية تحديد علامة SNPs في الحي N (t) من SNP t الهدف
  2. حدد مقياسًا لتقييم جودة العلامات - يحتاج المقياس إلى قياس مدى جودة توقع SNP t المستهدف باستخدام مجموعة من جيرانه N (t) ، أي مدى جودة علامة SNP كممثل لـ SNPs في الحي N (t) يمكن أن يتوقع هدف SNP t . يمكن تعريفه على أنه احتمال أن يكون SNP t الهدف له قيم مختلفة لأي زوج من الأنماط الفردانية i و j حيث تختلف قيمة SNP s أيضًا لنفس الأنماط الفردية. يمكن تمثيل المعلوماتية للمقياس من حيث نظرية الرسم البياني ، حيث يتم تمثيل كل SNP s كرسم بياني Gs العقد التي هي أنماط فردية. Gs لها حافة بين العقد (i ، j) إذا وفقط إذا كانت قيم s مختلفة للأنماط الفردانية Hi ، Hj. [12]
  3. اشتق الخوارزمية للعثور على تعدد الأشكال التمثيلي - الهدف من الخوارزمية هو العثور على أقل مجموعة فرعية من العلامات SNPs المحددة بأقصى قدر من المعلومات بين كل علامة SNP مع كل SNP هدف آخر
  4. تحقق من صحة الخوارزمية

تحرير اختيار الميزة

تنقسم طرق تحديد الميزات إلى فئتين: طرق التصفية وطرق التجميع. خوارزميات التصفية هي خوارزميات معالجة مسبقة عامة لا تفترض استخدام طريقة تصنيف محددة. على النقيض من ذلك ، تقوم خوارزميات الغلاف "بلف" تحديد الميزة حول مصنف معين وتحديد مجموعة فرعية من الميزات بناءً على دقة المصنف باستخدام التحقق المتبادل. [13]

يجب أن تتمتع طريقة اختيار الميزة المناسبة لاختيار علامة SNPs بالخصائص التالية:

  • مقياس جيد لعدد كبير من النيوكلوتايد
  • لا تتطلب تصنيفًا صريحًا للفئة ولا ينبغي أن تفترض استخدام مصنف محدد لأن التصنيف ليس الهدف من وضع علامات على اختيار SNP
  • تسمح للمستخدم بتحديد أعداد مختلفة من تعدد أشكال النيوكلوتايد للعلامات لكميات مختلفة من فقدان المعلومات المسموح به
  • لها أداء مشابه مع طرق أخرى تفي بالشروط الثلاثة الأولى.

تحرير خوارزميات التحديد

تم اقتراح العديد من الخوارزميات لاختيار علامة SNPs. اعتمد النهج الأول على مقياس جودة مجموعات SNP وبحث عن مجموعات فرعية SNP صغيرة ولكنها تحقق قيمة عالية للمقياس المحدد. يعد فحص كل مجموعة فرعية من SNP للعثور على مجموعات جيدة أمرًا ممكنًا من الناحية الحسابية فقط لمجموعات البيانات الصغيرة.

يستخدم نهج آخر تحليل المكون الرئيسي (PCA) للعثور على مجموعات فرعية من SNPs تلتقط غالبية تباين البيانات. يتم استخدام طريقة النوافذ المنزلقة لتطبيق PCA بشكل متكرر على مناطق الكروموسومات القصيرة. هذا يقلل من البيانات المنتجة وكذلك لا يتطلب وقت البحث الأسي. ومع ذلك ، ليس من المجدي تطبيق طريقة PCA على مجموعات كبيرة من البيانات الصبغية لأنها معقدة حسابيًا. [13]

الأسلوب الأكثر استخدامًا ، وهو الأسلوب القائم على الكتلة ، يستغل مبدأ اختلال التوازن الملحوظ داخل كتل النمط الفرداني. [12] تم تصميم العديد من الخوارزميات لتقسيم مناطق الكروموسومات إلى كتل من النمط الفرداني والتي تعتمد على تنوع النمط الفرداني ، واختبار المشعرات الأربعة ، وتعقيد المعلومات ، وتم اختيار تعدد أشكال تعدد الأشكال (SNPs) التي تنتمي إلى تلك الكتلة. الافتراض الرئيسي في هذه الخوارزمية هو أن SNPs ثنائية البيليلي. [14] العيب الرئيسي هو أن تعريف الكتل ليس دائمًا مباشرًا. على الرغم من وجود قائمة معايير لتشكيل كتل النمط الفرداني ، فلا يوجد إجماع على ذلك. أيضًا ، يتجاهل التحديد القائم على الارتباطات المحلية للعلامة SNPs الارتباطات بين الكتل. [12]

على عكس النهج القائم على الكتلة ، لا يعتمد النهج الخالي من الكتل على بنية الكتلة. من المعروف أن معدلات تكرار SNP وإعادة التركيب تختلف عبر الجينوم وقد أبلغت بعض الدراسات عن مسافات LD أطول بكثير من أحجام الكتلة القصوى المبلغ عنها. وضع حدود صارمة للحي غير مرغوب فيه والنهج الخالي من الكتل يبحث عن علامة SNPs على مستوى العالم. هناك عدة خوارزميات للقيام بذلك. في خوارزمية واحدة ، يتم تمثيل SNPs بدون علامات على أنها وظائف منطقية لـ SNPs للعلامة وتستخدم تقنيات نظرية المجموعة لتقليل مساحة البحث. تبحث خوارزمية أخرى عن مجموعات فرعية من العلامات التي يمكن أن تأتي من كتل غير متتالية. بسبب حي العلامة ، يتم تقليل مساحة البحث. [13]

أمثلية تحرير

مع تزايد عدد الأفراد الذين تم تنميطهم وراثيًا وعدد النيوكلوتايد في قواعد البيانات ، يستغرق اختيار علامة SNP وقتًا طويلاً للحساب. من أجل تحسين كفاءة طريقة اختيار علامة SNP ، تتجاهل الخوارزمية أولاً أن SNPs تكون ثنائية الاتجاه ، ثم تضغط طول (رقم SNP) لمصفوفة النمط الفرداني عن طريق تجميع مواقع SNP بنفس المعلومات. تسمى مواقع SNP التي تقسم أنماط الفرد في نفس المجموعة مواقع متكررة. تسمى مواقع SNP التي تحتوي على معلومات مميزة داخل كتلة بالمواقع غير الزائدة عن الحاجة (NRS). من أجل زيادة ضغط مصفوفة النمط الفرداني ، تحتاج الخوارزمية إلى العثور على علامة SNPs بحيث يمكن تمييز جميع الأنماط الفردية للمصفوفة. باستخدام فكرة التقسيم المشترك ، يتم توفير خوارزمية اختيار علامة SNPs فعالة. [14]

التحقق من دقة تحرير الخوارزمية

اعتمادًا على كيفية تحديد علامة SNPs ، تم استخدام طرق تنبؤ مختلفة أثناء عملية التحقق من الصحة. تم استخدام طريقة التعلم الآلي للتنبؤ بالنمط الفرداني المتروك. توقع نهج آخر أليلات SNP n بدون علامات من علامة SNPs التي لها أعلى معامل ارتباط مع n. إذا تم العثور على علامة واحدة شديدة الارتباط SNP t ، يتم تعيين الأليلات بحيث تتوافق تردداتها مع ترددات أليل t. عندما يكون للعلامات المتعددة SNPs نفس معامل الارتباط (العالي) مع n ، فإن الأليل المشترك لـ n له ميزة. من السهل ملاحظة أن طريقة التنبؤ في هذه الحالة تتفق جيدًا مع طريقة الاختيار ، والتي تستخدم PCA في مصفوفة معاملات الارتباط بين SNPs. [13]

هناك طرق أخرى لتقييم دقة طريقة اختيار العلامة SNP. يمكن تقييم الدقة من خلال مقياس الجودة R2 ، وهو مقياس الارتباط بين الأعداد الحقيقية لنسخ النمط الفرداني المحددة على المجموعة الكاملة من SNPs والعدد المتوقع لنسخ النمط الفرداني حيث يعتمد التنبؤ على مجموعة فرعية من علامات SNPs. يفترض هذا المقياس بيانات ثنائية الصبغيات واستنتاجًا صريحًا للأنماط الفردانية من الأنماط الجينية. [13]

تعتمد طريقة تقييم أخرى بسبب كلايتون على قياس تنوع الأنماط الفردانية. يتم تعريف التنوع على أنه العدد الإجمالي للاختلافات في جميع المقارنة الزوجية بين الأنماط الفردانية. الفرق بين زوج من الأنماط الفردانية هو مجموع الاختلافات في جميع أشكال النيوكلوتايد. يمكن استخدام مقياس تنوع كلايتون لتحديد مدى جودة تمييز مجموعة من علامات النيوكلوتايد بين أنماط الفرد المختلفة. هذا المقياس مناسب فقط لكتل ​​النمط الفرداني ذات التنوع الفرداني المحدود وليس من الواضح كيفية استخدامه لمجموعات البيانات الكبيرة التي تتكون من كتل النمط الفرداني المتعددة. [13]

تقوم بعض الأعمال الحديثة بتقييم خوارزميات تحديد SNPs الخاصة بالعلامات بناءً على مدى جودة استخدام SNPs الوسم للتنبؤ بالعلامات SNPs بدون علامات. يتم تحديد دقة التنبؤ باستخدام التحقق المتبادل مثل ترك واحد للخارج أو الانتظار. في التحقق المتقاطع ، لكل تسلسل في مجموعة البيانات ، يتم تشغيل الخوارزمية على بقية مجموعة البيانات لتحديد مجموعة دنيا من علامات SNPs. [13]

محدد العلامات تحرير

Tagger هي أداة ويب متاحة لتقييم وتحديد علامات SNPs من بيانات النمط الجيني مثل مشروع HapMap الدولي. يستخدم الأساليب الزوجية ومقاربات النمط الفرداني متعدد العلامات. يمكن للمستخدمين تحميل بيانات التركيب الجيني HapMap أو تنسيق النسب وسيتم حساب أنماط اختلال الارتباط. تتيح خيارات Tagger للمستخدم تحديد معالم الكروموسومات ، والتي تشير إلى مناطق الاهتمام في الجينوم لاختيار علامات SNPs. ينتج البرنامج بعد ذلك قائمة بالعلامات SNPs وقيم الاختبار الإحصائية الخاصة بها بالإضافة إلى تقرير التغطية. تم تطويره من قبل بول دي باكر في مختبرات ديفيد ألتشولر ومارك دالي في مركز البحوث الجينية البشرية في مستشفى ماساتشوستس العام وكلية الطب بجامعة هارفارد ، في معهد برود. [15]

تحرير CLUSTAG و WCLUSTAG

في البرنامجين المجانيين CLUSTAG و WCLUSTAG ، تحتوي على مجموعة خوارزميات وغطاء مجموعة للحصول على مجموعة من علامات SNPs التي يمكن أن تمثل جميع SNPs المعروفة في منطقة كروموسومية. يتم تنفيذ البرامج باستخدام Java ، ويمكن تشغيلها في نظام Windows الأساسي بالإضافة إلى بيئة Unix. تم تطويرها بواسطة SIO-IONG AO et al. في جامعة هونغ كونغ. [16] [17]


ملخص

حددت دراسات الارتباط على مستوى الجينوم (GWAS) لمؤشر كتلة الجسم ، ونسبة الخصر إلى الورك ، وسمات السمنة الأخرى أكثر من 300 تعدد أشكال النوكليوتيدات المفردة (SNPs). على الرغم من وجود سبب للأمل في أن تؤدي هذه الاكتشافات في النهاية إلى عوامل وقائية وعلاجية جديدة للسمنة ، فإن هذا سيستغرق وقتًا لأن مثل هذه التطورات تتطلب فهمًا ميكانيكيًا مفصلاً لكيفية تأثير SNP على النمط الظاهري (وهذه المعلومات غير متوفرة إلى حد كبير). لحسن الحظ ، لم يمنع عدم وجود معلومات وظيفية نتائج GWAS من تقديم رؤى ثاقبة في بيولوجيا السمنة. يتم إثراء الجينات القريبة من الموقع الذي ينظم كتلة الجسم الكلية للتعبير عنها في الجهاز العصبي المركزي ، بينما يتم إثراء جينات توزيع الدهون في الأنسجة الدهنية نفسها. كشفت تحليلات الجينات حسب البيئة وتفاعل نمط الحياة أن بيئتنا المسببة للسمنة على نحو متزايد قد تزيد من المخاطر الجينية للسمنة ، ومع ذلك فإن الأشخاص الأكثر عرضة للخطر يمكن أن يخففوا من هذا الخطر عن طريق زيادة النشاط البدني وربما عن طريق تجنب مكونات غذائية معينة. تم استخدام نتائج GWAS أيضًا في تحليلات التوزيع العشوائي مندل التي تبحث في العلاقة السببية بين السمنة ومضاعفاتها المفترضة العديدة. في دعم الارتباط السببي للسمنة بمرض السكري ، وأمراض القلب التاجية ، وأنواع معينة من السرطان ، وحالات أخرى ، فإن هذه التحليلات لها صلة إكلينيكية في تحديد النتائج التي يمكن الوقاية منها من خلال تدخلات إنقاص الوزن.


Niccoli، T. & amp Partridge، L. الشيخوخة كعامل خطر للإصابة بالأمراض. بالعملة. بيول. 22، R741-R752 (2012).

Andersen، S.L، Sebastiani، P.، Dworkis، D.A، Feldman، L. & amp Perls، T. T. جي جيرونتول. سر. أ 67, 395–405 (2012).

كينيدي ، ب.ك.وآخرون. الشيخوخة: دافع مشترك للأمراض المزمنة وهدف لتدخلات جديدة. زنزانة 159, 709 (2014).

Partridge، L.، Deelen، J. & amp Slagboom، P. E. مواجهة التحديات العالمية للشيخوخة. طبيعة سجية 561, 45–56 (2018).

Vijg، J. & amp Suh، Y. علم الوراثة من طول العمر والشيخوخة. Annu. القس ميد. 56, 193–212 (2005).

جاغر ، سي وآخرون. عدم المساواة في سنوات الحياة الصحية في 25 دولة في الاتحاد الأوروبي في 2005: تحليل الانحدار التلوي عبر الوطني. لانسيت 372, 2124–2131 (2008).

ديلين ، جيه وآخرون. يحدد التحليل التلوي على مستوى الجينوم لطول عمر الإنسان موضعًا جديدًا يمنح البقاء على قيد الحياة بعد 90 عامًا من العمر. بشر. مول. جينيه. 23, 4420–4432 (2014).

فورتني ، ك وآخرون. يحدد الفحص على مستوى الجينوم الذي تم تحديده من خلال الأمراض المرتبطة بالعمر مواضع طول العمر البشري الاستثنائي. بلوس جينيت 11، e1005728 (2015).

تسنغ ، واي وآخرون. ترتبط المواقع الجديدة والمسارات بشكل كبير بطول العمر. علوم. اعادة عد. 6, 21243 (2016).

سلاجبوم ، بي إي ، فان دن بيرج ، إن آند أمب ديلين ، جي فينوم والدراسات القائمة على الجينوم في شيخوخة الإنسان وطول العمر: نظرة عامة. بيوكيم. بيوفيز. اكتا 1864, 2742–2751 (2018).

والتر ، س وآخرون. دراسة الارتباط على مستوى الجينوم للشيخوخة. نيوروبيول. شيخوخة 32، 2109 –15 (2011).

جوشي ، ب.ك.وآخرون. المتغيرات القريبة من chrna3 / 5 و apoe لها تأثيرات مرتبطة بالعمر والجنس على عمر الإنسان. نات. كومون. 7, 11174 (2016).

جوشي ، ب.ك.وآخرون. يربط التحليل التلوي على مستوى الجينوم hla-dqa1 / drb1 و lpa وعوامل نمط الحياة مع طول عمر الإنسان. نات. كومون. 8, 910 (2017).

مكديد ، إيه إف وآخرون. يكشف فحص الارتباط البايزي عن المواقع المرتبطة بعمر الإنسان والعلامات الحيوية المرتبطة. نات. كومون. 8, 15842 (2017).

جومبيرتز ، ب. حول طبيعة الوظيفة المعبرة عن قانون الوفيات البشرية ، وعن طريقة جديدة لتحديد قيمة الحياة الطارئة. فيلوس. عبر. R. Soc. لوند. 115, 513–583 (1825).

Makeham، W. M. على قانون الوفيات وبناء جداول الأقساط. Assur. ماج. J. Inst. اكتوار. 8, 301–310 (1860).

Schemper، M.، Kaider، A.، Wakounig، S. & amp Heinze، G. تقدير ارتباط أوقات الفشل ثنائي المتغير تحت الرقابة. ستات. ميد. 32, 4781–4790 (2013).

Tutkun، N.A & amp Demirhan، H. نهج بايزي لنموذج cox-gompertz. حسيت. J. الرياضيات. ستات. 45, 1621–1639 (2016).

Devlin، B. & amp Roeder، K. Genomic Control for Association Studies. القياسات الحيوية 55, 997–1004 (1999).

بوليك سوليفان ، ب.ك.وآخرون. يميز انحدار الدرجة Ld الارتباك عن التعددية الجينية في دراسات الارتباط على مستوى الجينوم. نات. جينيه. 47, 291–295 (2015).

يانج ، جيه وآخرون. يحدد التحليل متعدد الأطراف الشرطي والمشترك لإحصائيات ملخص GWAS المتغيرات الإضافية التي تؤثر على السمات المعقدة. نات. جينيه. 44, 369–375 (2012).

زينج ، جيه وآخرون. Ld hub: قاعدة بيانات مركزية وواجهة ويب لأداء انحدار الدرجة ld الذي يزيد من إمكانات بيانات GWAS على مستوى الملخص من أجل التوريث وتحليل الارتباط الجيني. المعلوماتية الحيوية 33, 272–279 (2017).

نيكباي ، إم وآخرون. تحليل تلوي شامل يعتمد على الجينوم على مستوى الجينوم لمرض الشريان التاجي. نات. جينيه. 47, 1121 (2015).

موريس ، أ ب وآخرون. يوفر تحليل الارتباط على نطاق واسع نظرة ثاقبة في البنية الجينية والفيزيولوجيا المرضية لمرض السكري من النوع 2. نات. جينيه. 44, 981 (2012).

سورانزو ، ن. وآخرون. تؤثر المتغيرات الشائعة في 10 مواقع جينية على مستويات الهيموجلوبين A1C عبر مسارات نسبة السكر في الدم وغير السكر في الدم. داء السكري 59, 3229–3239 (2010).

فوربيرج ، هـ وآخرون. تحدد التحليلات الوصفية على مستوى الجينوم مواقع متعددة مرتبطة بسلوك التدخين. نات. جينيه. 42, 441 (2010).

Dupuis، J. et al. مواضع وراثية جديدة متورطة في توازن الجلوكوز الصائم وتأثيرها على خطر الإصابة بالسكري من النوع 2. نات. جينيه. 42, 105 (2010).

باربان ، ن. وآخرون. يحدد التحليل على مستوى الجينوم 12 موقعًا يؤثر على السلوك الإنجابي البشري. نات. جينيه. 48, 1462 (2016).

بيلينغ ، إل سي وآخرون. يتأثر طول عمر الإنسان بالعديد من المتغيرات الجينية: دليل من 75000 مشارك في البنك الحيوي في المملكة المتحدة. شيخوخة 8, 547 (2016).

Kettunen، J. et al. تحدد الدراسة على مستوى الجينوم للدوران المستقلبات 62 موقعًا وتكشف عن تأثيرات جهازية جديدة لـ LPA. نات. كومون. 7, 11122 (2016).

مكلارين ، دبليو وآخرون. متنبئ تأثير متغير الفرقة. جينوم بيول. 17, 122 (2016).

بيرس ، تي إتش وآخرون. التفسير البيولوجي لدراسات الارتباط على مستوى الجينوم باستخدام وظائف الجينات المتوقعة. نات. كومون. 6, 5890 (2015).

كونسورتيوم ، جي بي وآخرون. خريطة لتباين الجينوم البشري من التسلسل على نطاق السكان. طبيعة سجية 467, 1061 (2010).

ستالي ، جيه آر وآخرون. Phenoscanner: قاعدة بيانات للجمعيات الوراثية البشرية والنمط الظاهري. المعلوماتية الحيوية 32, 3207–3209 (2016).

باريت ، جيه إتش وآخرون.تحدد دراسة الارتباط على مستوى الجينوم ثلاثة مواقع جديدة للإصابة بسرطان الجلد. نات. جينيه. 43, 1108 (2011).

أبنيت ، سي سي وآخرون. المتغيرات الوراثية في 2q33 وخطر الإصابة بسرطان الخلايا الحرشفية المريئي في الصين: تحليل تلوي لدراسات الارتباط على نطاق الجينوم. بشر. مول. جينيه. 21, 2132–2141 (2012).

إريكسون ، ن. وآخرون. تؤدي الدراسات المستندة إلى الويب والموجهة إلى المشاركين إلى جمعيات وراثية جديدة للسمات المشتركة. بلوس جينيت. 6، e1000993 (2010).

تشانغ ، م وآخرون. تحدد دراسات الارتباط على مستوى الجينوم العديد من المواقع الجديدة المرتبطة بسمات التصبغ وخطر الإصابة بسرطان الجلد لدى الأمريكيين الأوروبيين. بشر. مول. جينيه. 22, 2948–2959 (2013).

دافي ، دي إل وآخرون. متغيرات Irf4 لها تأثيرات خاصة بالعمر على عدد الحمى وتؤهب للإصابة بسرطان الجلد. أكون. J. الإنسان. جينيه. 87, 6–16 (2010).

ويلر ، سي جيه وآخرون. اكتشاف وتنقيح المواقع المرتبطة بمستويات الدهون. نات. جينيه. 45, 1274 (2013).

جولتون ، ك.جيه وآخرون. يحدد رسم الخرائط الجينية الدقيقة والتعليقات التوضيحية الجينية الآليات السببية في مواقع الإصابة بمرض السكري من النوع 2. نات. جينيه. 47, 1415 (2015).

شونجين ، د. وآخرون. تربط المواقع الجينية الجديدة بيولوجيا الدهون والأنسولين بتوزيع الدهون في الجسم. طبيعة سجية 518, 187 (2015).

بروير ، ل. وآخرون. GWAS من اتحاد طول العمر المسؤول يؤكد ترشيح apoe و foxo3. جي جيرونتول. سر. أ 70, 110–118 (2014).

Crimmins ، E. M. Lifespan و healthspan: الماضي والحاضر والوعد. أخصائي الشيخوخة 55, 901–911 (2015).

Kaeberlein، M. ما مدى صحة مفهوم healthspan؟ علم الجيرو 40, 1–4 (2018).

بيركوف ، تي في وآخرون. استخراج العمر البيولوجي من البيانات الطبية الحيوية من خلال التعلم العميق: الكثير من الأشياء الجيدة؟ علوم. اعادة عد. 8, 5210 (2018).

Papoz، L.، Balkau، B. & amp Lellouch، J. عد الحالات في علم الأوبئة: قيود الأساليب القائمة على مصادر البيانات المتعددة. كثافة العمليات ياء Epidemiol. 25, 474–478 (1996).

Yoshihara، H. & amp Yoneoka، D. فهم إحصائيات وقيود تحليلات قواعد البيانات الكبيرة. العمود الفقري 39, 1311–1312 (2014).

Izquierdo، J.N & amp Schoenbach، V.J. إمكانات وقيود البيانات من سجلات سرطان الدولة القائمة على السكان. أكون. ياء الصحة العامة 90, 695 (2000).

هاريسون ، دي إي وآخرون. أكاربوز ، 17-α-الاستراديول ، وحمض نورديهيدروغواياريتيك يطيلان عمر الفأر بشكل تفضيلي في الذكور. شيخوخة الخلية 13, 273–282 (2014).

سترونج ، آر وآخرون. عمر أطول في ذكور الفئران المعالجة بمنبه استروجين ضعيف ، ومضاد للأكسدة ، و αمثبط جلوكوزيداز أو محفز nrf2. شيخوخة الخلية 15, 872–884 (2016).

هورفاث ، إس وآخرون. تؤدي السمنة إلى تسريع الشيخوخة اللاجينية للكبد البشري. بروك. ناتل أكاد. علوم. 111, 15538–15543 (2014).

Piper، M.، Selman، C.، McElwee، J. & amp Partridge، L. فصل السبب عن النتيجة: كيف تتحكم إشارات الأنسولين / igf في عمر الديدان والذباب والفئران؟ J. المتدرب. ميد. 263, 179–191 (2008).

الورود ، أ. وآخرون. يتنبأ تعدد الأشكال متغير الطول tomm40 بعمر ظهور مرض الزهايمر في وقت متأخر. فارم. ج. 10, 375 (2010).

Ziegler-Graham، K.، Brookmeyer، R.، Johnson، E. & amp Arrighi، H. M. الاختلاف العالمي في الوقت المضاعف لمعدلات الإصابة بمرض الزهايمر. خرف ألزهايمر. 4, 316–323 (2008).

لامبرت ، ج. وآخرون. يحدد التحليل التلوي لـ 74046 فردًا 11 موقعًا جديدًا للإصابة بمرض الزهايمر. نات. جينيه. 45, 1452 (2013).

بوليك سوليفان ، ب. وآخرون. أطلس للارتباطات الجينية عبر الأمراض والصفات البشرية. نات. جينيه. 47, 1236–1241 (2015).

كارلسون ، آي وآخرون. القابلية الجينية للإصابة بأمراض القلب والأوعية الدموية وخطر الإصابة بالخرف. ترجمة. الطب النفسي 7، e1142 (2017).

هوليداي ، إي جي وآخرون. نظرة ثاقبة في البنية الجينية لمراحل التنكس البقعي المرتبط بالعمر المبكرة: تحليل تلوي لدراسة الارتباط على نطاق الجينوم. بلوس واحد 8، e53830 (2013).

Wilhelmsen ، L. وآخرون. العوامل المرتبطة ببلوغ 90 عامًا: دراسة عن الرجال الذين ولدوا عام 1913 في جوتنبرج ، السويد. J. المتدرب. ميد. 269, 441–451 (2011).

سودلو ، سي وآخرون. UK Biobank: مصدر مفتوح للوصول لتحديد أسباب مجموعة واسعة من الأمراض المعقدة في منتصف العمر وكبار السن. بلوس ميد. 12، e1001779 (2015).

بيكروفت ، سي وآخرون. مورد البنك الحيوي في المملكة المتحدة مع بيانات النمط الظاهري والجينومية العميقة. طبيعة سجية 562, 203 (2018).

O’Connell، J. et al. تقدير النمط الفرداني لمجموعات البيانات على نطاق البنك الحيوي. نات. جينيه. 48, 817 (2016).

Howie، B.، Marchini، J. & amp Stephens، M. تضمين النمط الجيني بآلاف الجينومات. G3: الجينات ، الجينوم ، الجينات. 1, 457–470 (2011).

Tarkhov، A. E.، Menshikov، L. I. & amp Fedichev، P. O. Strehler-Mouldvan J. Theor. بيول. 416, 180–189 (2017).

Haller، T.، Kals، M.، Esko، T.، Mägi، R. & amp Fischer، K. Regscan: أداة GWAS لتقدير سريع لتأثيرات الأليل على السمات المستمرة ومجموعاتها. نبذة. بيوينفورما. 16, 39–44 (2015).

راندال ، جيه سي وآخرون. تُظهر دراسات الارتباط على مستوى الجينوم الطبقي على نطاق الجنس بما في ذلك 270.000 فرد ازدواج الشكل الجنسي في المواقع الجينية لسمات القياسات البشرية. بلوس جينيت. 9، e1003500 (2013).

كيشيف ، ج. وآخرون. طرق محسنة لرسم خرائط دقيقة متعددة السمات لمواقع المخاطر متعددة الاتجاهات. المعلوماتية الحيوية 33, 248–255 (2017).

تشانغ ، سي سي وآخرون. طقطقة الجيل الثاني: الارتقاء إلى مستوى التحدي المتمثل في مجموعات البيانات الأكبر والأكثر ثراءً. جيجاسينس 4, 7 (2015).

كونسورتيوم ، جي بي وآخرون. مرجع عالمي للتنوع الجيني البشري. طبيعة سجية 526, 68 (2015).

زينين ، إيه وآخرون. إحصائيات ملخص الارتباط على مستوى الجينوم لصحة الإنسان. زينودو، https://doi.org/10.5281/zenodo.1302861 (2018).


5. الخلاصة

كشف تحليل المعلوماتية الحيوية أن تعدد الأشكال في ستة جينات (NCOR1، GATA3، CDH1، ATM، AKT1، و PTEN) بشكل كبير مع مستويات التعبير المقابلة وشاركوا في مسارات متعددة تشارك في تطور السرطان. بالإضافة إلى ذلك ، أشار تحليل إضافي إلى أن طفرة SNP في مواقع AKT1 rs121434592 و CDH1 rs587783047 و GATA3 rs763236375 كانت الأسباب المهمة للتأثير على التعبير الجيني. بالإضافة إلى ذلك ، وجد تحليل OS و RFS أن التعبير عن NCOR1 ، GATA3 ، CDH1 ، و ماكينة الصراف الآلي كانت مرتبطة ارتباطًا وثيقًا ببقاء مرضى كولومبيا البريطانية على قيد الحياة. لذلك ، يمكن استخدام اكتشاف الطفرات الجينية واستكشاف تعبيرها المقابل للتنبؤ بتكهن المرضى. ستتطلب النتائج التحقق من صحة الدراسات السريرية واسعة النطاق لتحديد دقتها وحساسيتها في تكوين الأورام والتنبؤ بنتائج المرضى. ومع ذلك ، فإن تركيز هذه الدراسة هو تقديم أفكار جديدة للتشخيص السريري وتقييم الإنذار من خلال تحليل المعلوماتية الحيوية. توفر نتائجنا أساسًا هامًا للمعلوماتية الحيوية وأساسًا نظريًا ذي صلة لتوجيه دراسات المتابعة على BC.


كيف يمكنني العثور على SNP الأكثر دراسة للجينات؟ - مادة الاحياء

التنميط الجيني ، مشكلة تجميع النمط الفردي ، خريطة النمط الفرداني ، الجينوم الوظيفي والبروتيوميات

من إعداد كالي سميث

1 مقدمة في النيوكلوتايد

توفر الوثيقة التالية مقدمة لتعدد أشكال النوكليوتيدات الفردية والدافع الذي توفره للبحث الحالي في علم الصيدلة الجيني (ومجالات أخرى) والتكنولوجيا لتسهيل هذا البحث. تتمثل المبادرة الرئيسية وراء العمل المتعلق بالـ SNP في استخدام الاختلافات الجينية بين الأشخاص للتنبؤ بالأنماط الظاهرية والتطور. سنناقش بشكل عام النيوكلوتايد كما تحدث في تسلسل الجينوم البشري ما لم ينص على خلاف ذلك. هذا النص مصحوب بمجموعة من الشرائح على SNPs المتوفرة أيضًا في هذا الموقع.

1.1 تعدد الأشكال الجيني

تعدد الأشكال الجيني اختلاف في تسلسل الحمض النووي بين الأفراد أو المجموعات أو السكان. تتضمن المصادر SNPs وتكرارات التسلسل وعمليات الإدراج والحذف وإعادة التركيب. (على سبيل المثال ، قد يؤدي تعدد الأشكال الجيني إلى ظهور عيون زرقاء مقابل عيون بنية ، أو شعر مفرود مقابل شعر مجعد). قد يكون تعدد الأشكال الجيني نتيجة عمليات صدفة ، أو قد يكون ناتجًا عن عوامل خارجية (مثل الفيروسات أو الإشعاع). إذا ثبت أن الاختلاف في تسلسل الحمض النووي بين الأفراد مرتبط بالمرض ، فعادة ما يطلق عليه طفرة جينية. التغييرات في تسلسل الحمض النووي التي تم التأكد من أنها ناجمة عن عوامل خارجية تسمى أيضًا "الطفرات" بدلاً من "الأشكال المتعددة". [المصدر: معجم الجينوم PHRMA]

طفرة جينية تغيير في تسلسل النوكليوتيدات لجزيء DNA. الطفرات الجينية هي نوع من تعدد الأشكال الجيني. يستخدم مصطلح "طفرة" ، على عكس "تعدد الأشكال" ، بشكل عام للإشارة إلى التغييرات في تسلسل الحمض النووي التي لا توجد في معظم الأفراد من نوع ما ، وإما أنها مرتبطة بمرض (أو خطر الإصابة بمرض) أو نتجت عن الضرر الناجم عن عوامل خارجية (مثل الفيروسات أو الإشعاع). [المصدر: معجم الجينوم PHRMA]

يعد تعدد الأشكال أحادي النوكليوتيدات تباينًا في المصدر في الجينوم. إن SNP (& # 223nip ") هو طفرة أساسية واحدة في DNA. تعد SNPs الشكل الأكثر بساطة والأكثر شيوعًا لتعدد الأشكال الجيني في الجينوم البشري (90٪ من جميع تعدد أشكال الحمض النووي البشري).

هناك نوعان من بدائل قاعدة النوكليوتيدات تؤدي إلى تعدد الأشكال:

تباين التسلسل
يمكن قياس تباين التسلسل الناتج عن تعدد الأشكال من حيث تنوع النيوكليوتيدات ، ونسبة عدد الاختلافات الأساسية بين جينومين على عدد القواعد المقارنة. هذا ما يقرب من 1/1000 (1/1350) زوج أساسي بين اثنين من الكروموسومات المتكافئة.

لا يتم توزيع SNPs بشكل موحد على الجينوم البشري بأكمله ، ولا على جميع الكروموسومات ولا داخل كروموسوم واحد. هناك ثلث عدد SNPs داخل مناطق التشفير مثل SNPs في المنطقة غير المشفرة. وقد تبين أيضًا أن تباين التسلسل أقل بكثير بالنسبة للكروموسومات الجنسية. داخل كروموسوم واحد ، يمكن أن تتركز النيوكلوتايد حول منطقة معينة ، وعادة ما يشير ذلك إلى منطقة ذات اهتمام طبي أو بحثي. على سبيل المثال ، يُظهر التسلسل الذي يشفر البروتينات التي تقدم مستضدات للجهاز المناعي في الكروموسوم 6 تنوعًا عاليًا جدًا من النوكليوتيدات مقارنة بالمناطق الأخرى من ذلك الكروموسوم.

1.3 منطقة الترميز SNPs

قد يكون لـ SNP في منطقة الترميز تأثيران مختلفان على البروتين الناتج:

مرادف لا يسبب الاستبدال أي تغيير في الأحماض الأمينية للبروتين الذي ينتجه. وهذا ما يسمى أيضًا بالطفرة الصامتة.

غير مرادف ينتج عن الاستبدال تغيير في الحمض الأميني المشفر. تغير طفرة مغلوطة البروتين عن طريق إحداث تغيير في الكودون. تؤدي الطفرة غير المنطقية إلى رمز إنهاء في غير محله. ينتج عن نصف تسلسل SNPs المتسلسل تغييرات غير مترادفة في الكودون.

قد تحدث SNPs أيضًا في المناطق التنظيمية للجينات. هذه النيوكلوتايد قادرة على تغيير كمية أو توقيت إنتاج البروتين. يصعب العثور على مثل هذه النيوكلوتايد وفهمها ، كما أن تنظيم الجينات نفسه لم يتم فهمه بوضوح بعد.

1.4 النمط الظاهري والنمط الجيني والنمط الوراثي

يعد النمط الظاهري والنمط الجيني والنمط الفرداني من أهم المفاهيم الأساسية المتعلقة بـ SNPs. من المهم أن يكون لديك فهم واضح لكل مصطلح وعمليات التنميط الجيني والتنميط الفرداني.

النمط الظاهري الخصائص التي يمكن ملاحظتها للفرد كما تطورت تحت التأثيرات المشتركة للنمط الجيني للفرد وتأثيرات العوامل البيئية. [المصدر: Purves et al. الحياة: علم الأحياء]

الطراز العرقى وصف دقيق للدستور الجيني للفرد ، فيما يتعلق بسمة واحدة أو مجموعة أكبر من السمات. [المصدر: Purves et al. الحياة: علم الأحياء]. التكوين الجيني للكائن الحي كما يتضح من التحليل الجيني أو الجزيئي ، أي المجموعة الكاملة من الجينات ، السائدة والمتنحية ، التي تمتلكها خلية أو كائن حي معين. [IUPAC Biotech]

التنميط الجيني يتم تعريف التنميط الجيني عادة على أنه اكتشاف الأنماط الجينية للنيوكلوتايد SNPs الفردية. في الكائنات ثنائية الصبغيات (التي لها أليلات بديلة من تعدد الأشكال) ، مثل البشر ، قد يوفر الارتباط بين أنماط وراثية معينة للنيوكليوتيدات SNP على كل كروموسوم في زوج متماثل (النمط الفرداني) معلومات إضافية غير متوفرة من التنميط الجيني للـ SNP وحده. [تحديث CHI SNP]

النمط الفردي (النمط الجيني أحادي الصيغة الصبغية) نمط معين من تعدد الأشكال المتسلسلة (أو الأليلات) الموجودة في كروموسوم واحد. تميل هذه النيوكلوتايد إلى أن تكون موروثة معًا بمرور الوقت ويمكن أن تعمل كواسمات جينية للأمراض. يعد فحص مجموعات الكروموسومات المفردة (مجموعات أحادية الصيغة الصبغية) ، على عكس أزواج الكروموسومات المعتادة (مجموعات ثنائية الصبغيات) ، أمرًا مهمًا لأن الطفرات في نسخة واحدة من زوج كروموسوم يمكن إخفاءها بالتسلسلات العادية الموجودة في النسخة الأخرى [تحديث CHI SNP] . مجموعة أليلات من مواضع مرتبطة ارتباطًا وثيقًا توجد في كروموسوم واحد وتميل إلى التوارث معًا. الترتيب الخطي المرتب للأليلات على الكروموسوم. يعد تحليل النمط الفرداني مفيدًا في تحديد أحداث إعادة التركيب. [المصادر: Purves et al. الحياة: علم الأحياء ومعجم الجينوم PHRMA]

التنميط الفردي يتضمن التنميط الفردي تجميع الموضوعات حسب الأنماط الفردانية ، أو أنماط معينة من النيوكلوتايد المتسلسل ، الموجودة في كروموسوم واحد. [تحديث CHI SNPs]

الاختلاف الجينومي ، وبالتالي تعدد الأشكال ، هو المسؤول عن التنوع في الأنواع البشرية. ويترتب على ذلك أنه نظرًا لأن SNPs تمثل التنوع في الأنماط الجينية البشرية ، فيمكن تعيينها لمراعاة التنوع في الأنماط الظاهرية. قد تكون & # 239 الفردية SNPs بمثابة علامات إرشادية لجينات المرض ، ويُعتقد أن الأنماط الفردانية متفوقة لهذا الغرض. توفر دراسة الأنماط الفردانية داخل الجينات ، والتي تحظى أيضًا باهتمام كبير في الوقت الحالي ، الفرصة لاكتشاف علامات موثوقة للأنماط الظاهرية المختلفة "[CHI تحديث النيوكلوتايد]. تشكل هذه العلاقة الأساس والحافز لتحديد وتنميط النيوكلوتايد.

2 اكتشاف SNP والتنميط الجيني SNP

2.1 اكتشاف SNP أو اكتشاف SNP

تم تحديد أكثر من مليون تعدد أشكال النيوكلوتايد (1،255،326 مخططًا لأشكال النيوكلوتايد في SNP Consortium Organization). أظهرت تجارب التحقق من الصحة أن 95٪ من هذه الأشكال متعددة الأشكال فريدة وصالحة (وليست نتاجًا للخطأ أو التكرار).

تتضمن طرق اكتشاف / اكتشاف SNP مجموعة من التفاعلات الكيميائية الحيوية التي تعزل الموقع الدقيق لـ SNP المشتبه به ثم تحدد بشكل مباشر هوية SNP ، باستخدام إنزيم يسمى DNA polymerase. [المصدر: http://www.orchid.com/]

أيضًا ، تم اكتشاف العديد من SNPs في البداية من خلال مقارنة الجينومات المتسلسلة المختلفة. تم توسيع هذا العمل الآن ليشمل جهدًا أكبر بكثير لتحديد الأشكال الجينية للنيوكلوتايد (SNPs) للعديد من الجينومات من مجموعات سكانية مختلفة.

لاحظ الفرق بين اكتشاف / اكتشاف SNP وتسجيل SNP أو التنميط الجيني SNP. يسعى أحدهم إلى تحديد مواقع SNP الجديدة على الجينوم ، في حين أن الأساليب الأخرى & # 239 تتضمّن لتحديد الأنماط الجينية للعديد من الأفراد من أجل تعدد أشكال تعدد الأشكال التي تم اكتشافها بالفعل "[المعاهد الوطنية للصحة ، طرق اكتشاف وتسجيل تعدد أشكال النوكليوتيدات المفردة ، طلب التطبيقات ، يناير 9 ، 1998]. ينتهي هذا مناقشتنا لاكتشاف SNP. ما يلي هو نظرة عامة على التطبيقات ذات الصلة بـ "ما بعد الجينوم" مثل التنميط الجيني عالي الإنتاجية ، وتحديد الأنماط الفردانية من الأنماط الجينية ، ورسم خرائط النمط الفرداني.

2.2 التنميط الجيني SNP عالي الإنتاجية

تتضمن المرحلة الثانية من علم الجينوم البشري (الأولى هي تسلسل الجينوم البشري) فحصًا واسع النطاق لمختلف المجموعات البشرية بحثًا عن تعدد أشكال الحمض النووي. ستؤدي المعلومات التي تم جمعها إلى ارتباطات دقيقة بين النمط الجيني والنمط الظاهري.

التنميط الجيني SNP عالي الإنتاجية هو عملية تحديد قيم SNP بسرعة وفعالية من حيث التكلفة في أكبر عدد ممكن من الجينوم البشري الفردي. تتضمن خطوات التنميط الجيني SNP تحضير عينة الحمض النووي ، وتضخيم PCR ، ومقايسات المصفوفة الدقيقة. بالنسبة للخطوة الأخيرة ، يجب على التقنية تسمية مواقع SNP لكلا الأليلين في عينة الحمض النووي وتحديد القيم الأساسية باستخدام تقنية ميكروأري.

تعد Orchid Biocomputer و Affymetrix رائدين في توفير تقنية التنميط الجيني SNP. لقد طوروا مقايسات التنميط الجيني لتعدد أشكال النوكليوتيدات المفردة (SNP) التي تجمع بين تقنية التمديد التمهيدي GBA الخاصة بالأوركيد مع مصفوفة عالمية Affymetrix GeneChip. يمكن أن توفر تقنياتهم إنتاجية عالية جدًا تصل إلى 100000 نمط جيني / يوم. من المثير للاهتمام أن نلاحظ أن جميع التنميط الجيني للنظم الجينية تقريبًا تستخدم معدات Affymetrix (بما في ذلك GenFlex ، المصفوفة الدقيقة الشاملة من Affymetrix).

التنميط الجيني SNP عالي الإنتاجية يحقق هدف تسجيل القيم الأساسية لموقع SNP لآلاف الأشخاص من مجموعة سكانية معينة. ثم يتم استخدام بيانات النمط الجيني التي تم جمعها من التنميط الجيني عالي الإنتاجية لتحديد الأنماط الفردانية ذات الصلة. ثم يتم استخدام هذه المعلومات لرسم خرائط SNP والتي تمت مناقشتها بمزيد من التفصيل في هذا الملخص.

3 مشكلة تجميع النمط الفرداني SNP

أدخل التنميط الجيني SNP مشكلة حسابية معقدة (لحسن الحظ). تم نشر هذه المشكلة لأول مرة بواسطة Lancia et al. في الورقة البحثية "مشاكل SNPs والتعقيد والخوارزميات" ، متبوعة بـ & # 196 الاستراتيجيات اللوغاريتمية لمشكلة تجميع النمط الفرداني لتعدد أشكال النوكليوتيدات المفردة "ليبرت وآخرون. قبل فهم الدافع وراء هذه المشكلة ، من المهم أن تكون على دراية بما يلي مصطلحات.

مضاعف يتكون مكمل الكروموسوم من نسختين (متجانسات) من كل كروموسوم. في البشر ، يكون كل زوج كروموسوم من أصل مختلف (الأم ، الأب). [المصدر: Purves et al. الحياة: علم الأحياء]

أليل الأشكال البديلة للطابع الجيني الموجودة في موضع معين على الكروموسوم. [المصدر: Purves et al. الحياة: علم الأحياء]

متماثل كائن ثنائي الصبغيات له أليلات متطابقة لجين معين على كل من الكروموسومات المتجانسة. [المصدر: Purves et al. الحياة: علم الأحياء]

متغاير الزيجوت كائن ثنائي الصبغيات له أليلات مختلفة لجين معين على كل من الكروموسومات المتجانسة. [المصدر: Purves et al. الحياة: علم الأحياء]

النمط الفردي مجموعة أليلات من مواضع مرتبطة ارتباطًا وثيقًا توجد في كروموسوم واحد وتميل إلى التوارث معًا. الترتيب الخطي المرتب للأليلات على الكروموسوم. [المصادر: Purves et al. الحياة: علم الأحياء ومعجم الجينوم PHRMA]

تتضمن مشكلة تجميع النمط الفرداني SNP تحديد الأنماط الفردانية من أجزاء التسلسل الجيني التي تحددها التنميط الجيني SNP. لمزيد من المعلومات حول أنماط الفرد ، راجع قسم "خريطة النمط الفرداني" التالي. يمكن أيضًا تحديد الأنماط الفردية مباشرة من الحمض النووي الجيني. ومع ذلك ، يكون هذا في بعض الأحيان أكثر تكلفة وبطء من طريقة حسابية لتحديد الأنماط الفردانية.

تقدم تقنية التنميط الجيني البشري على نطاق واسع مشكلة خوارزمية مثيرة للاهتمام لتقسيم بيانات النمط الجيني SNP إلى أقسام النمط الفرداني. تنشأ المشكلة لأن الأجزاء الجينومية التي تشكل النمط الجيني للكائن ثنائي الصبغة تحتوي على نسختين من كل موقع أو كروموسوم (نمطين فردانيتين). يجب بعد ذلك تجميع شظايا الحمض النووي متعدد الأشكال في النمط الفرداني الأصلي.

تصف الأوراق الخوارزميات لتحديد الأنماط الفردانية على مناطق طويلة من أجزاء التسلسل القصير. يجب تقسيم الأجزاء المحاذية إلى مجموعتين وفقًا لتماثلها الأصلي. يتم إنجاز هذا التقسيم باستخدام قيم SNP المتضاربة بين الأجزاء لإنشاء مخطط تعارض SNP أو رسم بياني لتعارض الأجزاء. فيما يلي ملخص للورقتين المذكورتين.

مشكلة تجميع SNP (لانسيا)
مجموعة SNP عبارة عن مجموعة (S ، F ، R) حيث S عبارة عن مجموعة من n SNPs ، F هي مجموعة من أجزاء m و R علاقة R: S x F <0 ، A ، B> تشير إلى ما إذا كان لا يحدث SNP s S على جزء f (مميز ب 0) أو إذا حدث ، & # 223core "من s (A أو B).

التنميط الفردي الحسابي (لانسيا)
قسم من F إلى كتلتين: H1 و ح2 تسمى أنماط الفرد. يكون تجميع SNP `` ممكنًا '' عندما يكون هناك نمط فرداني مثل:

"s · S و" f، f · حأنا: R (s، f) = R (s، f) أو R (s، f) = 0 أو R (s، f) = 0.

يحتوي SNP s S الحالي على قيمة إما A أو B. تذكر أن الكائن الحي ثنائي الصبغة وأن هناك نسخًا من SNP في أجزاء مأخوذة من كلا متماثلين لكروموسوم العينة. إذا كان SNP متغاير الزيجوت ، فإن SNP سيكون له قيمة A في H.1 وباء في H.2 (أو العكس). إذا كان SNP متماثل الزيجوت ، فلا يمكن استخدامه للمساعدة في تحديد النمط الفرداني للجزء وبالتالي لا يتم اعتباره.

الشكل 1: تحدد الأوراق مصفوفة SNP كما هو موضح.

يتم استخدام كل من S و F للإنشاء الرسوم البيانية الصراع جيس وجF حتى تتمكن الخوارزمية من تحديد أقل عدد من الثغرات التي يجب إزالتها كأخطاء لجعل الرسوم البيانية خالية من التعارض. شظيتان وأنا وي تتعارض عندما يكون SNP موجودًا بحيث يكون R (fأنا، ق) 0 و R (صي، ق) 0 و R (صأنا، ق) R (صي، س). اثنين من SNPs s1 و s2 في صراع عند وجود جزأين و1 و2 مثل أن ثلاثة من R (ص1، س1)، الترددات اللاسلكية2، س1)، الترددات اللاسلكية1، س2) أو R (ص2، س2) لها نفس القيمة غير الصفرية وواحد لها قيمة غير صفرية معاكسة.

الشكل 2: مثال على مصفوفة SNP والرسم البياني لتعارض الأجزاء المرتبط ورسم تعارض SNP.

أصبحت مشكلة تجميع النمط الفرداني SNP الآن إما مشكلة إزالة الجزء الأدنى أو مشكلة إزالة الحد الأدنى من SNP. كلتا هاتين المشكلتين تأخذان GF أو جيس على التوالي كمدخلات وإرجاع حرف G كبير جدًاF هذا هو ثنائي الجزء (MAX المستحثة مشكلة الرسم البياني الفرعي ثنائي الجزء) أو G كبيرة جدًاس هذه مجموعة ثابتة (غطاء فيرتكس). لاحظ أن GF هو ثنائي إذا كان Gس هي مجموعة مستقرة. كل من هذه المشاكل هي NP-hard.

و الشكل 3: ممكن GF و Gس للمثال أعلاه.

مجموعة الحد الأقصى الثابت (Vertex Cover) هي مشكلة مدروسة جيدًا ويمكن مهاجمتها باستخدام واحدة من العديد من خوارزميات التقريب. لذلك سوف نركز على مشكلة إيجاد أكبر مخطط فرعي ثنائي الجزء في GF. الرسم البياني G ثنائي القسم إذا كان لا يحتوي على دورات فردية. لذلك سننظر في مشكلة MFR من حيث مشكلة الغلاف ، مشكلة تغطية الدورة الفردية.

بوضوح ، تحدد OCC الحد الأدنى من مجموعة القمم F لإزالتها من GF لإزالة كل الدورات الفردية ، وبالتالي جعل الرسم البياني ثنائي الأجزاء. OCC لديه خوارزمية 9/4 تقريب. لم يتم عرض المعلمة الثابتة القابلة للتتبع (FPT) حتى الآن. نود النظر في خوارزمية ذات وقت أسي محدد لحل نسخة ذات معلمات من هذه المشكلة ، k-OCC. مشكلة تغطية دورة k-Odd على النحو التالي: بالنظر إلى الرسم البياني G = (V، E) ، أوجد V ، | الخامس | ك و | الخامس | يكون ضئيلًا بحيث يكون G = V - V ثنائيًا. هذه هي الوظيفة المركزية التي يجب إنشاؤها عند حل MFR. تصف الورقة الثانية فرعًا ساذجًا ونهجًا منضمًا يعتمد على البحث في شجرة من الحلول الممكنة. يتضمن نهجنا إنشاء مجموعة من قواعد التخفيض لتكثيف GF زF R ، مما يجعل من الممكن تطبيق خوارزميات فعالة (ذات معلمات) للعثور على غطاء دورة فردي صغير (& lt k) لـ GF R ، لتحديد أن GF يحتوي R على أكثر من k دورات فردية منفصلة (وبالتالي لا يحتوي على OCC صغير بما يكفي) أو يحتوي على هيكل رسم بياني آخر لا يسمح بميزة OCC صغيرة بما يكفي.

هذا هو التقدم في العمل. ومع ذلك ، من الجيد قراءة أوراق لانسيا لفهم المشاكل الخوارزمية المتعلقة بالنمط الفردي للنمو السكاني SNP. دعنا نعرف أن هناك طرقًا إحصائية قوية لإجراء التنميط الفرداني ، ومع انخفاض تكاليف فحوصات SNP ، هناك أيضًا طرق بيولوجية لتحديد الأنماط الفردانية.

4 رسم خرائط SNP

يعد تخطيط SNP (رسم خرائط الارتباط) أحد أكثر المجالات نشاطًا في أبحاث ما بعد الجينوم في SNP. يتضمن هذا العمل تحديد مواقع SNP على طول الجينوم لتتبع جينات المرض. تحدد خريطة SNP البشرية مساهمات الجينات الفردية في الأمراض والأنماط الظاهرية الأخرى.

The SNP Consortium Ltd. هي مؤسسة غير ربحية توفر أكثر من مليون تعدد الأشكال الذي تم اكتشافه وتعليقاتها التوضيحية للجمهور. وتتمثل مهمتها في تطوير ما يصل إلى 300000 من النيوكلوتايد الموزعة بالتساوي في جميع أنحاء الجينوم البشري وإتاحة المعلومات المتعلقة بهذه النيوكلوتايد للجمهور دون قيود الملكية الفكرية. http://snp.cshl.org/

الشكل 4: التخطيطي لرسم خرائط SNP (رسم خرائط النمط الفردي) وأحد تأثيراتها العديدة على الرعاية الصحية.

4.1 خريطة النمط الفرداني للجينوم البشري

ينجح رسم خرائط النيوكلوتايد في تحديد الجينات الفردية المسؤولة عن الأمراض أحادية الجين مثل هنتنغتون والتليف الكيسي ، إلا أن غالبية السمات تتأثر بجينات متعددة وعوامل بيئية. كامتداد لرسم خرائط SNP الأساسي ، تحدد أبحاث التباين الجيني البشري كيف يساهم التباين بين الأفراد أو المجموعات في الحالة الصحية لذلك الفرد أو المجموعة. هذا النوع من البحث لديه مبادرة تطوير خريطة النمط الفرداني من الجينوم البشري. الغرض من الخريطة هو ربط التباين الجيني البشري بالاستعداد للمرض ، خاصة الاضطرابات الشائعة أو المعقدة.

اكتشف العلماء أن هناك عددًا قليلاً من الإصدارات المختلفة لكتل ​​وراثية معينة (عدد صغير من الأنماط الفردانية). هذا يعني أن هناك عددًا قليلاً من أنماط SNP في كل موضع كروموسومي. على سبيل المثال ، بالنسبة لبعض الكتل ، تم العثور على أربعة أو خمسة أنماط فقط من تعدد الأشكال (أربعة أو خمسة أنماط فردانية مختلفة) تمثل 80٪ -90٪ من إجمالي السكان. يبسط هذا الاكتشاف بشكل كبير البحث عن الارتباطات بين اختلافات الحمض النووي والمرض.

أيضًا ، نظرًا لأن العديد من أنماط النمط الفرداني هذه خاصة بالسكان (المجموعات) ، فإن الخريطة ستسهل إجراء دراسات الارتباط في مجموعات سكانية مختارة حيث تكون بعض الأمراض أكثر أو أقل انتشارًا.

المعلومات التالية من CHI تضع تعيين النمط الفرداني في السياق.

[خريطة Haplotype] فرانسيس كولينز ، مدير NHGRI ، متحدثًا في BIO 2001 (سان دييغو ، الولايات المتحدة ، يونيو 2001) أعلن عن خطط لجهد بين القطاعين العام والخاص لإنشاء خريطة النمط الفرداني البشري. يأمل المبدعون في ما يسمى بخريطة النمط الفرداني ستكون أداة لتحديد الجينات التي تساهم في تطور الأمراض المعقدة مثل السرطان والسكري والأمراض العقلية. [L. Helmuth "Map of the Human Genome 3.0" Science 293 (5530): 583-5 July 27، 2001] [من CHI Glossary].

[تعيين النمط الفردي] غالبًا ما يتم إجراء رسم خرائط النمط الفرداني كجزء من مسح الجينوم. في عزلة سكانية ، يُعزى ظهور مرض مندلي نادر دائمًا تقريبًا إلى جين أو طفرة مؤسس واحد. يمكن التعرف على أليل المرض من خلال البحث عن توقيع النمط الفرداني المشترك بين المرضى. نظرًا لأن توقيع النمط الفرداني السلفي ينتقل من جيل إلى جيل ، فإنه يتم تعطيله عن طريق إعادة التركيب. يشير الحفظ الجزئي لتوقيع النمط الفرداني في المريض بقوة إلى أن موضع المرض موجود في المنطقة المحفوظة من النمط الفرداني. [L. بيلتونين وآخرون. al، & # 220SE من عزلات السكان لرسم خرائط للسمات المعقدة "مراجعات الطبيعة علم الوراثة 1: 182-190 (2000)

يثير البناء من خريطة النمط الفرداني العديد من المخاوف الأخلاقية. تذكر أن مشروع الجينوم البشري واجه معارضة عندما تم اقتراحه في البداية ولا يزال كذلك. القضايا الأخلاقية المحيطة بخريطة النمط الفرداني أكثر حدة وحساسية. قد تتضمن خريطة النمط الفرداني علامات تشير إلى عرق الشخص وعرقه.

4.2 أشجار النمط الفرداني (نسالة المستندة إلى النمط الفرداني)

توفر أشجار النمط الفرداني طرقًا لفحص نسالة الأفراد بناءً على أنماطهم الفردانية ، كما توفر طرقًا لفهم الانتقاء الطبيعي الجزيئي (الجيني). لقد تم إنشاؤها لفهم التطور البشري والجداول الزمنية التاريخية ولتحديد علم الأنساب وراثيًا. يمكن إنشاء هذه الأشجار لنوع واحد أو يمكن إنشاؤها لتمثيل السلالات الفردية بين الأنواع ، تذكر أن هناك عددًا صغيرًا من الأنماط الفردانية (أنماط فريدة) لموقع الاهتمام المختار. مجموعة السكان أو مجموعة النمط الفرداني هي مجموعة من الأنماط الفردانية المتشابهة للغاية. غالبًا ما يكون النمط الفرداني قيد الدراسة هو جين موروث من الأم أو مجموعة من المواقع على أحد الكروموسومات الجنسية. لقد ثبت أن أفراد المجتمع يشتركون عمومًا في نفس نمط النمط الفرداني. غالبًا ما يتم دمج هذه الأشجار مع الأشجار القائمة على التماثل لتوفير صورة أكثر موثوقية لعلم الجينات.

يتم إنشاء أشجار النمط الفرداني بشكل ضئيل مع أنماط الفردانية الفريدة التي يتم تمثيلها بواسطة عقد الشجرة. تتطور الأنماط الفردية من الأنماط الفردانية الأسلاف الأقدم. يُعتقد أن هذه الأنماط الفردانية القديمة أكثر انتشارًا على الأنواع ، وبالتالي يتم تمثيلها عمومًا بواسطة العقد الداخلية ، في حين سيتم تمثيل الأنماط الفردانية الأحدث (الأنماط التي ظهرت مؤخرًا) بواسطة العقد الورقية. لاحظ أنه من الضروري تحديد النمط الفرداني القوي لإعادة التركيب والطفرات.

الشكل 5: بناء شجرة النمط الفرداني

يصف جين وآخرون استخدام شجرة النمط الفرداني لدراسة تاريخ الهجرة والانحراف الجيني والانتقاء الطبيعي في بحثهم الصادر عام 1999 بعنوان "توزيع الأنماط الفردية من منطقة كروموسوم 21 يميز الهجرات البشرية المتعددة في عصور ما قبل التاريخ". تنشأ الأنماط الفردانية التي تم أخذها في الاعتبار في بحثهم من منطقة كروموسوم 21 565-bp بالقرب من جين MX1 الذي يحتوي على 12 موقعًا من SNP ويفتقر إلى إعادة التركيب وأحداث الطفرات المتكررة. تشير الورقة البحثية إلى أن بعض الأنماط الفردانية تحدث بشكل متكرر أكثر من غيرها وأن تنوع الأنماط الفردانية الموجودة في مجموعات سكانية مختلفة تختلف باختلاف السكان الأكبر سنًا الذين يعرضون تنوعًا أكبر في النمط الفرداني.

الشكل 6: نموذج لشجرة النمط الفرداني كما هو محدد في الورقة المذكورة أعلاه.

ومن الأمثلة على التطبيقات التجارية لأشجار النمط الفرداني شركة الإنترنت "DNA Family Tree" - http://www.familytreedna.com/ ، وهي شركة معلن عنها ذاتياً "لاختبار الأنساب يحركها الحمض النووي". يستخدم العلماء في هذه الشركة مجموعة من الأساليب الإحصائية والتطور (بناء الأشجار) التي تُظهر روابط الأنساب الدقيقة بين الأنماط الفردانية (إما الكروموسوم Y أو الحمض النووي للميتوكوندريا) لتحديد النسب القديم للعميل المهتم. على وجه الخصوص ، يتم استخدام أحد المنتجات لتحديد ما إذا كانت العميلات لديها أصول أمريكية أصلية. يمكن للشركة تحديد ذلك لأن "الدراسات الجينية أظهرت أن mtDNAs الأمريكية الأصلية تنتمي إلى واحدة من خمس سلالات مميزة للأمهات. وقد تم تعيين هذه المجموعات الفردية A و B و C و D و X. يتم تعريف كل منها من خلال مجموعة محددة من الطفرات / العلامات التي تحدث في المناطق المشفرة وغير المشفرة لجينوم mtDNA. " يقدم هذا الاستخدام للأنماط الفردانية مرة أخرى العديد من المخاوف الأخلاقية وليس من الصعب تخيل كيف يمكن لتقنية النمط الفرداني أن تسهل التمييز الجيني.

5 تطبيقات SNP

فيما يلي الحقول التي تستخدم معلومات SNP وخرائط النمط الفرداني. التطبيق الرئيسي لمعلومات SNP هو نحو رعاية صحية محسنة ومستقبلية. يمكن استخدام علم الجينوم وخاصة أبحاث SNP لتحسين الرعاية الصحية من خلال العلاج الجيني ، لتحقيق أهداف جديدة لاكتشاف الأدوية ، وتحسين عملية تطوير الأدوية واكتشاف تشخيصات جديدة.

5.1 علم الصيدلة الجيني

[علم الصيدلة الجينية] علم فهم العلاقة بين التركيب الجيني للمريض الفردي (التركيب الجيني) واستجابته للعلاج بالعقاقير. تعمل بعض الأدوية بشكل جيد في بعض مجموعات المرضى وليس بشكل جيد في البعض الآخر. تسمح دراسة الأساس الجيني لاستجابة المريض للعلاجات لمطوري الأدوية بتصميم علاجات أكثر فعالية. [المصدر: معجم الجينوم PHRMA]

تتطلب جميع جوانب علم الصيدلة الجيني بيانات من التنميط الجيني عالي الإنتاجية ، وتحديداً السكان المستهدفين لعقار ما أو السكان الذين يتفاعلون بشكل سيئ مع الدواء. أيضًا ، قد يؤدي هذا النوع من الأبحاث إلى علاجات خاصة بالسكان. لقد أتاحت التكلفة العالية لسحب الأدوية مبادرة لتصميم دواء متقدم يتضمن دراسات التحقق من صحة هدف الدواء بالإضافة إلى دراسات للتنبؤ بالأحداث الضائرة ونقص الفعالية.

يمكن إجراء تجربة جينية دوائية على النحو التالي:

5.2 تشخيص SNP

[الاختبارات الجينية] • تحليل المادة الجينية للفرد. قد يكون من بين أغراض الاختبارات الجينية جمع معلومات عن الاستعداد الوراثي للفرد لحالة صحية معينة ، أو لتأكيد تشخيص مرض وراثي. [المصدر: معجم الجينوم PHRMA]

يمكن تحديد التركيب الوراثي للفرد ثم تحليله وفقًا لخريطة النمط الفرداني لتحديد مخاطر المرض لدى المريض أو تلقي علاجات مختلفة.

5.3 النيوكلوتايد في البروتينات الوظيفية والعلاج الجيني

تتضمن البروتينات الوظيفية المرتبطة بـ SNP تحديد SNPs الوظيفية التي تعدل البروتينات وبنية المواقع النشطة للبروتين ووظيفتها. ترتبط البروتينات الوظيفية ارتباطًا وثيقًا بتصميم الأدوية الحديثة (ما بعد الجينومية) وتساعد معلومات SNP الوظيفية على اكتشاف أهداف علاجية جديدة. الأكثر إثارة للاهتمام ، من خلال تطوير قاعدة بيانات للتعديلات الناتجة عن تعدد الأشكال الوظيفية (الترميز) في البروتينات المرتبطة بالأمراض ، "يمكن تصميم مركبات جديدة لتصحيح أو تعزيز تأثيرات تلك الطفرات في السكان." [المصدر: Genodyssee]

ما هي هذه المركبات وكيف يمكن استخدام المعرفة بتأثيرات النيوكلوتايد لتصحيح المجموعات السكانية ذات النيوكلوتايد غير المرغوب فيها أو تحسين التجمعات من خلال تقديم مزايا تعدد الأشكال المرغوب فيه؟ بصرف النظر عن الأدوية ، إليك بعض العلاجات الجينومية المثيرة للاهتمام والتي قد تصبح أكثر جدوى حيث تصبح معلومات SNP في شكل أشجار وخرائط أكثر تفصيلاً.

[العلاج الجيني للخط الجرثومي] يتضمن العلاج الجيني للخط الجرثومي إدخال جينات طبيعية في الخلايا الجرثومية أو البويضات المخصبة في محاولة لخلق تغيير جيني مفيد يمكن أن ينتقل إلى نسل الكائن الحي (على سبيل المثال ، لتصحيح سمة وراثية المرتبطة بالمرض). إذا تم إدخال تغيير عن طريق العلاج الجيني للخط الجرثومي ، فقد يكون هذا التغيير موجودًا في النسل منذ الولادة في كل خلية في الجسم. شاهد علم الجينوم وقارن مع العلاج الجيني للخلايا الجسدية. [المصدر: معجم الجينوم PHRMA]

[الطفرة الجينية للخلايا الجسدية] - طفرة جينية في خلية جسدية. مثل هذه الطفرات ، غير الموروثة من الوالدين ولكنها تحدث خلال حياة الكائن الحي ، غالبًا ما تُعرف باسم الطفرات الجينية المكتسبة # 228 ". لا تنتقل الطفرات الجينية للخلايا الجسدية إلى الأبناء. [المصدر: معجم الجينوم PHRMA]

[العلاج الجيني للخلايا الجسدية] "العلاج الجيني للخلايا الجسدية يتضمن إدخال الجينات في الخلايا لأغراض علاجية ، على سبيل المثال لحث الخلايا المعالجة على إنتاج بروتين يفتقده الجسم. لا يؤثر على التركيب الجيني لنسل المريض ، وعمومًا لا يغير كل أو حتى معظم الخلايا في المتلقي. [المصدر: معجم الجينوم PHRMA]

6 اقتصاد SNP

فيما يلي مقتطف من مقال معهد كامبريدج هيلثتيك: "سوق أبحاث SNP يمكن أن يصل إلى 1.2 مليار دولار بحلول عام 2005 ، إذا تقدم علم الصيدلة الجيني في 1 يناير 2002". بقلم مالوري أليسون برانكا. [المصدر: http://www.chireports.com/content/articles/snpresearch.asp]

& # 196 النفقات السنوية على أبحاث تعدد أشكال النوكليوتيدات المفردة (SNP) يمكن أن تزيد سبعة أضعاف بحلول عام 2005 ، لتصل إلى أكثر من 1.2 مليار دولار ، من 158 مليون دولار في عام 2001 ، وفقًا لتقرير جديد لمعهد Cambridge Healthtech (CHI) ، الآثار التجارية للتقدم في تحديد الهوية ورسم الخرائط وتطبيق أشكال النوكليوتيدات المفردة. (لمزيد من المعلومات حول هذا التقرير ، انتقل إلى www.chireports.com/content/reports/snpupdate01.asp.) "

"هناك ثلاثة عوامل رئيسية ستدعم هذا النمو:

  • الانخفاض التدريجي في تكلفة مقايسة التنميط الجيني ، بسبب التقدم التكنولوجي.
  • زيادة الاهتمام بعلم الصيدلة الجيني - أو تخصيص العلاج للمرضى بناءً على ملامحهم الجينومية - بواسطة شركات الأدوية والتكنولوجيا الحيوية والأدوات الجينومية.
  • الدفع للقيام بعدد أكبر من الفحوصات لكل دراسة ".

"حاليًا ، التطبيقات الأكثر شيوعًا لأدوات البحث المتعلقة بالـ SNP هي دراسات ارتباط الأمراض الجينية والتحقق من صحة هدف الأدوية. ومن التطبيقات الشائعة الأخرى دراسات أو تشخيص القابلية للأمراض ، والدراسات الجينية الدوائية للتجارب السريرية ، وفحص أهداف العقاقير ، والتكنولوجيا الجديدة التطوير. نتوقع أن تستمر دراسات التحقق من صحة الهدف وترابط الأمراض في كونها المهام الأكثر شيوعًا المتعلقة بالتعدد النيكليوتوماتيكي في اكتشاف الأدوية وتطويرها ، ومع ذلك ، نتوقع أنه بحلول عام 2003 ، سيبدأ تطبيق دراسات النيوكلوتايد في علم الصيدلة الجيني في الزيادة بشكل مطرد ويمكن أن يكون سريعًا أصبح سوقًا بمليارات الدولارات بحد ذاته ".

7 الموارد

مقالات معهد كامبريدج هيلثتيك: http://www.chireports.com

مسرد معهد كامبريدج للتكنولوجيا الصحية: http://www.genomicglossaries.com/

شركة DNA Family Tree: http://www.familytreedna.com/

لانسيا ، جي ، أفنا ، في ، إستريل ، إس ، ليبرت ، آر ، وشوارتز ، آر. مشاكل SNPs والتعقيد والخوارزميات. ESA 2002، LNCS 2161، pp. 182-193، 2001. Springer-Verlag Berlin Heidelberg 2001.

جين ، لي ، وآخرون. يميز توزيع الأنماط الفردانية من منطقة الكروموسوم 21 الهجرات البشرية المتعددة في عصور ما قبل التاريخ. بروك. ناتل. أكاد. علوم. الولايات المتحدة الأمريكية المجلد. 96 ، ص 3796-3800 ، مارس 1999.

ليبرت ، آر ، شوارتز ، آر ، لانسيا ، جي وإستريل ، إس. الاستراتيجيات الحسابية لمشكلة تجميع النمط الفرداني لتعدد أشكال النوكليوتيدات المفردة. إحاطات في المعلوماتية الحيوية. المجلد 3 ، رقم 1 ، 1-9. فبراير 2002.

خريطة الجينوم البشري 3.0 ، BioSINO ، Laura Helmuth http://www.biosino.org/bioinformatics/010814-4.htm

الأوركيد للعلوم البيولوجية www.orchid.com

البحوث الصيدلانية ومصنعي أمريكا (PhRMA) مسرد الجينوم: http://genomics.phrma.org/lexicon/

تفاصيل SNP: SNP Web Source ، Xuan Chen (غير متصل)

دراسات الآثار الأخلاقية والقانونية والاجتماعية لأبحاث التباين الجيني البشري للأفراد والجماعات العرقية والإثنية المتنوعة: http://grants.nih.gov/grants/guide/rfa-files/RFA-HG-02-003.html

ملف مترجم من T. ه X بواسطة T. تي H ، الإصدار 2.25.
في 2 مايو 2002 ، 14:21.


بعد 10 سنوات من البحث ، وجد العلماء جين "النوم القصير" الثاني

بعد عقد من البحث ، اكتشف علماء جامعة كاليفورنيا في سان فرانسيسكو ، الذين حددوا الجين البشري الوحيد المعروف بأنه يعزز "النوم الطبيعي القصير" - النوم الليلي مدى الحياة الذي يستمر من أربع إلى ست ساعات فقط ، ومع ذلك يترك الأفراد يشعرون بالراحة التامة - اكتشفوا ثانية واحدة.

قادت الدكتورة ينج-هوي فو فرق البحث التي اكتشفت جينات النوم القصير.

قال ينج هوي فو ، دكتوراه ، أستاذ علم الأعصاب وعضو في معهد UCSF Weill لعلوم الأعصاب: "قبل تحديد أول جين للنوم القصير ، لم يكن الناس يفكرون حقًا في مدة النوم من الناحية الجينية". قاد فو فرق البحث التي اكتشفت جينات النوم القصير ، وقد تم وصف أحدثها في ورقة بحثية نُشرت في 28 أغسطس 2019 في المجلة. عصبون.

وفقًا لفو ، اعتقد العديد من العلماء ذات مرة أن بعض سلوكيات النوم لا يمكن دراستها وراثيًا. وقالت: "قد يكون من الصعب دراسة النوم باستخدام أدوات علم الوراثة البشرية لأن الناس يستخدمون أجهزة الإنذار والقهوة والحبوب لتغيير دورات نومهم الطبيعية". ويذهب التفكير إلى أن هذه الاضطرابات في النوم جعلت من الصعب على الباحثين التمييز بين الأشخاص الذين ينامون بشكل طبيعي أقل من ست ساعات وأولئك الذين يفعلون ذلك فقط بمساعدة منبه اصطناعي.

ظل الأشخاص الذين ينامون لفترة قصيرة بشكل طبيعي لغزًا حتى عام 2009 ، عندما اكتشفت دراسة أجراها فريق فو أن الأشخاص الذين ورثوا طفرة معينة في جين يسمى ديسمبر 2 بلغ متوسط ​​ساعات النوم 6.25 ساعة فقط لكل ليلة ، حيث بلغ متوسط ​​المشاركين في الدراسة الذين يفتقرون إلى الطفرة 8.06 ساعة. قدمت هذه النتيجة أول دليل قاطع على أن النوم الطبيعي القصير هو ، على الأقل في بعض الحالات ، وراثي. لكن هذه الطفرة نادرة ، لذا في حين أنها ساعدت في تفسير بعض الأشخاص الذين ينامون قصيرًا بشكل طبيعي ، إلا أنها لا يمكن أن تفسرهم جميعًا.

لويس بتاتشيك ، دكتوراه في الطب ، مؤلف مشارك أول للدراسة الجديدة.

قال لويس بتاتشيك من جامعة كاليفورنيا في سان فرانسيسكو ، وهو أستاذ متميز في أمراض التنكس العصبي وأستاذ مشارك في الدراسة الجديدة ، "النوم معقد". "لم نعتقد أن هناك جينًا واحدًا فقط أو منطقة واحدة من الدماغ تخبر أجسادنا بالنوم أو الاستيقاظ." استنتج بتاتشيك وفو أنه يجب أن تكون هناك أسباب أخرى ، لم يتم اكتشافها بعد ، لقصر النوم.

كما تصف الدراسة الجديدة ، حدث اختراق عندما حدد الباحثون عائلة تضم ثلاثة أجيال متتالية من الأشخاص الذين ينامون قصيرًا بشكل طبيعي ، ولم يأوي أي منهم ديسمبر 2 طفره. استخدم الباحثون التسلسل الجيني وتقنية تُعرف باسم تحليل الارتباط ، والتي تساعد العلماء على تحديد الموقع الدقيق للكروموسومات للطفرات المرتبطة بسمة معينة ، لتمشيط جينوم العائلة. كشفت جهودهم عن طفرة أحادية الحرف في الجين المعروف باسم ADRB1 هذا ، مثل الطفرة في ديسمبر 2، كان مرتبطًا بنوم قصير طبيعي.

حرصًا منهم على فهم الكيفية التي قد تؤدي بها الطفرة المكتشفة حديثًا إلى نوم قصير ، أجرى الباحثون سلسلة من التجارب في الخلايا المزروعة في المختبر وفي الفئران التي تمت هندستها وراثيًا لإيواء طفرة مماثلة في نسخة الفئران من ADRB1.

كشفت التجارب المستندة إلى الخلايا أن الشكل المتحور لمستقبلات بيتا 1 الأدرينالية - وهو البروتين المشفر بواسطة ADRB1 الجين ، الذي يلعب دورًا في مجموعة متنوعة من العمليات البيولوجية الأساسية - يتحلل بسرعة أكبر من الإصدار غير المتحور ، مما يشير إلى أنه قد يعمل أيضًا بشكل مختلف.

تم تأكيد هذا الحدس في تجارب الفئران. اكتشف الباحثون أن ADRB1 تم التعبير عن الجين بشكل كبير في الجزء الظهري ، وهي منطقة من جذع الدماغ تشارك في تنظيم النوم. باستخدام تقنية تُعرف باسم علم البصريات الوراثي ، حيث يتم تعديل الخلايا بحيث يمكن تنشيطها بالضوء ، ركز الباحثون الضوء على الخلايا العصبية في الجسر لتحفيز الخلايا التي ADRB1 تم التعبير عنه. أثار تشغيل هذه الخلايا العصبية على الفور الفئران النائمة - على وجه التحديد ، تلك التي كانت تعاني من نوم غير حركة العين السريعة ، وهي مرحلة النوم التي لا تكون خلالها هذه الخلايا العصبية نشطة بشكل طبيعي - مما يدل على أن هذه الخلايا العصبية تعزز اليقظة.

وأظهرت تجارب إضافية أن الخلايا العصبية المعززة لليقظة في الجسر مع النسخة المحورة من ADRB1 تم تفعيلها بسهولة أكبر. علاوة على ذلك ، فإن نسبة تعزيز اليقظة إلى الخلايا العصبية المعززة للنوم انحرفت بشكل كبير نحو الأول في الفئران المصابة بـ ADRB1 طفره. تشير هذه التجارب إلى أن الشكل المتحور لـ ADRB1 يعزز النوم الطبيعي القصير لأنه يساعد في بناء أدمغة يسهل إيقاظها وتبقى مستيقظة لفترة أطول.

على الرغم من أنهم ينامون أقل ، لا يعانون من قصر النوم الطبيعي أي من الآثار الصحية الضارة المرتبطة بالحرمان من النوم. اليوم ، يعاني معظم الناس من الحرمان المزمن من النوم. قال فو "إذا كنت بحاجة إلى ثماني إلى تسع ساعات ، ولكنك تنام سبع ساعات فقط ، فأنت محروم من النوم". وهذا له عواقب صحية معروفة وطويلة الأمد. أنت أكثر عرضة للإصابة بأمراض القلب والأوعية الدموية والسرطان والخرف ومشاكل التمثيل الغذائي وضعف جهاز المناعة ".

لكن يبدو أن الأشخاص الذين ينامون قصيرًا بشكل طبيعي يستفيدون في الواقع من هذه الميزة البيولوجية الخاصة بهم. يقول فو إن الباحثين وجدوا أن الأشخاص الذين ينامون لفترة قصيرة يميلون إلى أن يكونوا أكثر تفاؤلاً وأكثر نشاطًا وحيوية في أداء المهام المتعددة. لديهم أيضًا عتبة ألم أعلى ، ولا يعانون من اضطراب الرحلات الجوية الطويلة ويعتقد بعض الباحثين أنهم قد يعيشون لفترة أطول. على الرغم من أن الأسباب الدقيقة لهذه الفوائد لا تزال غير معروفة ، يعتقد فو وباتشيك أن عملهما يمثل خطوة مهمة نحو فهم العلاقة بين النوم الجيد والصحة العامة.

قال فو: "يتمتع الأشخاص الذين ينامون لفترة قصيرة بشكل طبيعي بجودة نوم أفضل وكفاءة نوم أفضل". "من خلال دراستها ، نأمل أن نتعلم ما الذي يجعل نومًا جيدًا ليلاً ، حتى نتمكن جميعًا من أن نكون نائمين بشكل أفضل ونعيش حياة أكثر سعادة وصحة."

المؤلفون: من بين المؤلفين الإضافيين للدراسة جوانجسن شي ، ليجوان شينغ ، ديفيد وو ، بولا جيه باتاتشاريا ، توماس مكماهون ، S.Y. كريستين تشونج وأندرو كريستال من جامعة كاليفورنيا في سان فرانسيسكو كريستوفر آر جونز من جامعة يوتا جيسون إيه تشين وجيوفاني كوبولا ودانييل جيشويند من جامعة كاليفورنيا في لوس أنجلوس.

التمويل: تم دعم هذه الدراسة من قبل NINDS Informatics Center for Neurogenetics and Neurogenomics (منحة P30 NS062691) والمعاهد الوطنية للصحة (منح NS099333 و NS072360 و NS104782 و P30 DK063720) وصندوق William Bowes Neurogenetics.

الإفصاحات: يعلن الكتاب لا تضارب المصالح.

تركز جامعة كاليفورنيا ، سان فرانسيسكو (UCSF) حصريًا على العلوم الصحية وهي مكرسة لتعزيز الصحة في جميع أنحاء العالم من خلال البحوث الطبية الحيوية المتقدمة ، والتعليم على مستوى الدراسات العليا في علوم الحياة والمهن الصحية ، والتميز في رعاية المرضى. UCSF Health ، التي تعمل كمركز طبي أكاديمي أولي في UCSF ، وتشمل المستشفيات المتخصصة ذات التصنيف العالي والبرامج السريرية الأخرى ، ولها فروع في جميع أنحاء منطقة الخليج.


شاهد الفيديو: How to find Single Nucleotide Polymorphism SNPs for a specific gene or region (شهر نوفمبر 2022).