پایان نامه ارشد درباره شبیه‌سازی، ساختار داده، انفورماتیک

دانلود پایان نامه ارشد

پروتئین
Procheck
http://redpoll.pharmacy.ualberta.ca/vadar
بررسی کیفیت ساختار مدلهای ساخته شده از لحاظ استروشیمیایی
سرور تحت شبکه جهت بررسی کیفیت ساختار سوم پروتیئن
VADAR
http://curie.utmb.edu/getarea.html
محاسبه مناطق در دسترس مدل CStH
محاسبه مناطق در دسترس ساختار سوم پروتیئنها بر مبنای بردار به شعاع°A 4/1
GetArea
http://pipe.scs.fsu.edu/meta-ppisp.html
محاسبه مناطق در انتراکشن و ارتباطی مدل سه بعدی CStH
پیشگویی مناطق در انتراکشن ساختارهای سه بعدی
Meta-PPISP

http://cluspro.bu.edu/login.php
http://vakser.bioinformatics.ku.edu/resources/gramm/grammx/

یافتن جایگاه احتمالی برهمکنش پروتئین CStH در کمپلکسهای پروتئینی ممکن از آن
مطالعه برهمکنش پروتئین-پروتئین
Cluspro و GRAMM-X

2-2 روشهای بیوانفورماتیکی

1-2-2 پيشگويي ساختار دوم
ساختار دوم توالي CstH و مشتقات آن بطورجداگانه با سرورهاي ذکر شده در سه سطح مارپیچ (Helix)، کويل (coil) ورشته (strand) پيشگويي شدند و با مقايسه نتايج پيشگويي‌ها ساختار دوم توافقی بدست‌آمد. در ساختار حاصل اگر تفاوتي در وضعيت ساختار دوم پيشگويي شده بوسيله سرورها براي يک اسيدآمينه وجود داشت حالتي که حداقل بوسيله دو سرور، پيشگوييشدهبود به عنوان حالت توافقي انتخاب شد و در غير اينصورت آن حالت با حرف U نمايش داده‌ شد. پیشگویی ساختار دوم پروتئینها و مدلهای ساخته شده با سروهای ذکر شده در جدول شماره 2-5 و 2-6 انجامگرفت.
2-2-2 پیشگویی ساختار سوم پروتئینها و مدلسازی
روش های محاسباتی برای پیشگویی ساختار سوم پروتئینها و مدلسازی آنها به سه گروه تقسیم میشوند که شامل: (1) روش همولوژی، (2) روش شناسایی تاخوردگی یا تاخوردگی پروتئین، (3) روش مدلسازی ابتدابهساکن
فرایند پیشگویی ساختار سوم و مدلسازی پروتیئنها در طی چندین مرحله انجام میگیرد که مراحل چندگانه آن در شکل 2-1 خلاصه شدهاست (Floudas CA., 2006, Liu., 2011)

شکل 2-2. خلاصه مراحل مدلسازی پروتئینها.

1-2-2-2 جستجوی توالیهای مشابه با PSI-Blast و Blast در مقابل پایگاهداده PDB
با ابزارهایBlast و PSI-Blast همولوگهای احتمالی توالی پروتئینهای مورد بررسی در توالی پروتئینهای موجود در پایگاهداده PDB جستجو میگردد. اگر نیتجه جستجو مثبت باشد در اینصورت مدلسازی با روش مقایسه ای انجام میگیرد. در صورتی که در PDB ساختار پروتیئنی بدست نیامد در اینصورت باید پیشگویی ساختار دوم و همچنین روش های پیشگویی شناسایی تاخوردگی پروتئین و مدلسازی ابتدا به ساکن بکار گرفتهشوند(شکل 2-2 ).

2-2-2-2 مدلسازی مقایسهای
مدلسازی مقایسهای بر این پایه استوار است که توالیهای دارای منشا تکاملی مشابه ساختار سوم مشابهی هم میتوانند داشتهباشند. بعبارت دیگر تشابه توالی تاحد زیادی بیانگر تشابه ساختاری نیز میباشد.
اولین اقدام در این فرایند بسیار مهم میباشد. ابتدا توالی جدید با ساختارهای شناخته شده موجود همردیف میشود. در واقع با همردیفی، تشابه یا اختلاف در سطح اسیدآمینه پیدا میشود. صحت پیشگویی بستگی به میزان تشابه توالی دو پروتئین دارد. اگر میزان همسانی توالی بیش از 50 درصد باشد در اینصورت پیشگویی با کیفیت بالا انجام می گذیر و دقت آن در حد تعیین ساختار سه بعدی با اشعهX میباشد. برای همسانی توالی بین 30-50 درصد، در بیش از 80 درصد موارد انتظار می رود موقعیت کربنهای آلفای پیشبینی شده در حدود A°5/3 موقعیت واقعی خود خواهندبود (Kopp, 2004 ). با این اصول ذکر شده، مدلسازی مقایسه ای شامل پنح مرحله اصلی می باشد: (a) شناسایی توالیهای مرتبط با ساختار معلوم، (b) همردیفی توالی هدف با توالیهای الگو، (c) مدلسازی مناطقی که از لحاظ ساختاری حفاظت شده اند با استفاده از الگوهای شناختهشده،(d) مدلسازی زنجیرههای جانبی و لوپها که ساختار متفاوت دارند و معمولا جهش در لوپها ساختار پروتئین را عوض نمیکند و (e) بررسی کیفیت مدلهای تولید شده با ابزارهای مختلف. از برنامهها و سرورهای مدلسازی (رایگان) پروتئین که در این پروژه از آن استفادهشد CPH model وSWISS-MODEL میباشد.

1-2-2-2-2 سرور SWISS-MODEL
سرور مدل ساز خودکاری است که با حداقل ورودی و داده کاربر یعنی در سادهترین حالت فقط با توالی آمینواسیدی پروتئین هدف کار میکند. از آنجائیکه پروژه های مدلسازی مقایسهای دارای پیچیده گیهای متفاوتی هستند، ازاینرو ورودیهای بیشتری برای انجام برخی از پروژه های مدلسازی ، برای مثال جهت انتخاب یک الگوی متفاوت و یا تنظیم همردیفی الگو-هدف لازم است. بنابراین، سرور SWISS-MODEL به کاربر این امکان را میدهد از بین سه روش (1): انطباق خودکار70، طریقه دستی 71 و روش همردیفی72 ، یکی را براساس نیازخود انتخاب نماید. در رویکرد اولیه کاربر توالی آمینواسیدی را به عنوان داده وارد سرور نموده سپس سرور بطورخودکارالگوی مناسب را انتخاب مینماید و کاربرد بطوراختیاری میتواند بیش از 5 ساختار را به عنوان الگو از کتابخانه ExPDB و یا از PDB گزینش کند.
روش مدلسازی خودکار در صورتی آغاز میشود که حداقل یک الگو با یکسانیت توالی بیش از 25% از توالی هدف ارسال شده موجود باشد. بهرحال بهتر است کاربر اطلاع داشته باشد که هرچه یکسانیت توالی کاهش یابد اعتبار مدل ساخته شده نیز کاهش پیدا میکند. در اغلب موارد اگر یکسانیت توالی بین الگو- هدف کمتر از 50% باشد نیاز به تنظیم دستی همردیفی است.( 2): در طریقه همردیفی، مدلسازی با ارسال یک توالی همردیف آغاز می شود و کاربر تعیین می کند که کدام توالی به عنوان توالی هدف و کدامیک به ساختار شناخته شده در کتابخانه ExPDB مربوط می شوند سپس سرور مدلی را برپایه همردیف معرفی شده، برای کاربر ارائه می دهد.( 3): در حالت طریقه پروژه، کاربر یک فایل انطباق توالی را در DeepViewer ساخته و آنرا برای ساخت مدل به سرور ارسال می کند. از مزایای این روش اینست که به کاربر اجازه میدهد طیف وسیعی از پارامترها را مانند انتخاب الگو ، پرکردن شکافها در همردیفی را کنترل کند(Konstantin, 2006).

2-2-2-2-2 مدلسازی با برنامه Modeller
برنامه Modeller با توجه به قوانین ممانعت فضایی مطلوب73 با استفاده از یک الگوی ساختاری، ساختارهای پروتئینی را مدلسازی میکند. بعلاوه بسیاری از اعمال دیگر مانند مدلسازی ابتدا به ساکن در بخش لوپها، بهینه سازی انواع مدلهای پروتئینی با استفاده از معیاری به نامObjective function، انطباق چندگانه74 توالیها یا ساختارهای پروتئینی، خوشه سازی یا دستهبندی75، جستجوی بانکهای اطلاعاتی، مقایسه ساختارهای پروتئینی و … را نیز انجام میدهد.

بطور کلی فایلهای ورودی برنامه Modeller سه نوع هستند:(1)یک نوع فایل حاوی توالیها و انطباق آنها،(2)فایلی که مربوط به اطلاعات اتمی فایلهای الگو یعنی PDB آنها(3)و در آخر یک فایل متنی حاوی دستور کار به زبان Python. دستورات در قالب فایلهای متنی که به زبان برنامه نویسی Python نوشته شدهاند به برنامه داده شده و Modeller بر اساس موضوع، تغییرات لازم را انجام داده و مدل مورد نظر را بصورت فایل PDB حاوی مختصات سه بعدی میسازد. روش کار با این نرمافزار بصورت راهنمای عملی، در صفحه اصلی این نرمافزار در آدرس الکترونیکی WWW.saliab.org/modeller موجوداست.

3-2-2-2 مدلسازی براساس روش شناسایی تاخوردگی76
روش شناسایی تاخورگی پروتیئنی بر پایه این اصل استوار است که تعداد تاخوردگی و تاخوردگیهای پروتئین نسبت به تعداد پروتئین های موجود در طبیعت (که از طریق پروژه های ژنوم استخراج شدهاند) بسیار کمتر و محدودتر است. ساختارهای ذخیره شده در پایگاهداده پروتئین را براساس تاخوردگی آنها به خانواده هایی تقسیم می کنند. مطالعات اخیر نشان دادهاست که تعداد کافی ساختار برای پوشش دادن پروتئین های کوچک در پایگاه داده پروتئین موجود است .(Kihara and Skolnick, 2003) در این روش توالی آمینواسیدهای پروتئینی که ساختار آنرا نمی دانیم در مقابل یک بانک اطلاعاتی از ساختارهای تعیین شده، جستجو می گردد و در هر مورد یک پارامتر امتیازدهی برای تعیین میزان هم خوانی توالی با ساختار استفاده می شود و مدلهای سه بعدی محتمل پیشنهاد می شود.
به این روش شناسایی تاخوردگی روش 3D-1D نیز گفته میشود چرا که بررسی همخوانی میان ساختار سه بعدی و توالی آمینو اسید خطی انحام میگیرد. این روش همچنین یک روش معکوس به نام inverse search را هم به استفاده از ارزیابی همخوانی یک ساختار دادهشده با یک بانک اطلاعاتی توالی و برای پیشگویی اینکه کدام توالی ها توانایی شکل گیری به فرم تاخوردگی داده شده را دارند، انجام میدهد.از برنامه و سرورهای پرکاربرد در روش شناسایی تاخوردگی سرور Phyre و اخیرا Phyre2 میباشد.
جهت شناسایی تاخوردگی پروتئین ابتدا ساختار دوم پروتئین های مورد بررسی پیشگویی گردید سپس ارسال توالي پروتئين به سرور شناساگر تاخوردگی (Fold ) پروتئين(PHYRE) مدل سهبعدي براي توالي ارائه گرديد.اگر الگوهای پیشنهادی با توالی مورد جستجو در یک خانواده پروتئینی از لحاظ عملکردی و ساختاری قرار گیرند در اینصورت آنالیز و بررسی های بعدی مانند همردیفی پییشگویی ساختارهای دوم با ساختارهای دوم الگو انجام میگیرد. مرحله بعدی بررسی کیفیت مدل های گزینش شده می باشد که با روشهای ذکر شده در بخش مدلسازی مقایسهای قابل انجام است.
4-2-2-2 شبیه‌سازی دینامیک مولکولی با استفاده از نرم‌افزار GROMACS
در نتيجه شبيهسازی ديناميکملکولی يک پروتئين يا اسيدنوکلئيک، رفتار ماکروملکول يا سيستم در طی يک زمان مشخص و مورد نظراست که با استفاده از معادلات حرکت نيوتن و توابع انرژی پتانسيل به دست می آيد. خروجی شبيه سازی يک سری از ساختارهای ايجاد شده در طی زمان شبيهسازی است که روند تغييرات ساختار را در طی زمان مورد نظر ارائه میدهد که چگونگی اين تغييرات ديناميک سيستم يا ملکول را منعکس می کند. در این راستا نرم‌افزارهای شبیه‌سازی بسیاری با کاربردهای گوناگون ارائه شده است. از آنجمله می‌توان به نرم‌افزارهای امبر(AMBER)، چارم(CHARMM)، نمد(NAMD)، گرومکس (GROMACS) و … اشاره کرد که در بین آنها استفاده از نرم‌افزار گرومکس به علت سادگی، در دسترس بودن و پیشرفت روزافزون آن از گستردگی بیشتری برخوردار است.
5-2-2-2 تغییرات RMSD
کمیت RMSD معیاری جهت مقایسه شباهت دو ساختار ملکولی است. بدین ترتیب که مقدار RMSD برابر صفر بیانگر این است که دو ملکول در فضا کاملا برهم منطبق هستند. برای اندازهگیری کمیت RMSD از نرم افزار Swiss-pdb viewer و همچنین برنامه تحت شبکه CE استفاده گردید که مراحل کار بشرح زیر میباشد

1-5-2-2-2اندازه گیری RMSD با نرم افزار Swiss-pdb viewer
ابزار اندازه گیری RMSD در نرم افزار Swiss-pdb viewer تعبیه شده که مقایسه را برحسب انتخاب کاربر برروی کربنهای آلفا، زنجیره های جانبی، کربنهای اسکلتملکول و یا کل اتمهای دو ملکول انجام می دهد. در فرایند مقایسه یکی از ساختارها در جهت عرضی یا عمودی نسبت به ساختار دیگر جابجا شده بطوریکه دو ملکول در مختصات مشابهی قرار میگیرند سپس ساختارها حول محورهای سه بعدی جابجا و فواصل بین اتمهای آنها اندازه گیری میشود و با رسیدن به کوتاهترین فاصله چرخش متوقف شده و فواصل بین موقعیت های هم ارز اندازه بر حسب انحراف از مجذور میانگین مربعات یا همان RMSD اندازه گیری و برحسب آنگسترم ارائه میشود. RMSD های کمتر از A° 5 با بیشترین طول انطباقی بیانگر انطباق بهینه بین دو ملکول میباشد (Shindyalov and Bourne, 1998, Kaplan and Littlejohn, 2001)).

2-5-2-2-2اندازهگیری RMSD با برنامه تحت شبکه CE
CE برنامه تحت شبکه میباشد و مقایسه را با ایجاد ماتریسهای فاصلهای که بین کربنهای آلفای دو ملکول انجام میدهد. تشابهات حاصل به نام زوج قطعات منطبق (AFPs77) نامیده میشود. سپس با یک روش مکاشفهای این زوج قطعات منطبق در یک سری یا رده مسیر مناسب و بهینه به یکدیگر محلق شده البته در برخی مناطق ممکن است افتادگیهایی نیز وجود داشتهباشد. مسیری که

پایان نامه
Previous Entries پایان نامه ارشد درباره انفورماتیک، شبکه عصبی، شبیه سازی، منابع طبیعی Next Entries پایان نامه ارشد درباره Amp، CStH، cstH::cbm، cst