پایان نامه ارشد درباره انفورماتیک، حالت طبیعی، شبیه سازی، دینامیکی

دانلود پایان نامه ارشد

رابطه با هر ورودی و غیر تکراری بودن توالیها میباشد. علاوه بر این در سال 1996 بانکی از ترجمه EMBL بوجود آمدهاست و تحت عنوان TrEMBL نامگذاری شده و به Swiss-Prot اضافه گردیدهاست (Boutet et al., 2007, Bairoch et al., 2005).
در حال حاضر سه پایگاهداده Swiss-Prot، TrEMBL و 23PIR با هم تلفیق شده و پایگاهداده UniprotKB/Swiss-Prot ایجادشده که گستره بیشتری از هرکدام از پایگاههای داده پیشین دارد (Schneider et al., 2009).
کیفیت طرحی که برای هر ورودی در Swiss-Prot نوشته میشود آن را از سایر بانکهای اطلاعاتی پروتئین مجزا میکند و برخی از محققین این بانک را مهتمرین بانک ساختار اول بشمار میآورند. هر خط در این بانک با یک رمز دو حرفی شروع میشود و همچنین تمام ورودیهای بانک با رمز ” ID ” شروع و با یک علامت ” // ” پایان مییابند. 24ID، نام پروتئین را مشخص میکند(O’Donovan C., 2002, Brigitte Boeckmann, 2003). تا تاریخ آوریل 2012 این بانک شامل 535698 ورودی بودهاست که مرتبا در حال افزایش است بخشی از یک نمونه فایل Swiss-Prot مربوط به زیر واحد اصلی پیلی CS3 (CstH) که در این مطالعه از آنها استفاده شده در شکل 1-1 به نمایش درآمدهاست.

شکل1-1. بخشی از اطلاعاتی که از پایگاه داده Swiss-Prot برای زیر واحد اصلی پیلی CS3 استخراج شدهاست.

3-1-2-1- پایگاهدادهProsite یا پایگاهداده موتیفها
موتیف در توالی پروتئینی، زیرتوالی حفاظت شده ای میباشند که دارای یک عملکرد خاص بوده و به عنوان یک شاخص برای یک خانواده از پروتئینها تعریف میشود. انواع این توالیها در پایگاهداده پروسایت http://prosite.expasy.org قابل دسترسی است (Thilakaraj et al., 2007,Bairoch, 1992)
از طریق همردیفی چندتایی توالی پروتئینهای نماینده از گونههای مختلف الگوی توالی توافقی از مناطق حفاظت شده حاصل میشود و این توالیهای حفظ شده به نام توالی موتیف، الگوی توالی توافقی یا امضای توافقی خوانده میشوند. وجود این نوع موتیفها که شاخص یک خانواده هستند، کمک میکنند تا در هنگام کشف یک پروتئین جدید نیز بتوان خانواده پروتئین را مشخص نمود، بنابراین عملکرد و ساختار پروتئین جدید بر اساس عملکرد پروتئینهای هم خانودهاش مشخص میشود با این فرض که پروتئینهای یک خانواده دارای یک جد مشترک میباشند و در دوره تکاملی واگرا شده اند. در ضمن مواردی هم وجود دارد که توالی دو پروتئین تشابه زیادی دارند ولی هم خانواده نیستند بلکه براساس تکامل همگرای شباهت زیادی به هم پیدا کردهاند.
این پایگاه داده همچنین دارای موتیفهای اتصال به فلزات سنگین میباشد که ID آنها PS50846، PS01047 و PS00154 میباشد. با جستجوی پایگاههایداده توالی توسط این موتیفها میتوان پروتئینهای دارنده موتیف را شناسایی و بر اساس اطلاعاتی که عمدتا بر مبنای مقالات گردآوری شداست، از آنها در تحقیقات زیستشناسی استفاده نمود. به عنوان مثال، باکتریها سازکارهای مختلفی برای تحمل و جذب فلزات سنگین دارند که شامل سه سازکار: خارج کردن فلزات سنگین از طریق پروتئینهای پمپاژ کننده فلزات به بیرون از سلولها، تجمیع و کمپلکس کردن فلزات سنگین درون سلولها و نیز احیا یونهای فلزات سنگین و تبدیل به موادی با سمیت پایین میباشند(Nies , 1999). لذا بنظر میرسد با جستجوی پایگاههایداده توالی با کمک توالی توافقی مربوط به فلزات سنگین، پروتئینهای در ارتباط با فلزات سنگین را شناسایی و از آنها در تحقیقات استفاده نمود. در جدول (1-1) چند نمونه از موتیفهایی که در پروسایت برای فلزات سنگین وجود دارد نشان داده شدهاست و موتیفی که در این تحقیق از آن استفاده شده در ردیف اول جدول (1-1) و با سایه زرد رنگ مشخص شدهاست.

جدول 1-1. موتیفهای حفظ شده و اختصاصی متصل شونده به یونهای فلزی
کد PDB
تعداد ورودیها در UniProtKB
تعداد برخوردها که در جستجو با Scan prosite بدست آمدهاست
موتیف
نام ژن
یونهای فلزی
2AJ1
87
276
[LIVNS] – x – {L} – [LIVMFA] – x – C – x – [STAGCDNH] [- C – x(3) – [LIVFG] – {LV} – x(2) – [LIV] – x(9,11) – [IVA] – x – [LVFYS]
CadA
کادمیوم
1IHU
57
76
I[IV][FV]DTAPTGHT
ArsA
آرسنیک

121
108
D[LI]G[PS][KL][IL][TL]PIG[ST]LA[ST]L[IL]W[LM][HY][VI]L
ArsB

1J9B
178
39
HP[IAS]L[IL][NER]RPIV[IV]

1J9B

ArsC

144
HNP[AHR]C[GS][TK]SR

1ZX9
237
131

CVN[VI]GCVPSK

237 (138 fragments)
1ZX9

31
41
1S6L

MerA
جیوه
1S6L
41
31
C[CNK][HNEDQ][VI]H[FY]F
MerB

54
AGV[ST]VH[IV]VRDY[LI]
MerD

1AFI, 2HQI
80
76
C{FD}XCP[FI]TV
MerP

102
81
CC[LA]GP[LFI][IVL]L
MerT

106
GXXA[ILV]N[PA]XPR
CbiD
کبالت

91
105
MHSWDYSG
NifD
مولیبدنیوم

105
G[IVM][IVL]GATVMPHX[IVL]YLHS
MntH
منگنز
2F5D, 2F5C
22
31
D[VA]EG[IM]EHH[LV]S[WEQ][END][AST][IL]
MnTR

11
21
[MLA][RK]HAFD[AS]DHI[AV][AC]IDNT
NicT/NixA
نیکل

4
4
GAMERVRPVLMT
CnrA
کبالت و نیکل

49
48
FGDTL[AS]H[AS][AS][IL]LG
ZnuB
روی

3-1 کاربرد بیوانفورماتیک در پیشگویی ساختار پروتئین
یکی از کاربردهای بیوانفورماتیک، مطالعه‌ ساختار و عملکرد ماکرومولکول‌ها از روی توالی آن‌هاست. در این‌ میان، پیشگویی ساختار پروتئینها یکی از مهم‌ترین دستاوردهای بیوانفورماتیک و زیستشناسی محاسباتی میباشد. پروتئینها از توالیهای خطی متشکل از بیست نوع اسیدآمینه تشکیل شدهاند. ساختار پروتئینها در چهار سطح اول25، دوم‌26،سوم27 و چهارم‌ 28مطالعه می‌شود البته ساختار چهارم در همه پروتیئنها مطرح نیست. تحقیقات محققین نشان دادهاست که عملکرد پروتئین فقط به توالی اسیدهایآمینه‌ آن، یعنی ساختار اول، بستگی ندارد، بلکه ساختار سوم عملکرد آن را تعیین می‌کند. از تکنیک‌های مختلفی جهت‌ تعیین ساختار سوم پروتئینها استفاده می‌شوند که از مهم‌ترین‌ آن‌ها میتوان کریستالوگرافی اشعه‌ی ایکس و تکنیک NMR را نام برد. تكنيكهاي تعيين ساختار پروتئينها فقط مختصات اتمهاي يك پروتئين را مشخص ميكنند و اطلاعاتی در خصوص ساختار دوم آن ارائه نمیدهد. در اغلب موارد ساختار دوم پروتئینها توسط محققی که ساختار سوم پروتیئن مربوطه را شناسایی کرده، استخراج میگردد و یا اینکه این ساختار را میتوان با برنامههای ویژه ای از اطلاعات مختصات سه بعدی اتمهای یک پروتئین مشخص نمود كه به اين روشها اصطلاحا تخصيص ساختمان دوم پروتئين29 گفته میشود. مزیت این برنامهها یکنواخت کردن معیار تعیین ابتدا و انتهای مارپیچ آلفا میباشد. از این برنامهها میتوان به برنامههای معروفی چون STRIDE و DSSPاشاره نمود. توضحیات بیشتر در این خصوص در بخش مواد و روشها ارائه شدهاست.

1-3-1 پیشگویی ساختار دوم پروتئینها
پیشگویی ساختار دوم بر اساس این حقیقت است که ساختارهای دوم دارای آرایش منظمی از اسیدهای آمینه هستند و با الگوهای پیوندهای هیدروژنی و سایر نیروهای بین اتمی(دافعه، واندروالس و ….) پایدار میشوند. منظم بودن ساختار، پایه اصلی الگوریتم پیشگویی است. پیشگویی ساختار دوم پروتئین دارای برخی کاربردهاست که میتواند در طبقهبندی پروتئینها و نیز جداسازی دمینها و موتیفهای عملکردی بکاررود .(xiong, 2006) سرورهای مختلفی که هر روز نیز بر تعداد آنها افزوده میشود برای پیشگویی ساختار دوم پروتئینها وجود دارد که در بخشهای مربوطه به چند مورد از آنها اشاره شدهاست.
2-3-1 پیشگویی ساختار سوم پروتئینها
حجم بسیار زیادی از توالیها ی پروتئینی از پروژههای بزرگی چون تعیین توالی DNA در مقیاس وسیع کل پروژه ژنوم انسان بدست آمدهاست، ولی به سبب محدودیتهای روشهای x-ray و 30NMR(وقت گیر و پرهزینه)، ساختار سه بعدی بسیاری از پروتئینهای مهم همچنان نامشخص است و با وجود تلاشهای زیاد تعیین ساختار برخی از پروتئینها بویژه پروتئینهای غشایی توسط تکنیک X-ray و NMR با مشکلاتی زیادی مواجه است. از طرفی ساختمان سوم یک پروتئین در حالت طبیعی خود ممکن است به راحتی و بدون کمک عوامل کمکی صورت نگیرد. یک توالی مشخص ممکن است با توجه به محیط خود چندین ساختار بخود بگیرد و یا اینکه ساختار زیستی فعال آن در حالت مطلوب ترمودینامیکی نباشد. شبیه سازی مستقیم تاخوردگی شدن پروتئینها با استفاده از روش دینامیک ملکولی راحت نیست و جز در مورد پروتئینهای بسیار کوچک مورد استفاده قرار نمیگیرد.
از آنجائیکه درک ساختارسه بعدی ماکروملکولها از جمله پروتئینها جهت فهم کامل نقش زیستی آنها حائز اهمیت است و یک مدل سه بعدی کامپیوتری از یک پروتئین میتواند در طراحی آزمایشات بیوشیمیایی مانند جهش هدایت شده، پایداری پروتئین و آنالیز عملکردی بکار رود، از این رو پیشگویی ساختار پروتئینها از توالی آمینواسیدی با استفاده از ابزارهای قدرتمند بیوانفورماتیک بیش از گذشته اهمیت پیدا کردهاست (xiong, 2006).
روشهای محاسباتی پیشگویی ساختار سوم پروتئینهارا به 3 دسته میتوان تقسیم کرد: (1) مدلسازی مقایسهای31، (2) مدلسازی با شناسایی تاخوردگی32 (3) مدلسازی ابتدا به ساکن33 (Floudas, 2007). در این تحقیق از روشهای مقایسهای و شناسایی تاخوردگی استفاده شدهاست. ابزارها، برنامهها و چگونگی بکارگیری آنها جهت پیشگویی ساختار سوم پروتئینها در بخش مواد و روشها بطور مفصل ارائه شدهاست.

4-1 نمایش ساختار پروتئین
برای مشاهده ساختار سهبعدی و چرخش آن در فضا، نیاز به نرمافزارهای نمایشگر است که از آنها میتوان به نرمافزارها و برنامههایی مانندDiscovery Studio, Rasmol ، Swiss-PDB Viewer و VMD34 اشاره نمود.
5-1 مقایسه ساختار سوم پروتئینها
مقايسه ساختماني پروتئين‌ها يكي از روش‌هايي است كه براي ارزيابي يك روش پيشگويي بكار مي‌رود. روش‌ها و الگوريتم‌هاي مختلفي به اين منظور وجود دارد. معياري كه بطور معمول براي مقايسه دوساختار بكار مي‌رود RMSD35 است. در توالي‌هايي كه طول مساوي داشته باشند، جفت توالي كه RMSD كمتري داشته باشند نشان‌دهنده شباهت بيشتر خواهد بود. از نرمافزارها و برنامههایی که جهت مقایسه ساختار سه بعدی پروتئینها بکار میروند میتوان به نرم افزار Swiss-PDB Viewer و برنامه تحت شبکه 36CE اشاره نمود.

پس از آشنایی مختصر با توان و پتانسیل دانش بیوانفورماتیک در زمینه مهندسی پروتئین به مطالعه چگونگی بهرهبرداری و استفاده از این دانش جدید به همراه روشهای مهندسی ژنتیک در جهت جذب و حذف فلزات سنگین از آبهای آلوده میپردازیم.
6-1 فلزات سنگین و اثرات زیستمحیطی آنها
افزایش جمعیت و بدنبال آن رشد فعالیتهای طبیعی و صنعتی بشر منجر به افزایش آلودگی اکوسیستمهای آبی و خاکی با فلزات سنگین، ترکیبات معدنی و آلی و رادیونوکلئوئیدها شدهاست. صنایع عمدهترین منابع آلاینده مربوط به فلزات سنگین هستند. کارخانجاتی از قبیل آبکاری، باطریسازی و تولید قطعات الکترونیک از مهمترین آنها میباشند (Serencam et al., 2008, Saleem et al., 2008).
تخلیه کنترل شده و غیرکنترل شده پسماندهای مایع و جامد کارخانجات و نیز نشتهای تصادفی مواد نفتی باعث حضور فلزات سنگین بیش از استاندارهای تعریف شده در محیط و بروز مشکلات و عوارض جدی برای انسان و جانداران ساکن آن اکوسیستم میگردد (Zheng et al., 2005, Rani 2003).
اگرچه تعریف واضحی برای فلزات سنگین وجود ندارد برخی آنها را بر اساس وزن اتمی، عدهای بر اساس عدد اتمی و تعدادی براساس خصوصیات شیمیایی تعریف میکنند، ولی در بیشتر مواقع دانسیته به عنوان یک فاکتور تعریفی بکار میرود. بدین ترتیب عناصری با دانسیته مخصوص بیش از g/cm3 5 به عنوان فلزات سنگین تعریف میشوند. این عناصر پایدار بوده، وارد زنجیره غذایی انسان میشوند و در بافت زنده جمع میگردند (Wang and Chen, 2006).
بطور کلی فلزات سنگین شامل عناصر واسطه، برخی از متالوئیدها، آکتنیدها و لانتیدها میباشند(Weast, 1984, Nies, 1999) شکل (1-2) .
اکثر فلزات سنگین عناصر واسطه (انتقالی) هستند که اربیتالهای d آنها ب

پایان نامه
Previous Entries منابع پایان نامه با موضوع امام خمینی، حوزه علمیه، ارتباطات انسانی، امام خمینی (ره) Next Entries پایان نامه ارشد درباره محیط زیست، شکستگی استخوان، فرایند ترکیب، سیستم عصبی