مقاله رایگان درباره روش حداقل مربعات

دانلود پایان نامه ارشد

هستند. چون به بهترين نحو پراکندگي اطلاعات موجود در آن را تعريف مينمايند و در نتيجه ميتوان به کمک آنها اطلاعات زائد را حذف نمود [259]. براي نمايش گرافيکي يک ماتريس مثلاً 2×6 ميتوان هر يک از سطرها را در فضاي دوبعدي (تعداد ستونها) بهصورت يک نقطه نشان داد. لذا ماتريس فوق در يک فضاي دوبعدي بهصورت شش نقطه قابل ترسيم است. در اين موارد که در فضاي دوبعدي کلي? نمونهها روي يک خط قرار ميگيرند و در کل پراکندگي در يک جهت ميباشد، ميتوان کل پراکندگي اطلاعات را با استفاده از يک بردار ويژه تعريف نمود. اگر کل پراکندگي در يک بردار ويژه تعريف نگردد، ميتوان بردار ويژ? دومي را يافت که عمود بر بردار ويژ? اول بوده و حداکثر مقدار پراکندگي باقيمانده را که توسط بردار اول شرح داده شده، بيان نمايد [259،264]. با انتخاب بردار ويژ? مناسب فضاي جديدي ايجاد ميشود که از تصوير ماتريس A در آن ميتوان ماتريس جديدي بهدست آورد که داراي ابعاد کمتري نسبت به ماتريس A ميباشد و ماتريس T ناميده ميشود. به اين ترتيب تعدادي از متغيرهاي ماتريس A که به ساير متغيرها وابسته بوده و حاوي اطلاعات زائد بودند، در اين روش حذف ميشوند و ابعاد ماتريس A کاهش مييابد. با استفاده از بردارهاي ويژه بهعنوان فاکتور، فاکتورهايي که حاوي نوفه مـيباشند حذف مـيشوند و ابـعاد فضا کاهش مييابد و اين يکي از مزيتهاي استفاده از بردارهاي ويژه بهعنوان فاکتور ميباشد [259،265،279].
بردارهاي ويژه ترکيبي خطي از متغيرهاي اصلي موجود در ماتريس A هستند. در صورتي که V ماتريس بردارهاي ويژه باشد، ميتوان از تصوير A بر روي فضاي تعريف شده توسط V به ماتريس T با ابعاد کمتر از A دست يافت.
(8-2) AV = T
به ماتريس T که در فضاي جديد بهدست آمده و ترکيبي خطي از ستونهاي ماتريس A ميباشد، ماتريس اسکور206 گفته ميشود. متغيرهاي موجود در ماتريس A را ميتوان به طريق مشابه بهصورت ترکيبي خطي از اسکورها تعريف نمود.
(8-3) AVV´ = TV´ A = TV´(VV´)-1
V´(VV´)?¹ را ماتريس لودينگ مينامند و با P نمايش ميدهند که اعضاي آن کسينوس زواياي بين بردارهاي ويژه و محورهاي مربوط به متغيرها بوده و مقاديرشان از 1+ تا 1- متغير است. بهعبارت ديگر اعضاي اين ماتريس ارتباط بين مختصات اصلي و مختصات جديد را نشان ميدهند. با توجه به بحث فوق ميتوان معادله 8-3 را بهصورت زير نوشت.
(8-4) A = TP + EA
در صورتي که تعداد i بردار لودينگ براي n نمون? استاندارد داشته باشيم و طيف هر يک از اين نمونهها در w طول موج ثبت گردد، A يک ماتريس w×n از مقادير جذب، T يک ماتريس i×n از اسکورها، P يک ماتريس w×i از لودينگ ها و EA يک ماتريس w×n از خطاهاي طيفي ميباشد. مرحله دوم PCR، استفاده از روش MLR براي برازش ماتريس C بر ماتريس T طبق معادله 8-5 ميباشد که ماتريس B در اين معادله توسط روش حداقل مربعات طبق معادله 8-6 تخمين زده ميشود. در مرحل? پيشبيني طيف A نمونه مجهول در ماتريس بردارهاي ويژه (V) ضرب ميشود تا طبق معادله 8-2 مقدار T حاصل شود. سپس با ضرب کردن T در B حاصل از مرحل? درجهبندي، بردار C براي نمون? مجهول بهدست ميآيد [276-264].
(8-5) C = TB + EC
(8-6) B = (T’T)?1T’C
روش حداقل مربعات جزئي (PLS) براي اولين بار توسط کووالسکي در اواخر دهه 1970 در رشته شيمي مورد استفاده قرار گرفت و معرفي الگوريتم PLS در سال 1983 توسط سوانته ولد انجام گرفت [265،280]. مدل PLS بسيار شبيه PCR است، اما با اين تفاوت که بهطور همزمان فاکتورهاي مربوط به هر دو ماتريس A و C را مييابد و بدين ترتيب از اطلاعات ماتريس غلظت نيز در مدلسازي استفاده ميکند. هدف اصلي PLS بهدست آوردن اطلاعات غلظتي بيشتر از آن است که بهوسيله بردار لودينگ ممکن بوده است. در واقع PLS داراي اين مزيت است که بين دادههاي طيفي و غلظت اجزاء ارتباط برقرار مـيکند. مدلهاي تشکيل شده بهصورت زير ميباشند.
(8-7) E + A = TP
(8-8) C = UQ + F
عبـارت U مـاتريس اسکور براي غلظت (C) و عبارت T مـاتريس اسکور براي A مـيباشد. عبـارت P و Q بهترتيب ماتريسهاي لودينگ مربوط به مدلسازي AوC ميباشند. عبارات Eو F نيز بهترتيب ماتريس خطاهاي مربوط به مدلسازي A و C با روش PLS ميباشند. هدف PLS تعريف ماتريس C به بهترين نحو ممکن و کوچک کردن F تا حد امکان و در عين حال دستيابي به رابطهاي سودمند ميان Aو C ميباشد. بين دو ماتريس Uو T رابط? زير برقرار است که در آن B يک ماتريس قطري است و ضرايب برازش بين ستونهاي متناظر در Uو T را در بر ميگيرد و عبارت EU در رابطه زير خطاي اين ارتباط را بيان ميکند [259،264،265].
(8-9) U = TB + EU
مدل تشريح شده در بالا بهترين حالت ممکن نيست، چون فاکتورها بهطور جداگانه براي دو ماتريس A و C بهدست ميآيند و لذا ارتباط ضعيفي با يکديگر دارند. اگر به هر يک از ماتريسهاي اسکور اطلاعاتي در مورد ديگري داده شود، اين ماتريسها بهطور جزئي بهطرف يکديگر چرخش مينمايند و در مقايسه با PCR هر يک از بردارهاي T به فضاي C نزديکتر ميشود. لذا الگوريتم PLS بهنحوي نوشته ميشود که ستونهاي ماتريس A براي تخمين فاکتورهاي C و بهطور همزمان ستونهاي C براي تخمين فاکتورهاي A بهکار روند و اين زماني عملي است که دو ماتريس اسکورهاي خود را با هم تعويض نمايند. در مورد يک نمون? مجهول، به کمک طيف جذبي نمونه و P محاسبه شده توسط مدل، مقدار T بهدست ميآيد. با استفاده از معادله 8-9 با داشتن T و ضريب برازش مقدار U بهدست ميآيد. سپس به کمک معادله 8-8 با داشتن U و Q حساب شده توسط مدل، بردار C براي نمون? مجهول محاسبه ميگردد [259،265]. مزيت روش PLS در اين اسـت که اطـلاعات موجود در محلولهاي استـاندارد به گون? بهتري نسـبت به PCR مورد استفاده قرار ميگيرند و از هر دو ماتريس AوC استفاده ميکند [264،270]. همچنين زمان محاسبات در PLS نسبت به PCR کوتاهتر است و در PLS روشهاي سادهاي براي تشخيص نمونههاي انحرافي وجود دارد [264،281،282].
روش تحليل خطي هيبريدي207 (HLA) يکي از الگوريتمهاي درجهبندي خطي براساس فاکتورهاي خطي ميباشد. اين روش هنگامي ميتواند بهکار رود که دادههاي مربوط به گون? مورد اندازهگيري بهطور خالص در دسترس باشند [283]. اين روش هيبريدي ترکيبي از مزيت دانستن طيف جزء خالص (مشابه CLS) و مزيت مدلسازي صرفنظر از گونـههاي ديگر (مشابه PLS و PCR) ميباشد. نکت? مـهم در HLA بهدست آوردن تعداد محدودي از فاکتورهاي ماتريس دادههاست که مشارکت گون? مورد اندازهگيري در آنها بايد حذف گردد که براساس محاسبات علامت خالص ماده مورد تجزيه208 (NAS) ميباشد [284،285]. کميتهاي گزينشپذيري، حساسيت و مقادير نسبت علامت به نوفه (S/N) اطلاعاتي هستند که ميتوان از NAS بهدست آورد [285]. از کاربردهاي NAS انتخاب طول موج براساس محاسبات منحني برازش علامت خالص ماد? مورد تجزيه جهت حذف اثرات مزاحمتهاي طيفي مدلسازي نشده ميباشد [286،287]. انحراف منحنيهاي برازش NAS از حالت خط مستقيم ناشي از حضور مزاحمتهاي طيفي مدلسازي نشده در دادههاي طيفي ميباشد. در اغلب روشهاي برازش چندمتغيره نظير PLS، PCR و HLA خطي بودن ارتباط ميان پاسخ و غلظت گون? مورد اندازهگيري از فرضهاي اساسي ميباشد. اگر اين ارتباط غيرخطي باشد، فنون درجهبندي چندمتغيره غيرخطي نظير شبکههاي عصبي مصنوعي209 (ANN) بهکار ميروند [288].
فنون درجهبندي بر پاي? فاکتور نظير PLS و HLA اغلب قادر به مدلسازي پاسخهاي غيرخطي شامل اجزاء اصلي اضافي يا متغيرهاي مخفي در مدل درجهبندي هستند، اگرچه نوفههاي با سطح بالا در اجزاء اصلي باقيمانده و يا متغيرهاي مخفي ميتوانند باعث عدم موفقيت در اين امر شوند [292-289]. انتخاب طول موج بر پايه NAS ميتواند مناطق طيفي غيرخطي را حذف کند [293]. با استفاده از ناحيه خطي انتخاب شده از طيفها طي فرآيند فوق نياز به وارد کردن اجزاء اصلي اضافي نيست. در اين روش مدلهاي درجهبندي خيلي پايدار HLA و PLS با استفاده از تعداد کمي اجزاء اصلي قابل دسترسي هستند [284].
منبع دستگاهي محتمل براي پاسخهاي غيرخطي در اندازهگيريهاي طيفنورسنجي شامل پاسخ غيرخطي آشکارساز و نور هرز در مقادير جذب بالاست. يکي از منابع غيرخطي شدن پاسخ، بهدليل تغيير در ترکيب حلال در غلظتهاي بالاي مـواد مـورد تجزيه ميباشد. اين امـر مـوجب تغيير بـزرگي در قـدرت ديالکتريک مـحلول ميگردد و مـيتواند باعث تغيير در موقعيت و پهناي پيک جذبي گردد. اين عوامـل ميتوانند بهعنوان منابعي براي غيرخطي شدن در اندازهگيريهاي طيف نورسنجي باشند [294،295].

8-1-1-3- روشهاي پيشپردازش210 اطلاعات طيفي
روشهاي پيشپردازش متفاوتي براي تصحيح متغيرهاي ناخواسته در پاسخهاي چندمتغيره ابداع شده که از جمل? آنها ميتوان به الگوريتم تصحيح علامت اورتوگونال211 (OSC) و الگوريتم علامت خالص ماد? مورد تجزيه (NAS) اشاره نمود. روش OSC براي اولين بار توسط ولد و همکاران [296] و NAS براي اولين بار توسط لوربر212 [297] ارائه گرديد. ارتباط ميان OSC و PLS توسط اسونسون213 و همکاران [298] بيان شد که نشان دادند الگوريتم OSC به دو گروه تقسيمبندي ميشوند: يک گروه که محدوديت سختي بر حذف اطلاعات اورتوگونال اعمال ميکنند و گروه ديگر اين محدوديتها را در نظر نميگيرند. آنها گزارش نمودند که الگوريتم OSC در ارتباط با برازش PLS ميباشد که بهصورت OSC/PLS بيان ميشود. پيشپردازش OSC ميتواند باعث کاهش پيچيدگي مدل PLS گردد، اما نميتواند باعث تقويت قدرت پيشبيني مدل PLS گردد [299].
الگوريتم NAS نيز در ارتباط با برازش PLS ميباشد که بهصورت NAS/PLS بيان ميشود [299]. ندلر214 و همکاران [300،301] گزارش نمودند که کارايي مدل PLS و NAS در زمينه دادههاي بدون نوفه يکسان ميباشد. ارگون215 و همکاران [302] نشان دادند که پيش پردازش NAS شامل انتقال اسکورهاست، در حاليکه پيش پردازش OSC شامـل انتقال لودينگها مـيباشد. مـرحله کليدي در الگوريتمهاي NAS ميتواند بهطور مستقيم بر روي ماتريسهاي اسکور طيفها با متغيرهاي مخفي (A) باشد، در حاليکه ماتريس Z در الگوريتم OSC فرن216 بر روي وزن لودينگهاي اولين PLS ميباشد [303،304].
اوليوري217 و همکاران [304] يک مقايسهاي از OSC و پردازش خالص ماد? مورد تجزيه218 (NAP) انجام دادند و بهصورت تجربي و تئوري نشان دادند که هر دو پردازش براساس استخراج قسمتي از علامت هست که بهطور مستقيم به غلظت گون? مورد اندازهگيري ارتباط دارد. ناي219 و همکاران [299] الگوريتمهاي NAS و چندين نسخه از الگوريتمهاي OSC را گزارش نمودند و نشان دادند که ارتباطي ميان الگوريتمهاي NAS و OSC وجود دارد که اين قضاوت از روي خطاهاي پيشبيني بر روي دادههاي تجربي انجام شد. همچنين آنها خاطر نشان نمودند که انجام پيشبيني توسط برازش PLS بعد از بهکار بردن الگوريتمهاي NAS/NAP و OSC نتايج يکساني نشان دادند که اين الگوريتمها تداخلات چندمتغيره را حذف ميکنند.

8-1-2- تعيين تعداد فاکتورهاي بهينه
يکي از جديدترين روشها براي تعيين تعداد فاکتورهاي معنيدار در روش درجهبندي چندمتغيره الگوريتم ارزيابي تقاطعي220 است که در هر زمان يک نمونه را بيرون ميگذارد و با بقيه نمونهها مدل ميسازد. براي مثال اگر پانزده طيف در مجموع? درجهبندي داشته باشيم، مدلسازي PLSو PCR با چهارده طيف مجموع? درجهبندي انجام ميشود و با استفاده از اين مدل ساخته شده، غلظتهاي بهدست آمده براي ترکيبات در هر نمونه با غلظتهاي واقعي ترکيبات در نمونه استاندارد مقايسه ميشود و مجموع مربعات خطاي باقيمانده پيشبيني221(PRESS) محاسبه ميگردد. هر بار که تعداد فاکتورها زياد ميشود، اين عمليات تکرار ميگردند و به ازاي هر تعداد فاکتور، PRESS محاسبه ميگردد و تعداد فاکتورهاي مطلوب در حداقل PRESS بهدست ميآيد. معادله PRESS بهصورت زير بيان ميشود:
(8-10)
در معادله فوق غلظت واقعي گون?

پایان نامه
Previous Entries منابع پایان نامه درمورد پوشش گیاهی، بخش مرکزی شهر، شهرستان رشت Next Entries مقاله رایگان درباره نقطه مرکز