مقاله درباره فرآيند، توزيع، نمونهگيري، مشخصههاي

دانلود پایان نامه ارشد

ا مشتري اول سرو نموده به تعداد 5 خوراک و 2 خوراک از خوراکهاي جديد را سرو نموده است. اگر انتخابهاي مشتريان به طور عمودي درکنار يکديگر قرار داده شود، ماتريس باينري که در شکل (8.3) پايين نشان داده شده است، حاصل ميشود.
اگر چه کافه نامتناهي است، اما ساختار توزيع تضمين ميکند که هر مشتري تعداد متناهي خوراک را با احتمال 1 سرو ميکند و بنابراين، با مفروض بودن يک تعداد متناهي از مشاهدات، انتظار ميرود که تنها يک تعداد متناهي از مشخصهها انتخاب شود.
با استفاده از K_1^((n)) براي مشخص کردن تعداد خوراکهاي جديدي که توسط nامين مشتري نمونهگيري شده است، احتمال اينکه ماتريس خاصي توسط اين فرآيند توليد شود برابر است با

شکل 8.3. يک ماتريس باينري که توسط فرآيند IBP با α=10 توليد شده است.

P(Z)=α^(K_+ )/(∏_(n=1)^N▒〖K_1^((n) ) !〗) exp⁡{-αH_N } ∏_(k=1)^(K_+)▒(N-m_k )!(m_k-1)!/N! (26)
همانطور که از شکل (8.3) ميتوان مشاهده نمود، ماتريسهايي که توسط اين فرآيند توليد ميشوند به طور کلي به فرم مرتب شده از چپ نيستند. زيرا ترسيمها از توزيع پواسون همواره منجر به انتخابهايي از
خوراکهاي جديد ميشود که در سمت راست خوراکهايي که قبلاً انتخاب شدهاند قرار ميگيرند.
آنچه که از ساختار کافه هندي کمتر مشهود ميباشد، آن است که فرآيند کافه هندي بينهايت تعويضپذير629 است، به عبارت ديگر، توزيع احتمال Z تحت تأثير رتبه حضور مشتريان در کافه (رتبهبندي مشاهدات) قرار نميگيرد و ستونها (خوراکها) نيز مستقل هستند. به ياد آوريد که در ساختار هندي، مشتريان خوراکها را تنها بر مبناي محبوبيتشان انتخاب ميکنند. بنابراين، تنها چيزي که درباره مشخصه 1 مهم است آن است که اين مشخصه يکي از مشخصههاي مشهورتر باشد. ارزش مقداري که براي مشخصه 1 انتخاب شده است از محبوبيت آن مستقل ميباشد.
البته توجه شود که به طور کلي، مشتريان تحت چنين توزيعي تعويضپذير نيستند، زيرا تعداد خوراکهايي که بر اساس K_1^((n)) شمرده ميشود به رتبه ورود مشتريان، بستگي دارد. به هر حال اگر تنها به کلاسهاي
همارزي- lof(.) از ماتريسهاي توليد شده توسط اين فرآيند توجه نماييم، توزيع تعويضپذير P[(Z)] را با مفروض بودن معادله (25) بدست خواهيم آورد: ماتريسهاي ((∏_(n=1)^N▒〖K_1^((n)) !〗))⁄((∏_(h=1)^(2^N-1)▒〖K_h !〗)) که از طريق اين فرآيند توليد ميشوند به فرم مرتب از چپ يکساني نگاشت ميشوند و P[(Z)] از طريق ﺣﺎﺻﻞضرب P(Z) از معادله (26) و در اين کميت، بدست ميآيد که فرآيند تصادفي IBP تعويضپذير630 نامیده میشود (گرفيث و قهرماني، 2005).

3-12-1-1- ويژگيهاي توزيع IBP تحت ساختار رستوران
ديدگاههاي متفاوت که براي توزيع تصريح شده در معادله (25) وجود دارد امکان استخراج ويژگيهاي آن را سر راست ساخته است. نخست، بعد مؤثر مدل، K_+، از يک توزيع پوآسون، Poisson(αH_N)، نتيجه ميشود. چنين چيزي را ميتوان با استفاده از فرآيند مولدي که در بخش قبلي توصيف شد، به سادگي نشان داد، زيرا تحت اين فرآيند K_+ عبارت است از مجموع Poisson(α)، Poison(α/2)، Poison(α/3) و غيره. همانطور که
ميدانيم ﺣﺎﺻﻞضرب يک مجموعه از توزيعهاي پوآسون، يک توزيع پوآسون ميباشد به طوريکه پارامتر آن برابر مجموع پارامترهاي مؤلفه‌های آن است. با استفاده از تعريف Nامين عدد هارمونيک، مقدار اين پارامتر برابر با αH_N بدست میآید.
ويژگي دوم اين توزيع آن است که تعداد مشخصههايي که در مالکيت هر شيء قرار دارند از يک توزيع Poisson(α) پيروي ميکنند. چنين نتيجهاي از تعريف فرآیند IBP نتيجه ميشود. نخستين مشتري به تعداد Poisson(α) از خوراکها را انتخاب ميکند. طبق ويژگي تعويضپذير بودن، ساير مشتريان نيز بايد به تعداد Poisson(α) از خوراکها را انتخاب نمايند، زيرا رتبهبندي را همواره میتوان بر روي مشترياني که با يک مشتري خاص شروع ميشوند تصريح نمود.
در واقع، مشتريان خوراکها را تنها بر اساس محبوبيتشان انتخاب ميکنند. بنابراين، تنها چيزي که درباره مشخصه 1 مهم ميباشد آن است که اين مشخصه يکي از مشخصههاي مشهورتر باشد. ارزش و مقداري که براي مشخصه 1 انتخاب شده است مستقل از محبوبيتش است.
رفتار اين فرآيند توسط يک ابرپارامتر631 α که تنها پارامتر اين فرآيند است، کنترل ميشود. اين پارامتر تعداد مورد انتظار مشخصههاي موجود در هر مشاهده را کنترل ميکند. به بيان ديگر، براي تعداد يکسان از مشاهدات، پارامتر α بر اينکه چقدر احتمال دارد که چندين مشاهده، مشخصههاي مشترکي را سهيم باشند، تأثير
ميگذارد. به همين دليل است که به آن پارامتر تمرکز632 نيز ميگويند.
تعداد مورد انتظار از مشخصههاي نهفته،K، در N مشاهده برابر O(αlog⁡(N)) است؛ مدل مولد633 سناريوهايي را تأييد ميکند که در آنها يک تعداد اندک مشخصه عمومي و مشخصههاي نادر وجود دارد.
فرآيند IBP فرض ميکند که مشخصههاي نهفته باينري هستند. بنابراين، يک شيء يا يک مشخصه را در تملک دارد يا ندارد. همچنين فرض ميکند که مشخصههاي نهفته از لحاظ آماري مستقل ميباشند، به اين معنا که دانش درباره اينکه يک شيء يک مشخصه را در مالکيت دارد هيچگونه اطلاعاتي در مورد اينکه آيا ساير مشخصهها را در مالکيت دارد يا نه فراهم نميکند. در پايان، اين فرآيند فرض ميکند که مشخصههاي نهفته يک زيرمجموعه متناهي از يک مجموعه بيکران يا نامتناهي از مشخصهها هستند.
توجه شود که تشبيه به کافه هندي مستقیماً به نمونهگير گيبز634 زير منجر ميشود. قاعده بيز بيان ميکند که
p(z_nk ├|Z_(-nk) ┤, A, X)∝p(X├|A, ┤ Z)p(z_nk |Z_(-nk) ┤)
جمله راستنمايي p(X├|A, ┤ Z) از مدل نويز به راحتي محاسبه ميشود، در حاليکه براي محاسبه جمله پيشين p(z_nk |Z_(-nk) ┤) بايد به طريق زير عمل شود: تصور کنيد مشتري n آخرين فردي است که به رستوران وارد شده است (اين فرض به علت تعويضپذير بودن معتبر است).
جمله پيشين p(z_nk |Z_(-nk) ┤) براي مشخصههاي فعال635 (خوراکهاي امتحان شده یا نمونهگيري شده) برابر m_k⁄N است. مشخصههاي جديد از طريق ترکيب مدل راستنمايي با پيشين بر روي تعداد خوراکهاي جديد که يک مشتري امتحان خواهد کرد، نمونهگيري ميشود.
اگر پيشين A مزدوج636 با راستنمايي باشد، با انتگرالگيري از راستنمايي p(X├|A, ┤ Z)، ميتوانيم A را حذف کنيم و p(X├|Z┤) را در نظر بگيريم. اين رويکرد به نمونهگير گيبز فروپاشيده637 براي فرآیند IBP منجر ميشود. با حذف A، توزيع حاشيهاي p(X├|Z┤) بدست ميآيد که به نمونهگير گيبز فروپاشيده، سطحي از انعطافپذيري را ميدهد به اینصورت که نسبت به نمونهگير گيبز فرونپاشيده638 سريعتر ترکيب ميشود.
به هر حال اگر راستنمايي مزدوج نباشد، يا اگر مجموعه دادهها بزرگ و از بعد بالا برخوردار باشند، p(X├|Z┤) ممکن است محاسبه دشوار و پرهزينهتري را در مقايسه با p(X├|A, ┤ Z) داشته باشد. در اينگونه موارد، نمونهگير گيبز بايد ماتريس مشخصه A را بر مبناي توزيع پسين آن يعني p(A├|X, ┤ Z)، نيز نمونهگيري کند.

3-12-2- ساختار چسباندن-شکستها639
ساختار رستوران مستقیماً به نمونهگيري گيبز منجر ميشود، اما به آساني نميتوان آن را براي استنباط تغيير به کار گرفت. در این رساله براي رويکرد تغيير، ساختار آلترناتيو ديگر از فرآیند IBP، یعنی ساختار چسباندن-شکستها (ته و همکاران640، 2007) را مد نظر قرار ميدهيم. ساختار چسباندن شکستها، مشخصهها را بر اساس محبوبيتشان رتبهبندي ميکند. براي توليد يک ماتريس Z با استفاده از ساختار چسباندن-شکست، با اختصاص يک احتمال π_k∈(0, 1) به هر ستون مشخصه شروع و هر z_nk را به عنوان يک متغير تصادفي برنولي مستقل با پارامتر π_k، Bernoulli(π_k )، نمونهگيري ميکنیم. چون هر مشتري يک خوراک را مستقل از ساير مشتريان نمونهگيري ميکند، اين نمايش روشن ميسازد که رتبهبندي مشتريان اثري بر توزيع نخواهد داشت.
اما احتمالات مشخصهها π_k، به طور مستقل نمونهگيري نميشوند. در مقابل، نخست يک دنباله از متغيرهاي تصادفي مستقل v_1, v_2, … که هر کدام توزيع بتا Beta(α, 1) دارند را ترسيم ميکنيم. براي دنباله مفروض v_1, v_2, …، احتمال π_k براي يک مشخصه k به صورت زير محاسبه ميشود
π_k=∏_(i=1)^k▒v_i
که يک دنباله نزولي از احتمالات π_k را تولید میکند، π_kπ_(k+1), ∀k. مقدار مورد انتظار π_k برابر (α/(1+α) )^k است. به خصوص اينکه، با مفروض بودن يک مجموعه متناهي از دادهها، براي مقادير بزرگ k، احتمال آنکه هر کدام از N مشاهده، مشمول آن مشخصه باشد به طور نمايي کاهش مييابد. مقادير بزرگتر α به معناي آن است که انتظار داريم مشخصههاي بيشتري در دادهها مشاهده نماييم؛ به عبارت ديگر، براي مقادير بزرگ α، π_k آهستهتر نزول میکند. بنابراين، مقادير بزرگتر α به معناي آن است که مشخصههاي بيشتري در دادهها حضور خواهند داشت.

3-12-2-1- استنباط تغيير براي فرآيند IBP
اگر چه فرآیند IBP مدلي جذاب به نظر ميرسد اما ماهيت ترکيبي641 آن، استنباط را تا اندازهاي با دشواري همراه ساخته است. در حقيقت وجود متغيرهاي نهفته موجب وابستگي ميان کليه متغيرهاي مشاهده نشده مدل شده است. حتي اگر خود را به K مشخصه و N شيء محدود نماييم، انتظار ميرود که به تعداد O(αlog⁡(N)) اختصاص براي مشخصهها (مالکيت) وجود داشته باشد. در اين فضاي ترکيبي، روشهاي استنباط براي IBP که بر مبناي نمونهگيري642 قرار دارند اغلب با زيان و ناکارايي همراه هستند… خصوصاً آنها ميتوانند در چارچوبهاي مقياس بزرگ، چارچوبهاي چندمتغيره و دادههاي همبسته بسیار آهسته عمل کنند. روشهاي موجود
نمونهگيرهايي را نتيجه ميدهند که انعطافپذيري کمي در حرکت بين بهينهها دارند و ممکن است مدت زمان زیادی مورد نياز باشد تا اين نمونهگيرها از بهينه کوچک خلاص شده و مناطقي را با توده احتمال بالا، بيابند. متأسفانه، تمامي روشهاي استنباطي که تاکنون براي IBP وجود داشتهاند همه بر مبناي نمونهگيري قرار دارند. اين رويکردها شامل نمونهگيري گيبز (گرفيث و قهرماني، 2005)، است که میتوانند با ابزارهاي تجمیع-دو بخشي متروپوليس643 (ميدز و همکاران644، 2007)، يا با نمونهگيري قطعهاي645 (ته و همکاران، 2007) و فيلترينگ ذرهاي646 (وود و گرفيث647، 2007)، تعميم داده شود.
روشهاي تغيير ميدان ميانگين648 که پسين واقعي649 را از طريق يک توزيع نمونهگير650 در چارچوبهاي سادهتر تقريب تحليلي651 ميزنند، يک آلترناتيو معین را براي رويکردهاي بر مبناي نمونهگيري، مانند روشهاي
نمونهگيري مونتي-کارلو-بالأخص روش مونتي-کارلو زنجيره مارکوف652 (MCMC) از قبیل روش نمونهگيري گيبز، فراهم ميکنند.
با اين حال، تاکنون کاربرد روشهاي تغيير به مدلهاي با بعد متناهي (يعني پارامتريک) محدود شده است (ونرايت و جردن653، 2008). در چنين چارچوبي، براي يافتن يک تقريب خوب از پسين، استنباط با تکينکهاي بهينهسازي همراه ميباشد. تقريب ميدان ميانگين (دوشي ولز و همکاران654، 2009) براي فرآيند تصادفي IBP، يک احتمال مجزا را براي هر اختصاص مشخصه به مشاهده، فراهم ميکند. متأسفانه، بهينهسازي اين مقادير احتمال، تعداد زيادي بهينه موضعي بدست میدهد، اما استفاده از احتمالات به جاي نمونهگيري اختصاصها، به روش تغيير انعطافپذيري خاصی ميدهد که نمونهگيرها ندارند. در مراحل اوليه استنباط، اين انعطافپذيري ميتواند از رسيدن روش تغيير به بهينه موضعي جلوگيري کند.
تقريبهاي تغيير براي ساير مدلهاي بيزين ناپارامتريک نيز کاربرد دارد. اين مدلها شامل، فرآيندهاي ديريکله655 (بلي و جردن، 2004؛ کريهارا و همکاران656، 2007a؛ کريهارا و همکاران، 2007b) و فرآيندهاي گاوسين657 (وينتر658، 2000؛ گيبز و مک کي659، 2000؛ و اسنلسون و قهرماني660، 2006) ميباشند. در ميان همه مدلهاي بيزين ناپارامتريک که تاکنون مطالعه شدهاند، فرآيند تصادفي IBP ترکيبيترين است و از اين رو بيشترين نياز به يک الگوريتم استنباط کارا را ميطلبد که در فصل آینده بر این مهم مفصلاً پرداخته میشود.

فصل چهارم

توصيف و
تجزيه و تحلي

پایان نامه
Previous Entries مقاله درباره باينري، مشتري، ستونهاي، توزيع Next Entries مقاله درباره (Z_i، Q_i، تغيير، توزيع