تحلیل کاپلان مایر Kaplan-Meier آنالیز بقا با نرمافزار Prism
در ابتدا لازم است به این نکته اشاره کنیم که نرمافزار Prism از روشهای تحلیل بقا Survival Analysis به صورت زیر استفاده میکند.
Nonparametric survival analysis
آنالیز بقا ناپارامتری. در این روش امکان استفاده از کمیتهای پیشبینی کننده وجود ندارد. این آنالیز از روش کاپلان مایر Kaplan-Meier برای براورد تابع بقا (منحنی بقا) استفاده میکند. آنالیز بقا ناپارامتری، منحنیهای جداگانه هر کدام از گروههای مختلف (تعریف شده توسط یک Variable طبقهبندی شده) را با استفاده از آزمونهای (Mantel-Haenszel، Mantel-Cox) و/یا Gehan-Breslow-Wilcoxon مقایسه میکند.
Semiparametric survival analysis
آنالیز بقا نیمه پارامتری. در این روش امکان استفاده از کمیتهای پیشبینی کننده پیوسته یا طبقهبندی شده وجود دارد. این آنالیز از رگرسیون خطرات متناسب کاکس Cox proportional hazards regression جهت براورد نسبتهای خطر hazard ratios و ضرایب پارامتر، منحنیهای بقا و براورد احتمال بقا Survival Probability برای هر مشاهده استفاده میکند.
نوع دیگری از آنالیز بقا با نام تحلیل بقا پارامتری Parametric survival analysis وجود دارد که به فرضیات اضافی در مورد توزیع زمان بقا در جمعیت نمونه نیاز دارد و در حال حاضر به عنوان یک تحلیل در نرمافزار Prism ارایه نمیشود.
به عنوان مقدمه خوب است بدانیم که روش براورد بقای کاپلان مایر توسط دو دانشمند به نامهای ادوارد کاپلان Edward Kaplan و پل مایر Paul Meier نامگزاری شده است آنها به طور مستقل ریاضیات و معادلات مربوط به این تکنیک را ارایه کردند (علاقمند بودید لینک the mathematics of Kaplan-Meier survival analysis را ببینید.)
آنها به صورت جداگانه این روش را به مجله انجمن آماری آمریکا ارسال کردند، و سپس توسط سردبیر مجله جان توکی John Tukey متقاعد شدند که کار خود را ترکیب کنند و به این ترتیب اکنون آنالیز کاپلان مایر به طور گسترده در مطالعات مربوط به آنالیز بقا استفاده میشود.
چگونه آنالیز بقا کاپلان مایر انجام دهیم؟
من در این مقاله به توضیح روش کاپلان مایر Kaplan-Meier با استفاده از نرمافزار Prism میپردازم و مراحل انجام کار را گام به گام بیان میکنم. ورود دادهها به نرمافزار، انتخاب آزمون، رسم گراف و به دست آوردن نتایج، اصلیترین کارهای ما در انجام همهی انواع تحلیلهای آماری با استفاده از نرمافزار Prism میباشد. در اینجا نیز که قصد داریم به بیان روش کاپلان مایر در تحلیل دادههای بقا بپردازیم، همین مراحل را انجام میدهیم.
- طراحی جدول دیتا بقا (Create a survival data table)
از کادر گفتگوی Welcome یا New Table، تب Survival را انتخاب کنید. در تصویر زیر آن را ببینید.
همانگونه که میدانیم در همهی تحلیلهای نرمافزار Prism، در بخش Data table میتوانیم دیتا و دادههای خودمان را وارد نرمافزار کنیم (Enter or import data into a new table) و یا از دادههای آموزشی و مثالهای نرمافزار (Start with sample data to follow a tutorial) استفاده کنیم.
انتخاب گزینه (Enter or import data into a new table) سبب میشود در کادر پایین Options دو حالت برای ما باز شود.
- Enter elapsed time as number of days (or months…)
در این حالت زمان سپری شده به عنوان یک عدد و اندازه مثبت، تحت عنوان روز، ساعت و یا هر واحد زمانی مناسب دیگر، وارد نرمافزار میشود. توجه داشته باشید که اینها زمانهای سپری شده هستند و بنابراین نیازی به تعیین زمان صفر نیست.
- Enter a starting and ending date
در این حالت تاریخ شروع و پایان را وارد کنید. برای این گزینه، باید یک تاریخ تقویمی برای زمان شروع (صفر) و زمان پایان هر مشاهده وارد شود. Prism تفاوت بین این دو تاریخ را به عنوان زمان مشاهده سپری شده، محاسبه میکند.
اگر هنوز برای وارد کردن دادههای خود آماده نیستید و نیاز به راهنما دارید، گزینه «Start with sample data to follow a tutorial» را انتخاب کنید و یکی از مجموعه دادههای آموزشی یعنی مقایسه دو یا سه گروه را انتخاب کنید.
- وارد کردن دادهها (Enter the survival times)
اکنون وقت آن است که دادههای خود را وارد نرمافزار کنیم. به نظرم بهتر است ابتدا تصویر زیر را که یک نمونه از نحوه وارد کردن دادهها در تحلیل Survival است، ببینید.
جهت وارد کردن دادهها به نرمافزار Prism نیاز به رعایت کردن برخی از دستورالعملهای مهم است. آنها را به ترتیب در ادامه نوشتهام.
زمان سپری شده تا رسیدن به رویداد مورد بررسی یا سانسور را به ازای هر فرد، در یک ردیف جداگانه وارد کنید.
زمان تا سانسور یا رویداد مورد بررسی را در ستون X وارد کنید. توجه داشته باشید که اگر با دادههای خود شروع کنید، Prism دو گزینه برای وارد کردن زمانهای سپری شده ارایه میدهد. دربارهی آنها کمی بالاتر توضیح دادیم.
به صورت دلخواه، میتوان از عناوین ردیف برای شناسایی هر موضوع/شرکتکننده استفاده کرد. این کار در ستون با عناوین Title قابل انجام است. به این نکته توجه کنید که این اسامی دلخواه هستند و در تحلیل نتایج و دادهها، نقشی ندارند.
برای ردیفهایی که در آن موضوع/شرکتکننده، رویداد مورد بررسی را تجربه کرده است، عدد “1” را در ستون Y وارد کنید. عدد “0” را در ردیفهایی که فرد، رویداد را تجربه نکرده است و اصطلاحاً در مدت زمان مطالعه سانسور شده است وارد کنید. توجه داشته باشید که هر سطر باید دارای 0 یا 1 در ستون Y باشد. سطر بدون 1 یا 0 در ستون Y از تحلیل حذف میشود.
افراد متعلق به گروههای درمانی مختلف را در ستونهای Y مختلف (یک ستون Y برای هر گروه) وارد کنید. هر سطر باید فقط یک مقدار در یک ستون Y داشته باشد. به عنوان مثال، در تصویر بالا، 10 ردیف اول مربوط به افراد گروه کنترل است، در حالی که 10 ردیف بعدی مربوط به گروه درمان است،
با این حال، توجه داشته باشید که هیچ دلیلی وجود ندارد که گروهها به این ترتیب از هم جدا شوند. یعنی ابتدا دادهها و سطرهای مربوط به گروه الف نوشته شود و سپس سطرهای مربوط به گروه ب. در واقع تا زمانی که زمان سپری شده صحیح با نتیجه صحیح (1 یا 0) در گروه صحیح (ستون) در همان ردیف همراه باشد، نتایج تحلیل یکسان خواهد بود. به عنوان مثال، دادههای بالا را نیز میتوان به صورت زیر وارد کرد.
انتخاب آزمون در آنالیز بقا
Analysis choices for survival analysis
حال نوبت آن رسیده است که به تحلیل در نرمافزار بپردازیم. قبل از آن به انتخاب آزمون مناسب و بررسی تنظیمات نرمافزار اشاره میکنیم. فایل دیتا این مثال و نتایج آن را میتوانید از اینجا کاپلان مایر Kaplan-Meier دریافت کنید.
یکی از خوبیهای کار با نرمافزار Prism (به ویژه در آنالیز بقا) این است که این نرمافزار، دادههای بقا را به صورت خودکار و بدون نیاز به تنظیمات دستی، تحلیل میکند. در واقع Survival Analysis در بین همهی تحلیلهایی که Prism ارایه میدهد منحصر به فرد است.
هنگامی که دادهها به درستی در Survival Data Table (یعنی همان مسیری که در بخش قبل از آن نام بردیم و توضیح دادیم) وارد میشوند، نرمافزار به طور اتوماتیک تحلیل دادهها را انجام میدهد و منحنیهای بقای Kaplan-Meier را ایجاد میکند. یعنی حتی شما نیازی به استفاده از دکمه نوار ابزار آنالیز ندارید. Prism از گزینههای پیش فرض برای تحلیل استفاده میکند و نتایج و گرافها را به دست میآورد.
با این حال از آنجا که ما میخواهیم بیاموزیم و کار با نرمافزار Prism جهت انجام تحلیل بقا کاپلان مایر را یاد بگیریم، لازم است وارد پنجره تنظیمات آزمون شویم. این پنجره را میتوان از منوی و مسیر زیر مشاهده کرد.
هنگامی که OK میکنیم، پنجره تنظیمات آنالیز بقا کاپلان مایر با نام Parameters Simple Survival Analysis (Kaplan-Meier) باز میشود. در تصویر زیر آن را ببینید.
در ادامه دربارهی بخشهای مختلف پنجره تنظیمات آنالیز بقا کاپلان مایر، صحبت خواهیم کرد.
Inputدر این بخش مقادیر عددی ستون Y که در آن رویداد یا عدم رویداد برای هر سطر مشخص میشد، تعیین میشود. انتخاب پیش فرض استفاده از کد “1” برای نشان دادن اینکه رویداد مورد بررسی رخ داده و کد “0” برای نشان دادن سانسور شدن مشاهده، میباشد. این کدها تقریباً جهانی هستند. با این حال، برخی از موسسات از کدهای مخالف استفاده میکنند. در Prism این کدها را میتوان به صورت دستی مشخص و تعریف کرد.
Curve comparisonsبر مبنای اینکه ما به مقایسه دو یا بیشتر از دو گروه با یکدیگر میپردازیم، یکی از بخشهای Calculations to compare two groups یا Calculations to compare three or more groups فعال میشود. برای مقایسه منحنیهای بقا، نرمافزار از روشهای زیر استفاده میکند.
- Logrank Test
دو روش برای محاسبه این تست وجود دارد. آنها معادل هستند، اما میتوانند در نحوه برخورد آنها با چندین رویداد که دقیقاً در یک زمان اتفاق میافتد کمی متفاوت باشند (این مفهوم در دادهها به عنوان “پیوندها” Ties شناخته میشود). Prism از روش Mantel-Haenszel استفاده میکند، اما از نام “logrank” استفاده میکند که معمولا برای هر دو رویکرد استفاده میشود. این روش به Mantel-Cox نیز معروف است.
- Gehan-Breslow-Wilcoxon Test
این روش به رویدادهایی که در زمانهای ابتدایی مطالعه رخ میدهند وزن بیشتری میدهد، که البته منطقی است (هرچه یک رویداد زودتر رخ دهد، احتمال اینکه مشاهده مهمی باشد بیشتر است زیرا انتظار میرود همه شرکتکنندگان در مطالعه در نهایت رویداد مورد علاقه را تجربه کنند). با این حال، زمانی که بخش بزرگی از شرکت کنندگان در مطالعه در مقاطع زمانی ابتدایی سانسور شوند، نتایج این آزمون میتواند گمراه کننده باشد. در مقابل، آزمون Logrank به مشاهدات در تمام نقاط زمانی وزن یکسانی میدهد.
آزمون Logrank استانداردتر است و اگر فرض خطرات متناسب Proportional Hazards درست باشد، آزمون قویتری است. خطرات متناسب به این معنی است که نسبت توابع خطر (مرگ در هر زمان) در تمام نقاط زمانی یکسان است. یک مثال از خطرات متناسب میتواند این باشد که مشاهدات گروه کنترل با سرعت دو برابر گروه تحت درمان در تمام نقاط زمانی بمیرد. در این صورت بهتر است از آزمون Gehan-Breslow-Wilcoxon استفاده شود.
روش Gehan-Breslow-Wilcoxon به نسبت خطر ثابت نیاز ندارد، اما مستلزم آن است که یک گروه به طور مداوم ریسک بالاتری نسبت به گروه دیگر داشته باشد. اگر شک دارید که از کدام روش استفاده کنید، آزمون Logrank (که استانداردتر است) را گزارش دهید. تست Gehan-Breslow-Wilcoxon را تنها در صورتی انتخاب کنید که دلیل محکمی برای انجام آن داشته باشید.
- logrank test for trend
این آزمون زمانی مناسب است که ترتیب گروهها (تعریف شده توسط ستونها در جدول دادهها) منطقی باشد. به عنوان مثال اگر گروهها (ستونها) گروههای سنی مختلف، شدت بیماریهای مختلف یا دوزهای متفاوتی از یک دارو باشند، که هر کدام به ترتیب منطقی (صعودی یا نزولی) قرار گرفتهاند، خوب است که از آزمون logrank test for trend استفاده شود.
نرمافزار Prism همچنین از دو روش به منظور محاسبه مقدار احتمال P value (جهت آزمون مقایسه سه یا چند گروه از منحنیهای بقا) استفاده میکند. روش توصیه شده نرمافزار مطابق با نرمافزارهای SPSS و SAS است. جزئیات این روش در کتابچههای راهنمای SPSS و NCSS توضیح داده شده است.
Styleنحوه محاسبه و ارائه نتایج (درصد یا کسری، مرگ یا بقا) نیز میتواند در پنجره تنظیمات انجام آنالیز بقا مشخص شود. اگر بخواهید فواصل اطمینان 95% را ترسیم کنید، Prism دو انتخاب ارایه میدهد. پیش فرض یک روش تبدیل است که فواصل اطمینان نامتقارن را ترسیم میکند. گزینه جایگزین انتخاب فواصل متقارن Greenwood intervals است. فواصل نامتقارن معتبرتر هستند و گزینه پیشنهادی هستند.
همچنین یک چک باکس به شما امکان میدهد تصمیم بگیرید که مشاهدات سانسور شده را ترسیم کنید یا خیر. به صورت پیشفرض این گزینه جهت نمایش دادههای سانسور شده بر روی گراف، انتخاب شده است.
در پایان بخش Output دیده میشود. در اینجا میتوان انتخابهایی جهت نمایش تعداد رقمهای اعشار و فرمت P value به دست آمده در نتایج آنالیز، قرار داد.
طراحی گرافها در آنالیز بقا
Graphing survival data
هنگامی که دادهها در جدول دادههای بقا به درستی وارد میشوند، Prism به طور خودکار دادههای بقا را تحلیل میکند و نموداری از منحنیهای بقا ایجاد میکند. گزینههای گرافهای بقا Kaplan-Meier تاحدی ساده هستند، با این حال بیایید توضیحاتی دربارهی تعیین نحوه سفارشیسازی این نمودارها بیان کنیم.
هنگامی که روی شیت Graphs کلیک میکنیم، با پنجره Change Graph Type روبهرو میشویم. در تصویر زیر آن را ببینید.
در این پنجره میتوانیم نحوه نمایش دلخواه منحنی بقا را انتخاب کنیم. چند گزینه نیز دیده میشود.
- Show results as
بقا باید به صورت کسری Fractions (از 0 تا 1) یا به صورت درصد Percents (از 0٪ تا 100٪) ترسیم شود؟ پاسخ به این سوال ساده است و به سلیقه و دلخواه ما بستگی دارد.
- Plot symbols at
نرمافزار برای همه مشاهدات دارای نشانگر symbols در نمودار باشد یا فقط برای مشاهدات سانسور شده؟ معمولاً فقط نشانگر برای مشاهدات سانسور شده قرار میگیرد.
- Error bars
پیش فرض این است که برای منحنی های بقای کاپلان مایر، Error bar نمایش داده نشود. با این حال، میتوانید انتخاب کنید که ارور بارها برای خطای استاندارد SE در هر نقطه زمانی نمایش داده شود، یا فاصله اطمینان 95 درصد به عنوان باندهای بالا و پایین برای هر منحنی نمایش داده شود.
به طور معمول، منحنیهای بقا برای نشان دادن احتمال بقا در طول زمان ترسیم میشوند (شروع از زمان صفر). این منحنیها از 100% (یا 1 در صورت نمایش بقا به صورت کسری) شروع میشوند و با گذشت زمان کاهش مییابند. از نظر ریاضی، منحنیهای بقا نشاندهنده این احتمال است که رویداد مورد بررسی در زمان معین “t” رخ نداده است. بنابراین، در زمان صفر، زمانی که منحنی بقا در 100% است، نشان میدهد احتمال 100% وجود دارد که رویداد مورد بررسی هنوز رخ نداده است.
نمودارهای وقوع تجمعی Cumulative incidence graphs رابطه وارون را نشان میدهند و این احتمال را بیان میکنند که رویداد مورد بررسی در زمان معین “t” رخ داده است. این را میتوان از نظر ریاضی به عنوان (1 – احتمال بقا) توصیف کرد. بنابراین، این نمودارها از 0 شروع میشوند و حداکثر به 1 (به صورت کسری) یا 100 (به عنوان درصد) افزایش مییابند. برای ایجاد یک نمودار وقوع تجمعی، یکی از انواع نمودار مربوطه را در گفتگوی Change Graph Type انتخاب کنید. در تصویر زیر آنها را ببینید.
نتایج آنالیز بقا کاپلان مایر
Results of Kaplan-Meier survival analysis
حال بیایید در ادامه دربارهی نتایج و خروجیهای نرمافزار Prism پس از انجام آنالیز بقا کاپلان مایر صحبت کنیم. این نتایج در شیت Results نرمافزار قرار دارند.
یکی از نتایج اولیه تحلیل بقای کاپلان مایر، نسبت یا درصد بقا survival proportions در هر نقطه زمانی است. این مقادیر اغلب به صورت گرافیکی ارایه میشوند، اما گاهی اوقات مشاهده جدول این نتایج نیز مفید است. تب نتایج برای این مقادیر به طور پیش فرض نامرئی است. برای مشاهده آن، به سادگی روی منوی کشویی در سمت راست برگه های تحلیل کلیک کرده و آن را از لیست انتخاب کنید. تصویر زیر را ببینید.
نرمافزار، نسبت بقا survival proportions را با استفاده از روش Kaplan-Meier محاسبه میکند. برای هر مقدار X (زمان)، کسر (یا درصد) مشاهداتی گزارش میشود که هنوز رویداد مورد علاقه را تجربه نکردهاند. اگر یک نمودار وقوع تجمعی به جای نمودار بقا ایجاد شده باشد (دربارهی آنها بالاتر صحبت کردیم)، این مقادیر نشاندهنده کسر/درصد مشاهداتی خواهند بود که رویداد مورد علاقه را تجربه کردهاند.
در جدول نتایج زیر اندازههای عددی نسبت بقا به ازای هر زمان و در هر گروه مربوط به مثال ما آمده است. آن را ببینید.
به عنوان مثال سطری که رنگی شده است، نشان میدهد در زمان 211 (روز)، 48% از گروه کنترل هنوز رویداد مورد نظر (مرگ) را تجربه نکردهاند. به عبارت دیگر در زمان 211، 48% افراد گروه کنترل همچنان زنده هستند. در این زمان، 38.57% افراد گروه درمان A و 100% افراد گروه درمان B همچنان زنده هستند.
خوب است همین جا این نکته را بدانیم که نرمافزار Prism میتواند برای نسبت بقا، فواصل اطمینان 95 درصد را نیز محاسبه کند. جهت مشاهده این فواصل اطمینان میتوان از همان پنجره تنظیمات نرمافزار با نام Parameters Simple Survival Analysis (Kaplan-Meier) که قبلاً دربارهی آن توضیح دادیم، گزینه 95CI% را انتخاب کنیم.
یک راه حل دیگر استفاده از تنظیمات پنجره گراف با نام Change Graph Type و انتخاب گزینه 95CI% در بخش Error bars است. در این صورت منحنی بقا ما به صورت زیر خواهد بود. یعنی علاوه بر دارا بودن نسبت بقا یا احتمال بقا Probability of Survival دارای فواصل اطمینان 95% نیز میباشد.
همانگونه که در گراف بالا مشاهده میکنید، فواصل اطمینان به صورت نقطه چین، نمایش داده شده است. با انجام این کار در شیت نسبت بقا survival proportions نتایج، جدول دادهها شامل فواصل اطمینان نیز خواهد بود. در تصویر زیر آن را ببینید.
به عنوان مثال سطرهایی که رنگی شده است، نشان میدهند در زمان 211 (روز)، 48% از گروه کنترل هنوز رویداد مورد نظر (مرگ) را تجربه نکردهاند. فاصله اطمینان بقا برای گروه کنترل و تا روز 211 به صورت (26.47 + 48 ,31.91 – 48) بیان میشود.
این نتیجه برای گروه A به صورت، 38.57% با بازه اطمینان بقا (29.93 + 38.57 ,29.49 – 38.57) نوشته میشود. به همین ترتیب برای گروه B برای روز 299 به صورت، 66.67% با بازه اطمینان بقا (23.78 + 66.67 ,47.20 – 66.67) گزارش میشود.
- سوال. چه زمانی منحنی بقا به صفر میرسد؟
یک سوالی که معمولاً مطرح میشود و من علاقمند هستم در اینجا به آن پاسخ دهم، این است که منحنی بقا در چه مواردی به صفر میرسد؟ یعنی احتمال بقا برابر با صفر میشود؟ به عنوان مثال به همان گراف بالا نگاه کنید. برای این گراف، نمودار بقا در گروههای A و B در پایان به صفر رسیده است، اما برای گروه کنترل چنین اتفاقی رخ نداده است و گروه کنترل کار خود را با احتمال بقای بزرگتر از صفر (از شیت survival proportions در Results مشخص میشود با احتمال بقا 12%) به پایان برده است.
پاسخ این است که اگر منحنی بقا تا 0% کاهش یابد، به این معنی نیست که همهی آزمودنیها، رویداد مورد علاقه (مرگ) را تجربه کرده باشند. همانگونه که در همان مثال بالا میتوانید ببینید که در گروه A از 10 فرد مطالعه، 8 مورد مرگ را تجربه کرده و 2 مورد دیگر سانسور شده است. در گروه B نیز از 7 فرد مطالعه، 6 مورد مرگ را تجربه کرده و 1 مورد دیگر سانسور شده است. با این حال همان گونه که در منحنی بقا آنها مشاهده میکنید، احتمال بقا برای این گروهها در نهایت صفر شده است.
به این نکته دقت کنید که برخی از افراد ممکن است در مقاطع زمانی قبلی سانسور شده باشند (به این دلیل که مطالعه را ترک کردهاند، یا به این دلیل که مطالعه قبل از اینکه رویداد مورد علاقه را تجربه کنند به پایان رسیده است). احتمال بقا زمانی به صفر میرسد که مشاهده در آخرین نقطه زمانی رویداد مورد علاقه را تجربه میکند و نه موردی که سانسور شده است.
برای فهم بهتر این مطلب به گروه A نگاه کنید. گفتیم که در این گروه از 10 فرد مطالعه، 8 مورد مرگ را تجربه کرده و 2 مورد دیگر سانسور شدهاند. بنابراین شاید منطقی به نظر برسد که بگوییم احتمال بقا برابر با 20% است. اما چرا اینگونه نیست که منحنی بقا برای گروه A به صفر کاهش پیدا میکند؟
زیرا 2 مورد، بین 1 تا 156 روز سانسور شدند. ما نمیدانیم که اگر آنها تا پایان در مطالعه میماندند (یعنی تا روز 321) چه اتفاقی برای آنها میافتاد. به دلیل اینکه نمیدانیم آنها زنده میماندند یا میمردند، دادههای آنها بعد از زمان سانسور حساب نمیشوند. در زمان 321، فقط یک مشاهده با نام فرضی AC همچنان پیگیری میشود و او نیز در این زمان مرگ را تجربه میکند و احتمال زنده ماندن را به صفر میرساند.
به همین ترتیب برای گروه B آخرین زمان مطالعه روز 365 است. مشاهده TO نیز در این روز به مرگ رسیده است. بنابراین برای هر دو گروههای A و B منحنی بقا در نهایت و در آخرین تایم خودشان به احتمال بقا صفر میرسند.
همین نتیجه را برای مشاهدات گروه کنترل ببینید. آخرین زمان مطالعه در این گروه روز 378 است که در آن مرگ رخ نداده بلکه داده سانسور شده (ستون Y با کد صفر) اتفاق افتاده است.
- نتایج. تعداد ریسک (Number at risk)
در بخش Results و نتایج نرمافزار تب دیده میشود. این تب تعداد افراد در معرض خطر (منظور همان ریسک) در زمانهای مختلف را نشان میدهد. در تصویر زیر میتوانید بخشی از خروجی این تب را به ازای هر گروه مشاهده کنید.
ایده جدول اعداد در معرض خطر یا همان جدول تعداد ریسک این است که برای محاسبه احتمال بقا با استفاده از روش Kaplan-Meier باید بدانیم که در هر تایم، چند نفر هنوز رویداد مورد علاقه را تجربه نکردهاند. بنابراین، تعداد ریسک در هر زمان خاص برابر با تعداد کل افراد باقیمانده در مطالعه تا قبل از آن زمان خواهد بود. این افراد شامل مشاهداتی هستند که امکان دارد در زمانهای بعدی رویداد مورد علاقه را تجربه کنند و یا تا آن زمان سانسور شوند
به عنوان مثال به جدول نتایج تعداد ریسک بالا نگاه کنید. در زمان صفر در گروه کنترل و درمان A و B، همه افراد زنده هستند و هیچکدام مرگ را تجربه نکردهاند. تا قبل از روز 34 نیز هیچ مرگی رخ نداده است و بنابراین برای روز 34 نیز تعداد ریسک برابر با همان 10 است. با این حال در روز 34، یک مشاهده دچار مرگ میشود. تاثیر این رویداد خود را در روز 45 نشان میدهد و برای این روز تعداد ریسک برابر با 9 میشود. به این نکته توجه کنید که تعداد ریسک در هر زمان، تعداد افراد باقیمانده در مطالعه تا قبل از خود آن زمان را نشان میدهد. از آنجا که در روز 45 نیز یک مرگ در گروه کنترل رخ داده است، بنابراین برای روز 78، تعداد ریسک برابر با 8 خواهد شد.
تا قبل از روز 88 نیز هیچ تجربه مرگی در گروه درمان A رخ نداده است. به همین دلیل تعداد ریسک در این روز برای درمان A برابر با 10 است. با این حال در خود روز 88 در این گروه یک مشاهده مرگ ثبت شده است. اثر این رخداد خود را در روز 111 نشان میدهد که تعداد ریسک برای این روز برابر با 9 شده است. یعنی در گروه درمان A تا روز 111، 9 نفر در معرض خطر قرار دارند. نکته جالب این است که در خود روز 111 مرگ رخ نداده بلکه یک مشاهده سانسور شده، مشاهده میشود. اثر این اتفاق نیز یعنی خروج یک مشاهده دیگر از مطالعه، اثر خود را در روز 156 نشان میدهد که تعداد ریسک در این روز برابر با 8 میشود.
به این نکته نیز توجه کنید که روزها و اعدادی که در ستون X نوشته میشود، آن روزهایی است که در ان یک رخداد اعم از مرگ و یا سانسور رخ داده است. این مطلب پاسخ به این سوال است که در شیت تعداد ریسک مثلاً چرا روز 111 آمده اما روز 110 نیامده است. پاسخ این است که در روز 111 برای یک گروه یک رویداد ثبت شده است اما در روز 110 برای هیچ کدام از گروهها، رویدادی (مرگ یا سانسور) ثبت نشده است.
توجه داشته باشید که Prism این جدول را به صورت اتوماتیک به نمودار تبدیل نمیکند. اگر میخواهید نموداری از تعداد افراد در معرض خطر در طول زمان ایجاد کنید، مراحل زیر را انجام دهید.
در برگه دادهها و نتایج Number at risk دکمه Create new graph را بزنید. این دکمه در بالای صفحه و در منوی Sheet قرار دارد.
در پنجره باز شده، جدول Number at risk را از منوی کشویی بخش Data sets to plot انتخاب کنید. همچنین “XY” را از منوی بخش Kind of graph قرار دهید. تصویر زیر را ببینید.
نوع نمودار دلخواه خود را انتخاب کنید (فقط Points یا Points & Connecting line) و روی OK کلیک کنید.
به بخش Graphs بروید. در آنجا گراف تعداد ریسک که در واقع از نتایج جدول Number at risk به دست آمده است، دیده میشود. گراف را به دلخواه خود میتوانید ویرایش کنید. خوب است عنوان محور Y را از پیش فرض آن به Number of subjects at risk اصلاح کنید. در تصویر زیر گراف آمده است.
- نتایج. مقایسه منحنی (Curve comparison)
در برگه نتایج شیت دیگری با نام Curve comparison دیده میشود. در ادامه دربارهی نتایج این شیت که در آنالیز بقا کاپلان مایر بسیار مهم هستند، صحبت میکنیم. در ابتدا تصویر آن را ببینید.
پس از وارد کردن اعداد در جدول دادههای Survival، تحلیل بقا به صورت خودکار انجام میشود. هنگامی که دادههای بیش از یک گروه وارد میشود، Prism شامل آزمونهایی است که هر گروه را با گروه دیگر مقایسه میکند. این آزمونها همان گزینههایی بود که ما در پنجره تنظیمات آنالیز بقا کاپلان مایر با نام Parameters Simple Survival Analysis (Kaplan-Meier) انتخاب کردیم.
در برگه مقایسه منحنیهای آنالیز بقا، مقدار احتمال P value برای هر یک از تستهایی که پریسم انجام میدهد، گزارش شده است. خوب است دربارهی این P value و فرضیهای که آزمون میکند، در ادامه صحبت کنیم.
فرض صفر برای هر یک از آزمونهایی که پریسم انجام میدهد این است که منحنیهای بقا با یکدیگر مشابه هستند. به عبارت دیگر، اگر یک گروه «درمان» و گروه دیگر «کنترل» باشد. فرض صفر این خواهد بود که درمان بر بقا تاثیری نداشته است. به دلیل اینکه منحنی بقا درمان و کنترل مشابه با یکدیگر است.
اگر مقدار P به اندازه کافی کوچک باشد (کوچکتر از یک آستانه از پیش تعیین شده که معمولاً 0.05 در نظر گرفته میشود)، آنگاه میگوییم که فرضیه صفر رد میشود. به این معنا که منحنی بقا درمان و کنترل با یکدیگر متفاوت است و در نتیجه درمان بر بقا اثرگزار معنادار است. توجه داشته باشید که مقدار P مبتنی بر مقایسه کل منحنیهای بقا محاسبه میشود، نه بر مقایسه فقط میانگین بقا برای هر گروه. یعنی کاری که آزمونهای آنالیز واریانس یا T Test انجام میدهند. این مطلب یکی از دلایل تمایز آنالیز بقا با سایر تحلیلهای آماری متداول میباشد.
آنچه بر مبنای آزمونهای Log-rank (Mantel-Cox)، Logrank test for trend و Gehan-Breslow-Wilcoxon در جدول نتایج Curve comparison انجام شده است، نشان میدهد که همه P value های مثال ما از عدد 0.05 بزرگتر هستند. بنابراین شواهد کافی برای رد فرض صفر و گزارش وجود اختلاف معنادار بین منحنیهای بقا (تاثیر معنادار دارو بر زمان بقا)، مشاهده نمیشود. بنابراین در این مثال به این نتیجه میرسیم که دارو بر مدت زمان بقا، تاثیر معنادار ندارد.
- نتایج. نسبت خطر (Hazard Ratio)
هنگامی که با نرمافزار Prism آنالیز بقا کاپلان مایر را انجام میدهیم و به مقایسه منحنی بقا بین دو گروه (مثلاً درمان و کنترل) میپردازیم، در شیت Curve comparison نتایجی با عنوان Hazard Ratio به دست میآید. در تصویر زیر آنها را ببینید.
در زمینه نسبت خطر یا همان Hazard Ratio علاقمند بودید لینک (نسبت خطر Hazard Ratio در آنالیز بقا چیست؟) را ببینید.
همانگونه که در جدول بالا میبینید نسبت خطر همراه با فواصل اطمینان 95% با استفاده از روشهای Logrank و Mantel-Haenszel به دست آمده است. به عنوان مثال نتیجه به دست آمده نشان میدهد نرخ رویداد (مرگ) در گروه B حدود 2.6 برابر نرخ رویداد در گروه A است $ \displaystyle \left( {H{{R}_{{B/A}}}=2.631} \right)$.
نسبت خطر 2.6 به این معنی است که آزمودنی گروه B که هنوز مرگ را در یک نقطه زمانی تجربه نکرده، در مقایسه با آزمودنی گروه A، حدود 2.6 برابر احتمال دارد که آن مرگ را تا نقطه زمانی بعدی تجربه کند. این مطلب همان شیب منحنی بقا را نشان میکند و به عبارتی بیان میکند سرعت آزمودنیهای گروه B حدود 2.6 برابر آزمودنیها گروه A جهت تجربه رویداد مورد بررسی است.
- نسبت خطر به صورت A/B یعنی گروه A در مقایسه با گروه B و همچنین وارون آن، B/A یعنی گروه B در مقایسه با گروه A، براورد میشود.
- نزدیک بودن اعداد براورد شده برای نسبت بخت به یکدیگر بر مبنای روشهای Logrank و Mantel-Haenszel، نشاندهنده برقرار بودن پیشفرض خطرات متناسب proportional hazards در دادههای مورد بررسی است.
- فواصل اطمینان براورد شده، همگی عدد 1.0 را دربردارند. این یافته به ظاهر ساده نشان میدهد که اختلاف معناداری بین احتمال بقا در گروههای A و B وجود ندارد. به عبارت دیگر زمان بقا در این گروهها با هم تفاوت معنادار آماری ندارند. این نتیجه را میتوان با استفاده از P value آزمونهای کاپلان مایر نیز مشاهده کرد.
- نتایج. میانه بقا (Median Survival)
از دیگر نتایجی که نرمافزار Prism به هنگام انجام آنالیز بقا ارایه میدهد، میانه زمان بقا است. در این زمینه علاقمند بودید لینک (میانه بقا Median Survival چیست؟) را ببینید. در جدول زیر که در تب Curve Comparison قرار دارد، میانه بقا به دست آمده است.
همانگونه که در جدول بالا دیده میشود، میانه بقا برای گروه Treated برابر با روز 75 به دست آمده است، اما برای گروه کنترل تعریف نشده است. پاسخ به این سوال که چرا برای گروه کنترل عبارت Undefined نوشته شده است را میتوانید در همان لینک (میانه بقا Median Survival چیست؟) بخوانید.
خب، این بار حالتی را فرض کنید که میانه بقا برای هر کدام از گروهها به دست میآید و Undefined نیست. به عنوان مثال در فایل دیتا همین مقاله به مقایسه بین گروههای A و B میپردازیم. نتیجه به دست آمده در جدول میانه بقا به صورت زیر خواهد بود.
در اینجا میانه بقا برای درمان A و B به ترتیب برابر با 211 و 333 امین روز به دست آمده است. آنچه که میخواهم در اینجا اشاره کنم مفهوم نسبت میانه بقا Ratio of median survival times است. عدد این نسب برابر با 0.6336 به دست آمده است. محاسبه آن بسیار ساده است و از تقسیم اعداد میانه بقا هر کدام از گروهها بر گروه دیگر به دست میآید.
علاوه بر محاسبه نسبت میانه بقا، فواصل اطمینان 95% برای نسبت میانه بقا نیز به دست آمده است (1.826, 0.2199).
خوب است این نکته را بدانیم که محاسبه فواصل اطمینان نسبت میانه بقا، بر مبنای این فرض است که هر دو منحنی بقا از یک مدل نمایی Exponential کاهشی پیروی میکنند. این بدان معنی است که شانس تجربه رویداد مورد علاقه در یک بازه زمانی کوچک در اوایل مطالعه و در اواخر مطالعه یکسان است. اگر دادههای بقای شما از الگوی بسیار متفاوتی پیروی کند، آنگاه مقادیری که Prism برای 95% فاصله اطمینان (CI) نسبت میانه بقا گزارش میکند مفید نخواهد بود.
سوال شاید اینجا یک سوال پیش بیاید که چرا نرمافزار Prism برای خود میانه بقا فاصله اطمینان به دست نمیآورد و بلکه برای نسبت میانه بقا، CI محاسبه میکند؟
پاسخ این است که روشهای متعددی برای محاسبه فواصل اطمینان میانه بقا منتشر شده است، در حالی که به نظر می رسد هیچ کدام استاندارد نیستند و نتایج مطابقت ندارند. برای مطالعه بییشتر میتوانید کارهای زیر را ببینید.
-
- Method is in Collett starting at page 35.
- Brookmeer and Crowley, A confidence interval for the median survival time. Biometrics (1982) vol. 38 (1) pp. 29-41.
- Barker reviews several methods and points out how different their results can be. The Mean, Median, and Confidence Intervals of the Kaplan-Meier Survival Estimate—Computations and Applications. The American Statistician (2009) vol. 63 (1) pp. 78-80.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2023). Kaplan-Meier in survival analysis with Prism software. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/kaplan-meier/.php
For example, if you viewed this guide on 12th January 2023, you would use the following reference
GraphPad Statistics (2023). Kaplan-Meier in survival analysis with Prism software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/kaplan-meier/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.