قبلی
کاپلان مایر

تحلیل کاپلان مایر Kaplan-Meier آنالیز بقا با نرم‌افزار Prism

در ابتدا لازم است به این نکته اشاره کنیم که نرم‌افزار Prism از روش‌های تحلیل بقا Survival Analysis به صورت زیر استفاده می‌کند.

 Nonparametric survival analysis 

آنالیز بقا ناپارامتری. در این روش امکان استفاده از کمیت‌های پیش‌بینی کننده وجود ندارد. این آنالیز از روش کاپلان مایر Kaplan-Meier برای براورد تابع بقا (منحنی بقا) استفاده می‌کند. آنالیز بقا ناپارامتری، منحنی‌های جداگانه هر کدام از گروه‌های مختلف (تعریف شده توسط یک Variable طبقه‌بندی شده) را با استفاده از آزمون‌های (Mantel-Haenszel، Mantel-Cox) و/یا Gehan-Breslow-Wilcoxon مقایسه می‌کند.

 

گراف پد

دریافت مجموعه کامل آموزش آنالیز بقا

شامل 300 دقیقه ویدئو، فایل دیتا و نتایج Prism

 Semiparametric survival analysis 

آنالیز بقا نیمه پارامتری. در این روش امکان استفاده از کمیت‌های پیش‌بینی کننده پیوسته یا طبقه‌بندی شده وجود دارد. این آنالیز از رگرسیون خطرات متناسب کاکس Cox proportional hazards regression جهت براورد نسبت‌های خطر hazard ratios و ضرایب پارامتر، منحنی‌های بقا و براورد احتمال بقا Survival Probability برای هر مشاهده استفاده می‌کند.

نوع دیگری از آنالیز بقا با نام تحلیل بقا پارامتری Parametric survival analysis وجود دارد که به فرضیات اضافی در مورد توزیع زمان بقا در جمعیت نمونه نیاز دارد و در حال حاضر به عنوان یک تحلیل در نرم‌افزار Prism ارایه نمی‌شود.

به عنوان مقدمه خوب است بدانیم که روش براورد بقای کاپلان مایر توسط دو دانشمند به نام‌های ادوارد کاپلان Edward Kaplan و پل مایر Paul Meier نامگزاری شده است آن‌ها به طور مستقل ریاضیات و معادلات مربوط به این تکنیک را ارایه کردند (علاقمند بودید لینک the mathematics of Kaplan-Meier survival analysis را ببینید.)

آن‌ها به صورت جداگانه این روش را به مجله انجمن آماری آمریکا ارسال کردند، و سپس توسط سردبیر مجله جان توکی John Tukey متقاعد شدند که کار خود را ترکیب کنند و به این ترتیب اکنون آنالیز کاپلان مایر به طور گسترده در مطالعات مربوط به آنالیز بقا استفاده می‌شود.

 

چگونه آنالیز بقا کاپلان مایر انجام دهیم؟

من در این مقاله به توضیح روش کاپلان مایر Kaplan-Meier با استفاده از نرم‌افزار Prism می‌پردازم و مراحل انجام کار را گام به گام بیان می‌کنم. ورود داده‌ها به نرم‌افزار، انتخاب آزمون، رسم گراف و به دست آوردن نتایج، اصلی‌ترین کارهای ما در انجام همه‌ی انواع تحلیل‌های آماری با استفاده از نرم‌افزار Prism می‌باشد. در این‌جا نیز که قصد داریم به بیان روش کاپلان مایر در تحلیل داده‌های بقا بپردازیم، همین مراحل را انجام می‌دهیم.

  •  طراحی جدول دیتا بقا (Create a survival data table) 

از کادر گفتگوی Welcome یا New Table، تب Survival را انتخاب کنید. در تصویر زیر آن را ببینید.

انتخاب تحلیل بقا در نرم‌افزار Prism

 

همان‌گونه که می‌دانیم در همه‌ی تحلیل‌های نرم‌افزار Prism، در بخش Data table می‌توانیم دیتا و داده‌های خودمان را وارد نرم‌افزار کنیم (Enter or import data into a new table) و یا از داده‌‌های آموزشی و مثال‌های نرم‌افزار (Start with sample data to follow a tutorial) استفاده کنیم.

انتخاب گزینه (Enter or import data into a new table) سبب می‌شود در کادر پایین Options دو حالت برای ما باز شود.

  • Enter elapsed time as number of days (or months…)

در این حالت زمان سپری شده به عنوان یک عدد و اندازه مثبت، تحت عنوان روز، ساعت و یا هر واحد زمانی مناسب دیگر، وارد نرم‌افزار می‌شود. توجه داشته باشید که این‌ها زمان‌های سپری شده هستند و بنابراین نیازی به تعیین زمان صفر نیست.

  • Enter a starting and ending date

در این حالت تاریخ شروع و پایان را وارد کنید. برای این گزینه، باید یک تاریخ تقویمی برای زمان شروع (صفر) و زمان پایان هر مشاهده وارد شود. Prism تفاوت بین این دو تاریخ را به عنوان زمان مشاهده سپری شده، محاسبه می‌کند.

اگر هنوز برای وارد کردن داده‌های خود آماده نیستید و نیاز به راهنما دارید، گزینه «Start with sample data to follow a tutorial» را انتخاب کنید و یکی از مجموعه داده‌های آموزشی یعنی مقایسه دو یا سه گروه را انتخاب کنید.

  •  وارد کردن داده‌ها (Enter the survival times) 

اکنون وقت آن است که داده‌های خود را وارد نرم‌افزار کنیم. به نظرم بهتر است ابتدا تصویر زیر را که یک نمونه از نحوه وارد کردن داده‌ها در تحلیل Survival است، ببینید.

یک نمونه از داده‌های وارد شده در تحلیل Survival

 

جهت وارد کردن داده‌ها به نرم‌افزار Prism نیاز به رعایت کردن برخی از دستورالعمل‌های مهم است. آن‌ها را به ترتیب در ادامه نوشته‌ام.

 زمان سپری شده تا رسیدن به رویداد مورد بررسی یا سانسور را به ازای هر فرد، در یک ردیف جداگانه وارد کنید.

 زمان تا سانسور یا رویداد مورد بررسی را در ستون X وارد کنید. توجه داشته باشید که اگر با داده‌های خود شروع کنید، Prism دو گزینه برای وارد کردن زمان‌های سپری شده ارایه می‌دهد. درباره‌ی آنها کمی بالاتر توضیح دادیم.

 به صورت دلخواه، می‌توان از عناوین ردیف برای شناسایی هر موضوع/شرکت‌کننده استفاده کرد. این کار در ستون با عناوین Title قابل انجام است. به این نکته توجه کنید که این اسامی دلخواه هستند و در تحلیل نتایج و داده‌ها، نقشی ندارند.

 برای ردیف‌هایی که در آن موضوع/شرکت‌کننده، رویداد مورد بررسی را تجربه کرده است، عدد “1” را در ستون Y وارد کنید. عدد “0” را در ردیف‌هایی که فرد، رویداد را تجربه نکرده است و اصطلاحاً در مدت زمان مطالعه سانسور شده است وارد کنید. توجه داشته باشید که هر سطر باید دارای 0 یا 1 در ستون Y باشد. سطر بدون 1 یا 0 در ستون Y از تحلیل حذف می‌شود.

 افراد متعلق به گروه‌های درمانی مختلف را در ستون‌های Y مختلف (یک ستون Y برای هر گروه) وارد کنید. هر سطر باید فقط یک مقدار در یک ستون Y داشته باشد. به عنوان مثال، در تصویر بالا، 10 ردیف اول مربوط به افراد گروه کنترل است، در حالی که 10 ردیف بعدی مربوط به گروه درمان است،

با این حال، توجه داشته باشید که هیچ دلیلی وجود ندارد که گروه‌ها به این ترتیب از هم جدا شوند. یعنی ابتدا داده‌‌ها و سطرهای مربوط به گروه الف نوشته شود و سپس سطرهای مربوط به گروه ب. در واقع تا زمانی که زمان سپری شده صحیح با نتیجه صحیح (1 یا 0) در گروه صحیح (ستون) در همان ردیف همراه باشد، نتایج تحلیل یکسان خواهد بود. به عنوان مثال، داده‌های بالا را نیز می‌توان به صورت زیر وارد کرد.

 

انتخاب آزمون در آنالیز بقا

 Analysis choices for survival analysis 

حال نوبت آن رسیده است که به تحلیل در نرم‌افزار بپردازیم. قبل از آن به انتخاب آزمون مناسب و بررسی تنظیمات نرم‌افزار اشاره می‌کنیم. فایل دیتا این مثال و نتایج آن را می‌توانید از اینجا کاپلان مایر Kaplan-Meier دریافت کنید.

یکی از خوبی‌های کار با نرم‌افزار Prism (به ویژه در آنالیز بقا) این است که این نرم‌افزار، داده‌های بقا را به صورت خودکار و بدون نیاز به تنظیمات دستی، تحلیل می‌کند. در واقع Survival Analysis در بین همه‌ی تحلیل‌هایی که Prism ارایه می‌دهد منحصر به فرد است.

هنگامی که داده‌ها به درستی در Survival Data Table (یعنی همان مسیری که در بخش قبل از آن نام بردیم و توضیح دادیم) وارد می‌شوند، نرم‌افزار به طور اتوماتیک تحلیل داده‌ها را انجام می‌دهد و منحنی‌های بقای Kaplan-Meier را ایجاد می‌کند. یعنی حتی شما نیازی به استفاده از دکمه نوار ابزار آنالیز   ندارید. Prism از گزینه‌های پیش فرض برای تحلیل استفاده می‌کند و نتایج و گراف‌ها را به دست می‌آورد.

با این حال از آنجا که ما می‌خواهیم بیاموزیم و کار با نرم‌افزار Prism جهت انجام تحلیل بقا کاپلان مایر را یاد بگیریم، لازم است وارد پنجره تنظیمات آزمون شویم. این پنجره را می‌توان از منوی   و مسیر زیر مشاهده کرد.

پنجره Analyze Data و انتخاب آزمون بقا کاپلان مایر

 

هنگامی که OK می‌کنیم، پنجره تنظیمات آنالیز بقا کاپلان مایر با نام Parameters Simple Survival Analysis (Kaplan-Meier) باز می‌شود. در تصویر زیر آن را ببینید.

پنجره Parameters Simple Survival Analysis (Kaplan-Meier)

 

در ادامه درباره‌ی بخش‌های مختلف پنجره تنظیمات آنالیز بقا کاپلان مایر، صحبت خواهیم کرد.

Input

در این بخش مقادیر عددی ستون Y که در آن رویداد یا عدم رویداد برای هر سطر مشخص می‌شد، تعیین می‌شود. انتخاب پیش فرض استفاده از کد “1” برای نشان دادن اینکه رویداد مورد بررسی رخ داده و کد “0” برای نشان دادن سانسور شدن مشاهده، می‌باشد. این کدها تقریباً جهانی هستند. با این حال، برخی از موسسات از کدهای مخالف استفاده می‌کنند. در Prism این کدها را می‌توان به صورت دستی مشخص و تعریف کرد.

Curve comparisons

بر مبنای اینکه ما به مقایسه دو یا بیشتر از دو گروه با یکدیگر می‌پردازیم، یکی از بخش‌های Calculations to compare two groups یا Calculations to compare three or more groups فعال می‌شود. برای مقایسه منحنی‌های بقا، نرم‌افزار از روش‌های زیر استفاده می‌کند.

  • Logrank Test

دو روش برای محاسبه این تست وجود دارد. آن‌ها معادل هستند، اما می‌توانند در نحوه برخورد آنها با چندین رویداد که دقیقاً در یک زمان اتفاق می‌افتد کمی متفاوت باشند (این مفهوم در داده‌ها به عنوان “پیوندها” Ties شناخته می‌شود). Prism از روش Mantel-Haenszel استفاده می‌کند، اما از نام “logrank” استفاده می‌کند که معمولا برای هر دو رویکرد استفاده می‌شود. این روش به Mantel-Cox نیز معروف است.

  • Gehan-Breslow-Wilcoxon Test

این روش به رویدادهایی که در زمان‌های ابتدایی مطالعه رخ می‌دهند وزن بیشتری می‌دهد، که البته منطقی است (هرچه یک رویداد زودتر رخ دهد، احتمال اینکه مشاهده مهمی باشد بیشتر است زیرا انتظار می‌رود همه شرکت‌کنندگان در مطالعه در نهایت رویداد مورد علاقه را تجربه کنند). با این حال، زمانی که بخش بزرگی از شرکت کنندگان در مطالعه در مقاطع زمانی ابتدایی سانسور شوند، نتایج این آزمون می‌تواند گمراه کننده باشد. در مقابل، آزمون Logrank به مشاهدات در تمام نقاط زمانی وزن یکسانی می‌دهد.

آزمون Logrank استانداردتر است و اگر فرض خطرات متناسب Proportional Hazards درست باشد، آزمون قوی‌تری است. خطرات متناسب به این معنی است که نسبت توابع خطر (مرگ در هر زمان) در تمام نقاط زمانی یکسان است. یک مثال از خطرات متناسب می‌تواند این باشد که مشاهدات گروه کنترل با سرعت دو برابر گروه تحت درمان در تمام نقاط زمانی بمیرد. در این صورت بهتر است از آزمون Gehan-Breslow-Wilcoxon استفاده شود.

روش Gehan-Breslow-Wilcoxon به نسبت خطر ثابت نیاز ندارد، اما مستلزم آن است که یک گروه به طور مداوم ریسک بالاتری نسبت به گروه دیگر داشته باشد. اگر شک دارید که از کدام روش استفاده کنید، آزمون Logrank (که استانداردتر است) را گزارش دهید. تست Gehan-Breslow-Wilcoxon را تنها در صورتی انتخاب کنید که دلیل محکمی برای انجام آن داشته باشید.

  • logrank test for trend

این آزمون زمانی مناسب است که ترتیب گروه‌ها (تعریف شده توسط ستون‌ها در جدول داده‌ها) منطقی باشد. به عنوان مثال اگر گروه‌ها (ستون‌ها) گروه‌های سنی مختلف، شدت بیماری‌های مختلف یا دوزهای متفاوتی از یک دارو باشند، که هر کدام به ترتیب منطقی (صعودی یا نزولی) قرار گرفته‌اند، خوب است که از آزمون logrank test for trend استفاده شود.

نرم‌افزار Prism همچنین از دو روش به منظور محاسبه مقدار احتمال P value (جهت آزمون مقایسه سه یا چند گروه از منحنی‌های بقا) استفاده می‌کند. روش توصیه شده نرم‌افزار مطابق با نرم‌افزارهای SPSS و SAS است. جزئیات این روش در کتابچه‌های راهنمای SPSS و NCSS توضیح داده شده است.

Style

نحوه محاسبه و ارائه نتایج (درصد یا کسری، مرگ یا بقا) نیز می‌تواند در پنجره تنظیمات انجام آنالیز بقا مشخص شود. اگر بخواهید فواصل اطمینان 95% را ترسیم کنید، Prism دو انتخاب ارایه می‌دهد. پیش فرض یک روش تبدیل است که فواصل اطمینان نامتقارن را ترسیم می‌کند. گزینه جایگزین انتخاب فواصل متقارن Greenwood intervals است. فواصل نامتقارن معتبرتر هستند و گزینه پیشنهادی هستند.

همچنین یک چک باکس به شما امکان می‌دهد تصمیم بگیرید که مشاهدات سانسور شده را ترسیم کنید یا خیر. به صورت پیش‌فرض این گزینه جهت نمایش داده‌های سانسور شده بر روی گراف، انتخاب شده است.

در پایان بخش Output دیده می‌شود. در این‌جا می‌توان انتخاب‌هایی جهت نمایش تعداد رقم‌های اعشار و فرمت P value به دست آمده در نتایج آنالیز، قرار داد.

 

طراحی گراف‌ها در آنالیز بقا

 Graphing survival data 

هنگامی که داده‌ها در جدول داده‌های بقا به درستی وارد می‌شوند، Prism به طور خودکار داده‌های بقا را تحلیل می‌کند و نموداری از منحنی‌های بقا ایجاد می‌کند. گزینه‌های گراف‌های بقا Kaplan-Meier تاحدی ساده هستند، با این حال بیایید توضیحاتی درباره‌ی تعیین نحوه سفارشی‌سازی این نمودارها بیان کنیم.

هنگامی که روی شیت Graphs کلیک می‌کنیم، با پنجره Change Graph Type روبه‌رو می‌شویم. در تصویر زیر آن را ببینید.

پنجره Change Graph Type در آنالیز بقا

 

در این پنجره می‌توانیم نحوه نمایش دلخواه منحنی بقا را انتخاب کنیم. چند گزینه نیز دیده می‌شود.

  • Show results as

بقا باید به صورت کسری Fractions (از 0 تا 1) یا به صورت درصد Percents (از 0٪ تا 100٪) ترسیم شود؟ پاسخ به این سوال ساده است و به سلیقه و دلخواه ما بستگی دارد.

  • Plot symbols at

نرم‌افزار برای همه مشاهدات دارای نشانگر symbols در نمودار باشد یا فقط برای مشاهدات سانسور شده؟ معمولاً فقط نشانگر برای مشاهدات سانسور شده قرار می‌گیرد.

  • Error bars

پیش فرض این است که برای منحنی های بقای کاپلان مایر، Error bar نمایش داده نشود. با این حال، می‌توانید انتخاب کنید که ارور بارها برای خطای استاندارد SE در هر نقطه زمانی نمایش داده شود، یا فاصله اطمینان 95 درصد به عنوان باندهای بالا و پایین برای هر منحنی نمایش داده شود.

به طور معمول، منحنی‌های بقا برای نشان دادن احتمال بقا در طول زمان ترسیم می‌شوند (شروع از زمان صفر). این منحنی‌ها از 100% (یا 1 در صورت نمایش بقا به صورت کسری) شروع می‌شوند و با گذشت زمان کاهش می‌یابند. از نظر ریاضی، منحنی‌های بقا نشان‌دهنده این احتمال است که رویداد مورد بررسی در زمان معین “t” رخ نداده است. بنابراین، در زمان صفر، زمانی که منحنی بقا در 100% است، نشان می‌دهد احتمال 100% وجود دارد که رویداد مورد بررسی هنوز رخ نداده است.

نمودارهای وقوع تجمعی Cumulative incidence graphs رابطه وارون را نشان می‌دهند و این احتمال را بیان می‌کنند که رویداد مورد بررسی در زمان معین “t” رخ داده است. این را می‌توان از نظر ریاضی به عنوان (1 – احتمال بقا) توصیف کرد. بنابراین، این نمودارها از 0 شروع می‌شوند و حداکثر به 1 (به صورت کسری) یا 100 (به عنوان درصد) افزایش می‌یابند. برای ایجاد یک نمودار وقوع تجمعی، یکی از انواع نمودار مربوطه را در گفتگوی Change Graph Type انتخاب کنید. در تصویر زیر آن‌ها را ببینید.

گراف‌های مختلف Cumulative incidence

 

نتایج آنالیز بقا کاپلان مایر

 Results of Kaplan-Meier survival analysis 

حال بیایید در ادامه درباره‌ی نتایج و خروجی‌های نرم‌افزار Prism پس از انجام آنالیز بقا کاپلان مایر صحبت کنیم. این نتایج در شیت Results نرم‌افزار قرار دارند.

یکی از نتایج اولیه تحلیل بقای کاپلان مایر، نسبت یا درصد بقا survival proportions در هر نقطه زمانی است. این مقادیر اغلب به صورت گرافیکی ارایه می‌شوند، اما گاهی اوقات مشاهده جدول این نتایج نیز مفید است. تب نتایج برای این مقادیر به طور پیش فرض نامرئی است. برای مشاهده آن، به سادگی روی منوی کشویی در سمت راست برگه های تحلیل کلیک کرده و آن را از لیست انتخاب کنید. تصویر زیر را ببینید.

انتخاب تب survival proportions جهت نمایش نتایج آن

 

نرم‌افزار، نسبت بقا survival proportions را با استفاده از روش Kaplan-Meier محاسبه می‌کند. برای هر مقدار X (زمان)، کسر (یا درصد) مشاهداتی گزارش می‌شود که هنوز رویداد مورد علاقه را تجربه نکرده‌اند. اگر یک نمودار وقوع تجمعی به جای نمودار بقا ایجاد شده باشد (درباره‌ی آنها بالاتر صحبت کردیم)، این مقادیر نشان‌دهنده کسر/درصد مشاهداتی خواهند بود که رویداد مورد علاقه را تجربه کرده‌اند.

در جدول نتایج زیر اندازه‌های عددی نسبت بقا به ازای هر زمان و در هر گروه مربوط به مثال ما آمده است. آن را ببینید.

نسبت بقا به ازای هر زمان و در هر گروه

 

به عنوان مثال سطری که رنگی شده است، نشان می‌دهد در زمان 211 (روز)، 48% از گروه کنترل هنوز رویداد مورد نظر (مرگ) را تجربه نکرده‌اند. به عبارت دیگر در زمان 211، 48% افراد گروه کنترل همچنان زنده هستند. در این زمان، 38.57% افراد گروه درمان A و 100% افراد گروه درمان B همچنان زنده هستند.

خوب است همین جا این نکته را بدانیم که نرم‌افزار Prism می‌تواند برای نسبت بقا، فواصل اطمینان 95 درصد را نیز محاسبه کند. جهت مشاهده این فواصل اطمینان می‌توان از همان پنجره تنظیمات نرم‌افزار با نام Parameters Simple Survival Analysis (Kaplan-Meier) که قبلاً درباره‌ی آن توضیح دادیم، گزینه 95CI% را انتخاب کنیم.

یک راه حل دیگر استفاده از تنظیمات پنجره گراف با نام Change Graph Type و انتخاب گزینه 95CI% در بخش Error bars است. در این صورت منحنی بقا ما به صورت زیر خواهد بود. یعنی علاوه بر دارا بودن نسبت بقا یا احتمال بقا Probability of Survival دارای فواصل اطمینان 95% نیز می‌باشد.

منحنی بقا همراه با فواصل اطمینان 95% به ازای هر گروه

 

همان‌گونه که در گراف بالا مشاهده می‌کنید، فواصل اطمینان به صورت نقطه چین، نمایش داده شده است. با انجام این کار در شیت نسبت بقا survival proportions نتایج، جدول داده‌ها شامل فواصل اطمینان نیز خواهد بود. در تصویر زیر آن را ببینید.

نسبت بقا همراه با فواصل اطمینان 95% به ازای هر زمان و در هر گروه

 

به عنوان مثال سطرهایی که رنگی شده است، نشان می‌دهند در زمان 211 (روز)، 48% از گروه کنترل هنوز رویداد مورد نظر (مرگ) را تجربه نکرده‌اند. فاصله اطمینان بقا برای گروه کنترل و تا روز 211 به صورت (26.47 + 48 ,31.91 – 48) بیان می‌شود.

این نتیجه برای گروه A به صورت، 38.57% با بازه اطمینان بقا (29.93 + 38.57 ,29.49 – 38.57) نوشته می‌شود. به همین ترتیب برای گروه B برای روز 299 به صورت، 66.67% با بازه اطمینان بقا (23.78 + 66.67 ,47.20 – 66.67) گزارش می‌شود.

  •  سوال. چه زمانی منحنی بقا به صفر می‌رسد؟ 

یک سوالی که معمولاً مطرح می‌شود و من علاقمند هستم در اینجا به آن پاسخ دهم، این است که منحنی بقا در چه مواردی به صفر می‌رسد؟ یعنی احتمال بقا برابر با صفر می‌شود؟ به عنوان مثال به همان گراف بالا نگاه کنید. برای این گراف، نمودار بقا در گروه‌های A و B در پایان به صفر رسیده است، اما برای گروه کنترل چنین اتفاقی رخ نداده است و گروه کنترل کار خود را با احتمال بقای بزرگتر از صفر (از شیت survival proportions در Results مشخص می‌شود با احتمال بقا 12%) به پایان برده است.

پاسخ این است که اگر منحنی بقا تا 0% کاهش یابد، به این معنی نیست که همه‌ی آزمودنی‌ها، رویداد مورد علاقه (مرگ) را تجربه کرده باشند. همان‌گونه که در همان مثال بالا می‌توانید ببینید که در گروه A از 10 فرد مطالعه، 8 مورد مرگ را تجربه کرده و 2 مورد دیگر سانسور شده است. در گروه B نیز از 7 فرد مطالعه، 6 مورد مرگ را تجربه کرده و 1 مورد دیگر سانسور شده است. با این حال همان گونه که در منحنی بقا آن‌ها مشاهده می‌کنید، احتمال بقا برای این گروه‌ها در نهایت صفر شده است.

به این نکته دقت کنید که برخی از افراد ممکن است در مقاطع زمانی قبلی سانسور شده باشند (به این دلیل که مطالعه را ترک کرده‌اند، یا به این دلیل که مطالعه قبل از اینکه رویداد مورد علاقه را تجربه کنند به پایان رسیده است). احتمال بقا زمانی به صفر می‌رسد که مشاهده در آخرین نقطه زمانی رویداد مورد علاقه را تجربه می‌کند و نه موردی که سانسور شده است.

برای فهم بهتر این مطلب به گروه A نگاه کنید. گفتیم که در این گروه از 10 فرد مطالعه، 8 مورد مرگ را تجربه کرده و 2 مورد دیگر سانسور شده‌اند. بنابراین شاید منطقی به نظر برسد که بگوییم احتمال بقا برابر با 20% است. اما چرا اینگونه نیست که منحنی بقا برای گروه A به صفر کاهش پیدا می‌کند؟

زیرا 2 مورد، بین 1 تا 156 روز سانسور شدند. ما نمی‌دانیم که اگر آن‌ها تا پایان در مطالعه می‌ماندند (یعنی تا روز 321) چه اتفاقی برای آن‌ها می‌افتاد. به دلیل این‌که نمی‌دانیم آن‌ها زنده می‌ماندند یا می‌مردند، داده‌های آن‌ها بعد از زمان سانسور حساب نمی‌شوند. در زمان 321، فقط یک مشاهده با نام فرضی AC همچنان پیگیری می‌شود و او نیز در این زمان مرگ را تجربه می‌کند و احتمال زنده ماندن را به صفر می‌رساند.

به همین ترتیب برای گروه B آخرین زمان مطالعه روز 365 است. مشاهده TO نیز در این روز به مرگ رسیده است. بنابراین برای هر دو گروه‌های A و B منحنی بقا در نهایت و در آخرین تایم خودشان به احتمال بقا صفر می‌رسند.

همین نتیجه را برای مشاهدات گروه کنترل ببینید. آخرین زمان مطالعه در این گروه روز 378 است که در آن مرگ رخ نداده بلکه داده سانسور شده (ستون Y با کد صفر) اتفاق افتاده است.

  •  نتایج. تعداد ریسک (Number at risk) 

در بخش Results و نتایج نرم‌افزار تب   دیده می‌شود. این تب تعداد افراد در معرض خطر (منظور همان ریسک) در زمان‌های مختلف را نشان می‌دهد. در تصویر زیر می‌توانید بخشی از خروجی این تب را به ازای هر گروه مشاهده کنید.

نتایج تب Number at risk

 

ایده جدول اعداد در معرض خطر یا همان جدول تعداد ریسک این است که برای محاسبه احتمال بقا با استفاده از روش Kaplan-Meier باید بدانیم که در هر تایم، چند نفر هنوز رویداد مورد علاقه را تجربه نکرده‌اند. بنابراین، تعداد ریسک در هر زمان خاص برابر با تعداد کل افراد باقیمانده در مطالعه تا قبل از آن زمان خواهد بود. این افراد شامل مشاهداتی هستند که امکان دارد در زمان‌های بعدی رویداد مورد علاقه را تجربه کنند و یا تا آن زمان سانسور شوند

به عنوان مثال به جدول نتایج تعداد ریسک بالا نگاه کنید. در زمان صفر در گروه کنترل و درمان A و B، همه افراد زنده هستند و هیچکدام مرگ را تجربه نکرده‌اند. تا قبل از روز 34 نیز هیچ مرگی رخ نداده است و بنابراین برای روز 34 نیز تعداد ریسک برابر با همان 10 است. با این حال در روز 34، یک مشاهده دچار مرگ می‌شود. تاثیر این رویداد خود را در روز 45 نشان می‌دهد و برای این روز تعداد ریسک برابر با 9 می‌شود. به این نکته توجه کنید که تعداد ریسک در هر زمان، تعداد افراد باقیمانده در مطالعه تا قبل از خود آن زمان را نشان می‌دهد. از آنجا که در روز 45 نیز یک مرگ در گروه کنترل رخ داده است، بنابراین برای روز 78، تعداد ریسک برابر با 8 خواهد شد.

تا قبل از روز 88 نیز هیچ تجربه مرگی در گروه درمان A رخ نداده است. به همین دلیل تعداد ریسک در این روز برای درمان A برابر با 10 است. با این حال در خود روز 88 در این گروه یک مشاهده مرگ ثبت شده است. اثر این رخداد خود را در روز 111 نشان می‌دهد که تعداد ریسک برای این روز برابر با 9 شده است. یعنی در گروه درمان A تا روز 111، 9 نفر در معرض خطر قرار دارند. نکته جالب این است که در خود روز 111 مرگ رخ نداده بلکه یک مشاهده سانسور شده، مشاهده می‌شود. اثر این اتفاق نیز یعنی خروج یک مشاهده دیگر از مطالعه، اثر خود را در روز 156 نشان می‌دهد که تعداد ریسک در این روز برابر با 8 می‌شود.

به این نکته نیز توجه کنید که روزها و اعدادی که در ستون X نوشته می‌شود، آن روزهایی است که در ان یک رخداد اعم از مرگ و یا سانسور رخ داده است. این مطلب پاسخ به این سوال است که در شیت تعداد ریسک مثلاً چرا روز 111 آمده اما روز 110 نیامده است. پاسخ این است که در روز 111 برای یک گروه یک رویداد ثبت شده است اما در روز 110 برای هیچ کدام از گروه‌ها، رویدادی (مرگ یا سانسور) ثبت نشده است.

توجه داشته باشید که Prism این جدول را به صورت اتوماتیک به نمودار تبدیل نمی‌کند. اگر می‌خواهید نموداری از تعداد افراد در معرض خطر در طول زمان ایجاد کنید، مراحل زیر را انجام دهید.

در برگه داده‌ها و نتایج Number at risk دکمه   Create new graph را بزنید. این دکمه در بالای صفحه و در منوی Sheet قرار دارد.

 در پنجره باز شده، جدول Number at risk را از منوی کشویی بخش Data sets to plot انتخاب کنید. همچنین “XY” را از منوی بخش Kind of graph قرار دهید. تصویر زیر را ببینید.

پنجره Create new graph

 

 نوع نمودار دلخواه خود را انتخاب کنید (فقط Points یا Points & Connecting line) و روی OK کلیک کنید.

 به بخش Graphs بروید. در آن‌جا گراف تعداد ریسک که در واقع از نتایج جدول Number at risk به دست آمده است، دیده می‌شود. گراف را به دلخواه خود می‌توانید ویرایش کنید. خوب است عنوان محور Y را از پیش فرض آن به Number of subjects at risk اصلاح کنید. در تصویر زیر گراف آمده است.

گراف Number of subjects at risk

 

  •  نتایج. مقایسه منحنی (Curve comparison) 

در برگه نتایج شیت دیگری با نام Curve comparison دیده می‌شود. در ادامه درباره‌ی نتایج این شیت که در آنالیز بقا کاپلان مایر بسیار مهم هستند، صحبت می‌کنیم. در ابتدا تصویر آن را ببینید.

نتایج تب Curve comparison

 

پس از وارد کردن اعداد در جدول داده‌های Survival، تحلیل بقا به صورت خودکار انجام می‌شود. هنگامی که داده‌های بیش از یک گروه وارد می‌شود، Prism شامل آزمون‌هایی است که هر گروه را با گروه دیگر مقایسه می‌کند. این آزمون‌ها همان گزینه‌هایی بود که ما در پنجره تنظیمات آنالیز بقا کاپلان مایر با نام Parameters Simple Survival Analysis (Kaplan-Meier) انتخاب کردیم.

در برگه مقایسه منحنی‌های آنالیز بقا، مقدار احتمال P value برای هر یک از تست‌هایی که پریسم انجام می‌دهد، گزارش شده است. خوب است درباره‌ی این P value و فرضیه‌ای که آزمون می‌کند، در ادامه صحبت کنیم.

فرض صفر برای هر یک از آزمون‌هایی که پریسم انجام می‌دهد این است که منحنی‌های بقا با یکدیگر مشابه هستند. به عبارت دیگر، اگر یک گروه «درمان» و گروه دیگر «کنترل» باشد. فرض صفر این خواهد بود که درمان بر بقا تاثیری نداشته است. به دلیل اینکه منحنی بقا درمان و کنترل مشابه با یکدیگر است.

اگر مقدار P به اندازه کافی کوچک باشد (کوچکتر از یک آستانه از پیش تعیین شده که معمولاً 0.05 در نظر گرفته می‌شود)، آنگاه می‌گوییم که فرضیه صفر رد می‌شود. به این معنا که منحنی بقا درمان و کنترل با یکدیگر متفاوت است و در نتیجه درمان بر بقا اثرگزار معنادار است. توجه داشته باشید که مقدار P مبتنی بر مقایسه کل منحنی‌های بقا محاسبه می‌شود، نه بر مقایسه فقط میانگین بقا برای هر گروه. یعنی کاری که آزمون‌های آنالیز واریانس یا T Test انجام می‌دهند. این مطلب یکی از دلایل تمایز آنالیز بقا با سایر تحلیل‌های آماری متداول می‌باشد.

آنچه بر مبنای آزمون‌های Log-rank (Mantel-Cox)، Logrank test for trend و Gehan-Breslow-Wilcoxon در جدول نتایج Curve comparison انجام شده است، نشان می‌دهد که همه P value های مثال ما از عدد 0.05 بزرگتر هستند. بنابراین شواهد کافی برای رد فرض صفر و گزارش وجود اختلاف معنادار بین منحنی‌های بقا (تاثیر معنادار دارو بر زمان بقا)، مشاهده نمی‌شود. بنابراین در این مثال به این نتیجه می‌رسیم که دارو بر مدت زمان بقا، تاثیر معنادار ندارد.

  •  نتایج. نسبت خطر (Hazard Ratio) 

هنگامی که با نرم‌افزار Prism آنالیز بقا کاپلان مایر را انجام می‌دهیم و به مقایسه منحنی بقا بین دو گروه (مثلاً درمان و کنترل) می‌پردازیم، در شیت Curve comparison نتایجی با عنوان Hazard Ratio به دست می‌آید. در تصویر زیر آن‌ها را ببینید.

نتایج Hazard Ratio

 

در زمینه نسبت خطر یا همان Hazard Ratio علاقمند بودید لینک (نسبت خطر Hazard Ratio در آنالیز بقا چیست؟) را ببینید.

همان‌گونه که در جدول بالا می‌بینید نسبت خطر همراه با فواصل اطمینان 95% با استفاده از روش‌های Logrank و Mantel-Haenszel به دست آمده است. به عنوان مثال نتیجه به دست آمده نشان می‌دهد نرخ رویداد (مرگ) در گروه B حدود 2.6 برابر نرخ رویداد در گروه A است $ \displaystyle \left( {H{{R}_{{B/A}}}=2.631} \right)$.

نسبت خطر 2.6 به این معنی است که آزمودنی گروه B که هنوز مرگ را در یک نقطه زمانی تجربه نکرده، در مقایسه با آزمودنی گروه A، حدود 2.6 برابر احتمال دارد که آن مرگ را تا نقطه زمانی بعدی تجربه کند. این مطلب همان شیب منحنی بقا را نشان می‌کند و به عبارتی بیان می‌کند سرعت آزمودنی‌های گروه B حدود 2.6 برابر آزمودنی‌ها گروه A جهت تجربه رویداد مورد بررسی است.

  1. نسبت خطر به صورت A/B یعنی گروه A در مقایسه با گروه B و همچنین وارون آن، B/A یعنی گروه B در مقایسه با گروه A، براورد می‌شود.
  2. نزدیک بودن اعداد براورد شده برای نسبت بخت به یکدیگر بر مبنای روش‌های Logrank و Mantel-Haenszel، نشان‌دهنده برقرار بودن پیش‌فرض خطرات متناسب proportional hazards در داده‌های مورد بررسی است.
  3. فواصل اطمینان براورد شده، همگی عدد 1.0 را دربردارند. این یافته به ظاهر ساده نشان می‌دهد که اختلاف معناداری بین احتمال بقا در گروه‌های A و B وجود ندارد. به عبارت دیگر زمان بقا در این گروه‌ها با هم تفاوت معنادار آماری ندارند. این نتیجه را می‌توان با استفاده از P value آزمون‌های کاپلان مایر نیز مشاهده کرد.

  •  نتایج. میانه بقا (Median Survival) 

از دیگر نتایجی که نرم‌افزار Prism به هنگام انجام آنالیز بقا ارایه می‌دهد، میانه زمان بقا است. در این زمینه علاقمند بودید لینک (میانه بقا Median Survival چیست؟) را ببینید. در جدول زیر که در تب Curve Comparison قرار دارد، میانه بقا به دست آمده است.

میانه بقا در نتایج نرم‌افزار

 

همان‌گونه که در جدول بالا دیده می‌شود، میانه بقا برای گروه Treated برابر با روز 75 به دست آمده است، اما برای گروه کنترل تعریف نشده است. پاسخ به این سوال که چرا برای گروه کنترل عبارت Undefined نوشته شده است را می‌توانید در همان لینک (میانه بقا Median Survival چیست؟) بخوانید.

خب، این بار حالتی را فرض کنید که میانه بقا برای هر کدام از گروه‌ها به دست می‌آید و Undefined نیست. به عنوان مثال در فایل دیتا همین مقاله به مقایسه بین گروه‌های A و B می‌پردازیم. نتیجه به دست آمده در جدول میانه بقا به صورت زیر خواهد بود.

میانه بقا در گروه‌‌های A و B

 

در اینجا میانه بقا برای درمان A و B به ترتیب برابر با 211 و 333 امین روز به دست آمده است. آنچه که می‌خواهم در اینجا اشاره کنم مفهوم نسبت میانه بقا Ratio of median survival times است. عدد این نسب برابر با 0.6336 به دست آمده است. محاسبه آن بسیار ساده است و از تقسیم اعداد میانه بقا هر کدام از گروه‌ها بر گروه دیگر به دست می‌آید.

علاوه بر محاسبه نسبت میانه بقا، فواصل اطمینان 95% برای نسبت میانه بقا نیز به دست آمده است (1.826, 0.2199).

 خوب است این نکته را بدانیم که محاسبه فواصل اطمینان نسبت میانه بقا، بر مبنای این فرض است که هر دو منحنی بقا از یک مدل نمایی Exponential کاهشی پیروی می‌کنند. این بدان معنی است که شانس تجربه رویداد مورد علاقه در یک بازه زمانی کوچک در اوایل مطالعه و در اواخر مطالعه یکسان است. اگر داده‌های بقای شما از الگوی بسیار متفاوتی پیروی کند، آنگاه مقادیری که Prism برای 95% فاصله اطمینان (CI) نسبت میانه بقا گزارش می‌کند مفید نخواهد بود.

سوال شاید اینجا یک سوال پیش بیاید که چرا نرم‌افزار Prism برای خود میانه بقا فاصله اطمینان به دست نمی‌آورد و بلکه برای نسبت میانه بقا، CI محاسبه می‌کند؟

پاسخ این است که روش‌های متعددی برای محاسبه فواصل اطمینان میانه بقا منتشر شده است، در حالی که به نظر می رسد هیچ کدام استاندارد نیستند و نتایج مطابقت ندارند. برای مطالعه بییشتر می‌توانید کارهای زیر را ببینید.

 

من در این مقاله به بیان تحلیل کاپلان مایر Kaplan-Meier آنالیز بقا با نرم‌افزار Prism پرداختم. استفاده از نرم‌افزار، ورود داده‌ها، رسم نمودار و گراف، به دست آوردن نتایج و خروجی‌های نرم‌افزار، همراه با بیان مثال در این مقاله توضیح داده شده است.

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2023). Kaplan-Meier in survival analysis with Prism software. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/kaplan-meier/.php

For example, if you viewed this guide on 12th January 2023, you would use the following reference

GraphPad Statistics (2023). Kaplan-Meier in survival analysis with Prism software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/kaplan-meier/.php

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

    گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹