دادههای سانسور شده Censored Data در آنالیز بقا
Censored Data
من در این نوشته به بیان مفاهیم و تعاریف اساسی در آنالیز بقا پرداختم. در آنجا از عبارتی با عنوان داده های سانسور شده Censored Data نام بردم. در این مقاله سعی میکنم در این زمینه بیشتر توضیح دهم. با این حال ابتدا به شما توصیه میکنم حتماً مقاله مفاهیم آنالیز بقا در لینک بالا را مشاهده کنید.
اصطلاح “سانسور شده” Censored Data به نظر میرسد به این معنی است که ما کار نامناسبی انجام دادهایم. اما واقعاً اینطور نیست. تحلیل بقا شامل اندازهگیری مدت زمان سپری شده جهت رسیدن به یک رویداد تعریف شده برای هر مشاهده است.
با این حال اغلب، مشاهداتی در آنالیز بقا وجود دارند که مدت زمان سپری شده برای آنها ناشناخته است. گفته میشود که این مشاهدات سانسور شدهاند. در ادامه دلایلی که ممکن است رخ دهد تا دادهها اصطلاحاً سانسور شوند، به همراه مثال توضیح داده شده است. این کار کمک میکند تا درک آنها آسانتر شود.
با یک مثال شروع کنیم
یک کارآزمایی بالینی را در نظر بگیرید که قرار است 6 ماه طول بکشد و 20 شرکت کننده را شامل شود. معیارهای ثبت نام برای این کارآزمایی به گونهای است که تنها 8 نفر از 20 شرکت کننده در زمان شروع کارآزمایی شناسایی شدند. 12 شرکتکننده دیگر در طول شش ماه آینده وارد مطالعه میشوند. سپس هر شرکتکننده تا زمانی که یکی از سه حالت زیر اتفاق بیفتد، مورد پیگیری و بررسی قرار گرفت.
- شرکت کننده رویداد مورد نظر را تجربه کرد (در این مورد، یعنی شرکت کننده فوت کرد).
- شرکت کننده از مطالعه خارج شد.
- مطالعه پس از 6 ماه به پایان رسید، با این حال شرکت کننده در این زمان فوت نکرد.
ما به حالت شماره 1، رخ دادن پیشامد Event و به حالتهای شماره 2 و 3 دادههای سانسور شده Censored Data میگوییم. به منظور درک بهتر، گراف زیر را ببینید.
نمودار زیر یک جدول زمانی را برای هر یک از 8 شرکت کننده اصلی در مطالعه، به همراه نشانهای از مرگ (رویداد) یا سانسور را نشان میدهد.
در نمودار بالا “زمان” در محور X قرار گرفته است (مدت زمانی که از شروع آزمایش گذشته است). از آنجایی که هشت شرکت کننده اول در همان ابتدا وارد آزمایش شدند (زمان 0)، زمان سپری شده تا یک رویداد یا سانسور را می توان مستقیماً از نمودار بالا خواند.
همانطور که در نمودار بالا نشان داده شده است، شرکت کننده 01 به مدت چهار ماه تحت بررسی قرار گرفت و سپس درگذشت. به این نکته دقت کنید که در اینجا پیشامد Event مورد بررسی مرگ است. به طور مشابه، شرکت کنندگان 02 و 03 به ترتیب به مدت دو ماه و یک ماه پیگیری شدند و سپس هر کدام رویداد مرگ را تجربه کردند. شرکت کننده 07 به مدت 6 ماه پیگیری شد و درست قبل از پایان مطالعه درگذشت.
به همین ترتیب، شرکتکننده 04 برای تمام شش ماه مطالعه، مورد پیگیری قرار گرفت و رویداد مرگ را در آن دوره زمانی تجربه نکرد. یعنی تا پایان مطالعه زنده ماند. شرکت کننده 05 به مدت دو ماه پیگیری شد و در این مدت فوت نکرد. با این حال، پس از این دو ماه، شرکتکننده 05 مطالعه را ترک کرد و دیگر از او اطلاعی در دسترس نبود. شرکتکننده 08 نیز مطالعه را تنها پس از یک ماه ترک کرد. ما به این افراد Censor میگوییم.
به تفاوت بین شرکتکنندگان 04 و 07 توجه کنید. اگرچه هر دو به مدت شش ماه در مطالعه شرکت کردند، اما میدانیم که شرکتکننده 07 درگذشت در حالی که شرکتکننده 04 تا پایان مطالعه زنده ماند.
برای شرکتکنندگان 04، 05 و 08، (افراد سانسور شده) نمیدانیم چه اتفاقی بعد از پایان زمان مطالعه و یا خارج شدن آنها از مطالعه، افتاده است. از بین این هشت شرکت کننده اصلی، فقط میتوانیم بگوییم که پنج نفر رویداد مورد بررسی (مرگ) را تجربه کردند، در حالی که سه نفر دیگر سانسور شدند.
اکنون که ایدهای از آنچه روی میدهد داریم، میتوانیم به شرکت کنندگان دیگر در مطالعه نگاه کنیم تا تصویر کاملی از دادهها به دست آوریم.
دوازده شرکتکننده دیگر پس از شروع مطالعه انتخاب شدند (شرکتکنندگان 09-20). مانند گراف قبلی، در محور X زمان قرار دارد. اما میبینیم که “زمان شروع” برای شرکت کنندگان 09-20 دیگر در زمان = 0 نیست. از آنجایی که زمان شروع و زمان پایان برای هر شرکت کننده ممکن است متفاوت باشد، ما باید تفاوت بین این دو مقدار را پیدا کنیم تا از آن با عنوان زمان “مشاهده سپری شده” برای هر شرکت کننده، در تحلیل دادهها استفاده کنیم.
بر مبنای نمودار بالا، مشاهده میکنیم که هفت نفر از 12 شرکت کننده بعدی به ترتیب بعد از یک ماه، سه نفر بعد از دو ماه، یک نفر بعد از سه ماه و یک نفر دیگر بعد از چهار ماه، وارد مطالعه شدهاند. به همین دلیل، ما نمیتوانیم به سادگی رویداد یا زمان سانسور را به عنوان زمان سپری شده بخوانیم و در تحلیل قرار دهیم. زیرا این افراد در زمان صفر وارد مطالعه نشدهاند. در این افراد فاصله بین زمان ورود به مطالعه و زمان رویداد یا سانسور، به عنوان زمان سپری شده در آنالیز قرار میگیرد.
از دوازده شرکتکنندهای که پس از شروع مطالعه انتخاب شدند، یک نفر (شرکتکننده 18) مطالعه را ترک کرد و دو نفر رویداد مورد علاقه را قبل از پایان مطالعه تجربه نکردند، یعنی همچنان زنده ماندند. به هر سه این افراد، مشاهدات سانسور شده گفته میشود. 9 مشاهده دیگر از بین آن دوازده نفر، مرگ را تجربه کردند، البته هر یک در زمان خاص خود. به این ترتیب این 20 نفر به شش مشاهده سانسور شده و 14 مشاهده Event (در آنها مرگ اتفاق افتاده است) تقسیم میشوند.
این روش سانسور به عنوان “سانسور راست” right-censoring شناخته میشود زیرا زمان بقای شرکت کننده سانسور شده، در سمت راست خط زمانی مشخص نیست. به عبارت دیگر، رویداد احتمالاً پس از دوره مشاهده برای هر یک از این شرکت کنندگان رخ داده است. روشهای دیگری برای سانسور وجود دارد. سانسور چپ left-censoring و سانسور بازهای interval-censoring از رایجترین آنها است. با این حال سانسور راست چیزی است که تحلیل بقا نرمافزار Prism با آن کار میکند.
خوب است در همین جا بدانیم که نرمافزار Prism از روشهای تحلیل بقا به صورت زیر استفاده میکند.
Nonparametric survival analysis
آنالیز بقا ناپارامتری. در این روش امکان استفاده از کمیتهای پیشبینی کننده وجود ندارد. این آنالیز از روش کاپلان مایر Kaplan-Meier برای براورد تابع بقا (منحنی بقا) استفاده میکند. آنالیز بقا ناپارامتری، منحنیهای جداگانه هر کدام از گروههای مختلف (تعریف شده توسط یک Variable طبقهبندی شده) را با استفاده از آزمونهای (Mantel-Haenszel، Mantel-Cox) و/یا Gehan-Breslow-Wilcoxon مقایسه میکند.
Semiparametric survival analysis
آنالیز بقا نیمه پارامتری. در این روش امکان استفاده از کمیتهای پیشبینی کننده پیوسته یا طبقهبندی شده وجود دارد. این آنالیز از رگرسیون خطرات متناسب کاکس Cox proportional hazards regression به منظور براورد نسبتهای خطر hazard ratios و ضرایب پارامتر، منحنیهای بقا و همچنین براورد احتمال بقا Survival Probability برای هر مشاهده استفاده میکند.
نوع دیگری از آنالیز بقا با نام تحلیل بقا پارامتری Parametric survival analysis وجود دارد که به فرضیات اضافی در مورد توزیع زمان بقا در جمعیت نمونه نیاز دارد و در حال حاضر به عنوان یک تحلیل در نرمافزار Prism ارایه نمیشود.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2023). Censored data in survival analysis. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/censored-data/.php
For example, if you viewed this guide on 12th January 2023, you would use the following reference
GraphPad Statistics (2023). Censored data in survival analysis. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/censored-data/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.