قبلی
داده های سانسور شده

داده‌های سانسور شده Censored Data در آنالیز بقا

 Censored Data 

من در این نوشته به بیان مفاهیم و تعاریف اساسی در آنالیز بقا پرداختم. در آنجا از عبارتی با عنوان داده های سانسور شده Censored Data نام بردم. در این مقاله سعی می‌کنم در این زمینه بیشتر توضیح دهم. با این حال ابتدا به شما توصیه می‌کنم حتماً مقاله مفاهیم آنالیز بقا در لینک بالا را مشاهده کنید.

 

گراف پد

دریافت مجموعه کامل آموزش آنالیز بقا

شامل 300 دقیقه ویدئو، فایل دیتا و نتایج Prism

 

اصطلاح “سانسور شده” Censored Data به نظر می‌رسد به این معنی است که ما کار نامناسبی انجام داده‌ایم. اما واقعاً اینطور نیست. تحلیل بقا شامل اندازه‌گیری مدت زمان سپری شده جهت رسیدن به یک رویداد تعریف شده برای هر مشاهده است.

با این حال اغلب، مشاهداتی در آنالیز بقا وجود دارند که مدت زمان سپری شده برای آن‌ها ناشناخته است. گفته می‌شود که این مشاهدات سانسور شده‌اند. در ادامه دلایلی که ممکن است رخ دهد تا داده‌ها اصطلاحاً سانسور شوند، به همراه مثال توضیح داده شده است. این کار کمک می‌کند تا درک آن‌ها آسان‌تر شود.

 

 با یک مثال شروع کنیم 

یک کارآزمایی بالینی را در نظر بگیرید که قرار است 6 ماه طول بکشد و 20 شرکت کننده را شامل شود. معیارهای ثبت نام برای این کارآزمایی به گونه‌ای است که تنها 8 نفر از 20 شرکت کننده در زمان شروع کارآزمایی شناسایی شدند. 12 شرکت‌کننده دیگر در طول شش ماه آینده وارد مطالعه می‌شوند. سپس هر شرکت‌کننده تا زمانی که یکی از سه حالت زیر اتفاق بیفتد، مورد پیگیری و بررسی قرار گرفت.

  1. شرکت کننده رویداد مورد نظر را تجربه کرد (در این مورد، یعنی شرکت کننده فوت کرد).
  2. شرکت کننده از مطالعه خارج شد.
  3. مطالعه پس از 6 ماه به پایان رسید، با این حال شرکت کننده در این زمان فوت نکرد.

 

ما به حالت شماره 1، رخ دادن پیشامد Event و به حالت‌های شماره 2 و 3 داده‌های سانسور شده Censored Data می‌گوییم. به منظور درک بهتر، گراف زیر را ببینید.

نمودار زیر یک جدول زمانی را برای هر یک از 8 شرکت کننده اصلی در مطالعه، به همراه نشانه‌ای از مرگ (رویداد) یا سانسور را نشان می‌دهد.

داده های سانسور شده
نمودار مثال داده‌های بقا برای 8 شرکت‌کننده

 

در نمودار بالا “زمان” در محور X قرار گرفته است (مدت زمانی که از شروع آزمایش گذشته است). از آنجایی که هشت شرکت کننده اول در همان ابتدا وارد آزمایش شدند (زمان 0)، زمان سپری شده تا یک رویداد یا سانسور را می توان مستقیماً از نمودار بالا خواند.

همانطور که در نمودار بالا نشان داده شده است، شرکت کننده 01 به مدت چهار ماه تحت بررسی قرار گرفت و سپس درگذشت. به این نکته دقت کنید که در اینجا پیشامد Event مورد بررسی مرگ است. به طور مشابه، شرکت کنندگان 02 و 03 به ترتیب به مدت دو ماه و یک ماه پیگیری شدند و سپس هر کدام رویداد مرگ را تجربه کردند. شرکت کننده 07 به مدت 6 ماه پیگیری شد و درست قبل از پایان مطالعه درگذشت.

به همین ترتیب، شرکت‌کننده 04 برای تمام شش ماه مطالعه، مورد پیگیری قرار گرفت و رویداد مرگ را در آن دوره زمانی تجربه نکرد. یعنی تا پایان مطالعه زنده ماند. شرکت کننده 05 به مدت دو ماه پیگیری شد و در این مدت فوت نکرد. با این حال، پس از این دو ماه، شرکت‌کننده 05 مطالعه را ترک کرد و دیگر از او اطلاعی در دسترس نبود. شرکت‌کننده 08 نیز مطالعه را تنها پس از یک ماه ترک کرد. ما به این افراد Censor می‌گوییم.

به تفاوت بین شرکت‌کنندگان 04 و 07 توجه کنید. اگرچه هر دو به مدت شش ماه در مطالعه شرکت کردند، اما می‌دانیم که شرکت‌کننده 07 درگذشت در حالی که شرکت‌کننده 04 تا پایان مطالعه زنده ماند.

برای شرکت‌کنندگان 04، 05 و 08، (افراد سانسور شده) نمی‌دانیم چه اتفاقی بعد از پایان زمان مطالعه و یا خارج شدن آن‌ها از مطالعه، افتاده است. از بین این هشت شرکت کننده اصلی، فقط می‌توانیم بگوییم که پنج نفر رویداد مورد بررسی (مرگ) را تجربه کردند، در حالی که سه نفر دیگر سانسور شدند.

اکنون که ایده‌ای از آنچه روی می‌دهد داریم، می‌توانیم به شرکت کنندگان دیگر در مطالعه نگاه کنیم تا تصویر کاملی از داده‌ها به دست آوریم.

نمودار مثال داده‌های بقا برای 20 شرکت‌کننده

 

دوازده شرکت‌کننده دیگر پس از شروع مطالعه انتخاب شدند (شرکت‌کنندگان 09-20). مانند گراف قبلی، در محور X زمان قرار دارد. اما می‌بینیم که “زمان شروع” برای شرکت کنندگان 09-20 دیگر در زمان = 0 نیست. از آنجایی که زمان شروع و زمان پایان برای هر شرکت کننده ممکن است متفاوت باشد، ما باید تفاوت بین این دو مقدار را پیدا کنیم تا از آن با عنوان زمان “مشاهده سپری شده” برای هر شرکت کننده، در تحلیل داده‌‌ها استفاده کنیم.

بر مبنای نمودار بالا، مشاهده می‌کنیم که هفت نفر از 12 شرکت کننده بعدی به ترتیب بعد از یک ماه، سه نفر بعد از دو ماه، یک نفر بعد از سه ماه و یک نفر دیگر بعد از چهار ماه، وارد مطالعه شده‌اند. به همین دلیل، ما نمی‌توانیم به سادگی رویداد یا زمان سانسور را به عنوان زمان سپری شده بخوانیم و در تحلیل قرار دهیم. زیرا این افراد در زمان صفر وارد مطالعه نشده‌اند. در این افراد فاصله بین زمان ورود به مطالعه و زمان رویداد یا سانسور، به عنوان زمان سپری شده در آنالیز قرار می‌گیرد.

از دوازده شرکت‌کننده‌ای که پس از شروع مطالعه انتخاب شدند، یک نفر (شرکت‌کننده 18) مطالعه را ترک کرد و دو نفر رویداد مورد علاقه را قبل از پایان مطالعه تجربه نکردند، یعنی همچنان زنده ماندند. به هر سه این افراد، مشاهدات سانسور شده گفته می‌شود. 9 مشاهده دیگر از بین آن دوازده نفر، مرگ را تجربه کردند، البته هر یک در زمان خاص خود. به این ترتیب این 20 نفر به شش مشاهده سانسور شده و 14 مشاهده Event (در آن‌ها مرگ اتفاق افتاده است) تقسیم می‌شوند.

این روش سانسور به عنوان “سانسور راست” right-censoring شناخته می‌شود زیرا زمان بقای شرکت کننده سانسور شده، در سمت راست خط زمانی مشخص نیست. به عبارت دیگر، رویداد احتمالاً پس از دوره مشاهده برای هر یک از این شرکت کنندگان رخ داده است. روش‌های دیگری برای سانسور وجود دارد. سانسور چپ left-censoring و سانسور بازه‌ای interval-censoring از رایج‌ترین آنها است. با این حال سانسور راست چیزی است که تحلیل بقا نرم‌افزار Prism با آن کار می‌کند.

خوب است در همین جا بدانیم که نرم‌افزار Prism از روش‌های تحلیل بقا به صورت زیر استفاده می‌کند.

 Nonparametric survival analysis 

آنالیز بقا ناپارامتری. در این روش امکان استفاده از کمیت‌های پیش‌بینی کننده وجود ندارد. این آنالیز از روش کاپلان مایر Kaplan-Meier برای براورد تابع بقا (منحنی بقا) استفاده می‌کند. آنالیز بقا ناپارامتری، منحنی‌های جداگانه هر کدام از گروه‌های مختلف (تعریف شده توسط یک Variable طبقه‌بندی شده) را با استفاده از آزمون‌های (Mantel-Haenszel، Mantel-Cox) و/یا Gehan-Breslow-Wilcoxon مقایسه می‌کند.

 

 Semiparametric survival analysis 

آنالیز بقا نیمه پارامتری. در این روش امکان استفاده از کمیت‌های پیش‌بینی کننده پیوسته یا طبقه‌بندی شده وجود دارد. این آنالیز از رگرسیون خطرات متناسب کاکس Cox proportional hazards regression به منظور براورد نسبت‌های خطر hazard ratios و ضرایب پارامتر، منحنی‌های بقا و همچنین براورد احتمال بقا Survival Probability برای هر مشاهده استفاده می‌کند.

 

نوع دیگری از آنالیز بقا با نام تحلیل بقا پارامتری Parametric survival analysis وجود دارد که به فرضیات اضافی در مورد توزیع زمان بقا در جمعیت نمونه نیاز دارد و در حال حاضر به عنوان یک تحلیل در نرم‌افزار Prism ارایه نمی‌شود.

 

ما در این مقاله به بیان داده‌های سانسور شده Censored Data در آنالیز بقا Survival Analysis پرداختیم. مثال و تعریف داده های سانسور شده همراه با انواع روش‌های آنالیز بقا، در این نوشته بیان شده است.

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2023). Censored data in survival analysis. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/censored-data/.php

For example, if you viewed this guide on 12th January 2023, you would use the following reference

GraphPad Statistics (2023). Censored data in survival analysis. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/censored-data/.php

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

    گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹