نوروبیزینس

الکتروآنسفالوگرام چیست؟-بخش دوم

استخراج ویژگی

آنالیز سری­ های زمانی اغلب با استخراج ویژگی از سیگنال مورد نظر انجام می ­شود. ویژگی­ ها می­ توانند به عنوان پارامترهایی تعریف شوند که حاوی اطلاعاتی در مورد ساختار سیگنال مورد بررسی هستند. روش ­های زیادی برای استخراج ویژگی از سیگنال ­ها وجود دارد. باید توجه داشت که در حالت کلی، برای مطالعه سیگنال­ ها و شناسایی پدیده ­های مختلف، از چندین ویژگی استفاده می­شود چراکه ویژگی­ های مختلف می­توانند مکمل یکدیگر بوده و به استخدام در آوردن هم­زمان تعدادی از آن­ها با هم می­ تواند منجر به نتایج مطلوب­تری شود.

 پردازش در حوزه زمان

ویژگی­ های زمانی، دسته­ای از ویژگی­ ها هستند که از سیگنال در حوزه زمان استخراج می­شوند. این ویژگی­ ها، حاوی اطلاعاتی در حوزه زمان بوده و معمولاً به سادگی قابل محاسبه و استخراج هستند. این ویژگی­ ها معمولاً به ازای یک پنجره زمانی از سیگنال اصلی محاسبه می­ شوند. با توجه به اینکه سیگنال در حوزه زمان، در حقیقت، به معنای تغییرات دامنه برحسب زمان است، ویژگی­ های حوزه زمان بخش محدودی از اطلاعات مفید سیگنال را استخراج خواهند کرد و لازم است تا ویژگی­ های مربوط به حوزه­های دیگر مانند حوزه فرکانس و یا تبدیل موجک نیز در نظر گرفته شود.

پردازش در حوزه فرکانس

یکی از راه­ های مرسوم برای دست­یابی به بخشی از اطلاعات موجود در سیگنال تغییر حوزه اطلاعاتی سیگنال است. حوزه فرکانس به عنوان یکی از مرسوم­ ترین حوزه­ ها، به منظور استخراج ویژگی مورد توجه است. طبق تعریف تبدیل فوریه زمان پیوسته سیگنال پیوسته  و همچنین معکوس آن، مطابق با فرمول (۲) و (۳) به دست می­آید.

معرف فرکانس و  معرف زمان است.  سیگنال اصلی را در حوزه فرکانس بیان می­کند.  حاوی اطلاعات مفیدی خواهد بود که در حوزه زمان قابل مشاهده نیست. ویژگی­ های مختلفی که از حوزه فرکانس یک سیگنال به دست می­آید در آنالیز و شناسایی الگوها بسیار مفید خواهد بود.

ملاحظه می­شود که در رابطه (۲) حدود انتگرال از  تا  است. نامحدود بودن حدود انتگرال­گ یری بیان­گر بی­اهمیت بودن زمان حضور مؤلفه  در سیگنال است. به بیان دیگر، در تبدیل فوریه، مؤلفه فرکانسی  هر جای سیگنال که باشد، با انتگرال­ گیری از   تا  شناسایی خواهد شد. در رابطه تبدیل فوریه در حقیقت میزان شباهت بین  و  محاسبه شده است. این شباهت­ سنجی به ازای یک فرکانس خاص در همه زمان­ ها محاسبه می­شود. از طرفی می­ توان دریافت که تبدیل فوریه قابلیت تشخیص زمان حضور یک فرکانس خاص در سیگنال را ندارد، و این یعنی نداشتن حساسیت و رزولوشن نسبت به زمان. این موضوع یک عیب برای تبدیل فوریه خواهد بود، زیرا بخشی از اطلاعات مفید سیگنال مربوط به مؤلفه ­های فرکانسی خاصی است که در بازه زمانی کوتاهی آشکار می­شوند. تبدیل فوریه توانایی تعقیب این تغییرات سریع را ندارد. یکی از ابزارهای بسیار مفید برای برطرف کردن این عیب تبدیل موجک است.

پردازش در حوزه موجک

تبدیل موجک[۱] (WT) یکی از ابزارهای بسیار مفید برای آنالیز زمان- فرکانسی سیگنال است. در تبدیل موجک کرنل زمان- فرکانس به گونه ­ای است که مؤلفه­ های زمان و فرکانس موجود در سیگنال را به خوبی تشخیص داده و استخراج می­کند

تبدیل موجک گسسته

برای پردازش سیگنال­ های دیجیتال یک تقریب گسسته از ضرایب موجک نیاز است. در صورتی که سیگنال مورد بررسی در یک باند فرکانسی محدود قرار داشته باشد، تبدیل موجک گسسته[۲] (DWT) می­تواند براساس تئوری نمونه­ برداری استخراج شود.

نسخه پیوسته WT می­تواند با ملاحظات ساده­ ای نسبت به تغییر الگوی موجک بر اثر تأخیر گسسته­ سازی شود. از آنجا که در حالت کلی تابع موجک  محدود به باند فرکانسی خاصی نیست، به منظور جلوگیری از پدیده الیاسینگ (همپوشانی فرکانسی)[۳]، لازم است تا بخشی از مؤلفه­ های فرکانسی تابع موجک سرکوب یا حذف شوند. مؤلفه­ های سرکوب شده دارای فرکانسی بیش از نصف فرکانس نمونه ­برداری می­ باشند.

فضای فوریه می­ تواند به منظور محاسبه تبدیل موجک در مقیاس­ های مختلف مورد استفاده قرار گیرد. در صورتی که پهنای باند فرکانسی کاهش یابد، تعداد المان­ها برای یک مقیاس خاص نیز کاهش خواهد یافت. یک تجزیه از سیگنال اطلاعات بسیار مفیدی در مورد کاهش المان­ها در هر مقیاس به دست می­دهد. این تجزیه در هر گام، باند فرکانسی سیگنال را به دو بخش تقسیم می­کند. موجک مربوطه به خوبی در فضای فوریه محلی­ سازی شده است. این محلی بودن قابلیت دسته­ ای از آنالیزها را می­دهد که در فضای اصلی امکان­پذیر نیست.

تقسیم ­بندی به دو بخش در هر گام از تجزیه امکان بررسی اتفاقات در مقیاس­ های مختلف را فراهم می­کند. به این ترتیب که در گام­ های نخست مقیاس تابع موجک بزرگ بوده و می­تواند الگوها و رخدادهایی را که در بازه­های زمانی بلند در سیگنال اتفاق افتاده است شناسایی کند. در گام­ های بعدی با نصف شدن مقیاس تابع موجک، به تدریج امکان بررسی الگوها و رخدادهایی که در بازه­ های زمانی کوتاه اتفاق می­افتد فراهم می­شود. این قابلیت، همان­طور که پیش­تر ذکر شد، مانند یک میکروسکوپ ریاضیاتی عمل خواهد کرد. این میکروسکوپ نسبت به میزان بزرگی، سرعت و یا دینامیک رخداد حساسیتی ندارد چراکه میان تابع موجک و سیگنال اصلی، به ازای مقیاس­های مختلف تابع موجک، شباهت­سنجی کرده و تمام دینامیک­ها را شناسایی می­کند.

از یک منظر دیگر که نتایج بسیار کاربردی در خصوص پردازش سیگنال­ ها به دست می­دهد، تقسیم ­بندی دو بخشی تابع اصلی یا سیگنال مورد بررسی را می­توان به صورت یک فیلتر پایین­ گذر و یک فیلتر بالاگذر تحلیل کرد. به این ترتیب در هر گام از تجزیه، سیگنال به دو بخش تقسیم می­شود که یک بخش حاوی اطلاعات فرکانس پایین و یک بخش حاوی اطلاعات فرکانس بالای سیگنال است. اطلاعات فرکانس پایین در حقیقت مربوط به یک تقریب[۴] (A) از سیگنال هستند. بخش تقریب رفتارهای کلی یا دینامیک­ های با سرعت پایین سیگنال را نشان می­دهد. اطلاعات فرکانس بالا در حقیقت مربوط به جزئیات[۵] (D) سیگنال هستند. بخش جزئیات رفتارهای جزئی یا دینامیک­ های با سرعت بالای سیگنال را نشان می­دهد. برای مثال، اگر سیگنال اصلی دارای باند فرکانسی Hz 256-0 است، بخش A باند فرکانسی Hz 128-0 و بخش D باند فرکانسی Hz 256-128 را به خود اختصاص خواهد داد. در گام بعدی، بخش A، مانند گام قبل، به دو بخش A1 (Hz 64-0) و D1 (Hz 128-64) تقسیم می­شود. به همین ترتیب، با توجه به دانش ابتدایی نسبت به الگوهای مورد نظر در سیگنال اصلی، تا هر تعداد گام که لازم باشد می­توان جلو رفت.

انتخاب ویژگی

ویژگی، خصیصه قابل اندازه­ گیری منحصر به فرد در فرآیند مشاهده شده است. با استفاده از مجموعه ­ای از ویژگی­ ها یک الگوریتم بینایی ماشین یا شناسایی الگو، قادر به انجام کلاس ­بندی خواهد بود. در سال­ های اخیر در کاربردهای بینایی ماشین و یا شناسایی الگو دامنه ویژگی­ ها تا چند هزار متغیر یا ویژگی گسترش پیدا کرده است. تکنیک­ های متعددی برای حل مسئله کاهش متغیرهای غیرمرتبط و متغیرهای دچار افزونگی[۶]، که چالش اصلی در این مسائل هستند، ایجاد شده است. انتخاب ویژگی (حذف متغیر) به فهم داده­ ها، کاهش محاسبات مورد نیاز، کاهش اثر نفرین بُعد[۷] و بهبود عملکرد پیش­بینی کننده کمک می­کند. در بسیاری از کاربردهای عملی برای استخراج ویژگی­ها از سنسورها و یا الکترودها استفاده می­شود. با به کارگیری روش­ های انتخاب ویژگی، کاهش هوشمندانه تعداد ویژگی­ ها، تعداد سنسورها و یا الکترودهای ثبت را کاهش خواهد داد. به این ترتیب هزینه­ های عملیاتی برای پردازش سیگنال­ها و اطلاعات مورد نظر کاهش خواهد یافت.

تمرکز بر روی انتخاب ویژگی به معنی انتخاب یک زیرمجموعه از متغیرهای ورودی است، به نحوی که بتواند به طور مؤثر داده­های ورودی را توصیف کرده و در عین حال اثرات ناشی از نویز یا متغیرهای غیرمرتبط را کاهش دهد. این زیرمجموعه همچنین باید قادر باشد نتایج قابل قبول پیش­بینی کننده (کلاس­ بند) را حفظ کند.

متغیرهای وابسته به هم در بردارنده هیچ اطلاعات جدیدی در مورد کلاس ­ها نیستند، به همین خاطر به عنوان نویز برای کلاس ­بند مطرح می­ شوند. این وابستگی نشان می­ دهد که اطلاعات مفید، به طور کامل، می­تواند از میان تعداد کم­تری ویژگی­ های یکتا استخراج شده و در عین حال بیشترین جدایی اطلاعات را در مورد کلاس­ ها به همراه داشته باشد. در نتیجه، با حذف متغیرهای وابسته مقدار داده­ها کاهش خواهد یافت و این کاهش مقدار داده­ ها می­ تواند منجر به بهبود عملکرد کلاس ­بند شود. در برخی کاربردها، متغیرهایی که هیچ همبستگی[۸] نسبت به کلاس ­ها ندارند به عنوان نویز در نظر گرفته می ­شوند و ممکن است بایاسی را به کلاس ­بند تحمیل کرده و عملکرد کلاس ­بند را تضعیف کنند. این موضوع می­تواند در مواردی که اطلاعات پیرامون فرآیند مورد مطالعه کم است رخ دهد. با اعمال روش­ های انتخاب ویژگی می­ توان بینش و درون­بینی عمیق­تری نسبت به فرآیند پیدا کرده و محاسبات مورد نیاز را کاهش و صحت کلاس ­بند را بهبود داد.

برای حذف ویژگی­ های غیرمرتبط، یک معیار انتخاب ویژگی نیاز است. این معیار باید بتواند میزان ارتباط هر ویژگی با کلاس یا برچسب خروجی را به صورت کمّی ارزیابی نماید. از دیدگاه بینایی ماشین، اگر یک سیستم از متغیرهای غیرمرتبط استفاده نماید، آنگاه استفاده از اطلاعات مربوط به این متغیرها برای داده­های جدید منجر به تضعیف تعمیم ­پذیری[۹] سیستم می­شود. حذف متغیرهای غیرمرتبط نباید با روش­های دیگر کاهش بُعد مانند آنالیز مؤلفه­های اساسی[۱۰] (PCA) مقایسه شود، زیرا ویژگی ­های مناسب می­تواند مستقل از باقیمانده داده­ ها باشد. حذف ویژگی، ویژگی جدیدی تولید نمی­کند، بلکه ویژگی­ های استخراج شده را در ورودی گرفته و تعداد آن­ها را کاهش می­دهد. وقتی معیار ارزیابی برای انتخاب ویژگی تعیین شد، طی یک فرآیند، زیرمجموعه ­ای از ویژگی­های مفید جست و جو و انتخاب خواهد شد. ارزیابی مستقیم همه زیرمجموعه­ های قابل انتخاب از ویژگی­ها (N2) برای داده­های موجود، با افزایش تعداد ویژگی­ها، یقیناً به لحاظ محاسباتی بسیار طولانی و دچار نفرین بُعد خواهد شد. به همین خاطر لازم است تا یک فرآیند زیربهینه[۱۱] به کار گرفته شود به طوری که هم بتوان داده­ه ای با افزونگی را حذف کرد و هم بتوان محاسبات مربوطه را کاهش داد.

 مراجع

Andreassi, JL. “Psychophysiology: Human Behaviour & Physiological Response” London: Lawrence Erlbaum Associates, 2000.Stern, W. Ray and K. Quigley, “Psychophysiological Recording” Oxford: Oxford University Press, 2001.

  1. Hyvärinen “Independent component analysis: recent advances” Phil Trans R Soc A 371: 20110534, 2013.
  2. Sanei and J. A. Chambers. “EEG Signal Processing” ۲۰۰۷٫
  3. E. Cherry, “Some experiments in the recognition of speech, with one and two ears” J. Acoust. Soc. Am., 25: 975–۹۷۹, ۱۹۵۳٫
  4. Herault, and C. Jutten, “Space or time adaptive signal processing by neural models” Proceeding of the American Institute of Physics (AIP) Conference on Neural Networks for Computing, pp. 206–۲۱۱, ۱۹۸۶٫
  5. Comon, “Independent component analysis: a new concept” Signal Process., 36: 287–۳۱۴, ۱۹۹۴٫
  6. P. Jung, S. Makeig, C. Humphries, T. W. Lee, M. J. McKeown, V. Iragui and T. J. Sejnowski, “Removing electroencephalographic artefacts by blind source separation” Psychophysiology, 37: 163–۱۷۸, ۲۰۰۰٫
  7. Shoker, S. Sanei, and J. Chambers, “Artifact removal from electroencephalograms using a hybrid BSS-SVM algorithm” IEEE Signal Process. Lett., 12(10), October 2005.
  8. Shoker, S. Sanei, and J. Chambers, “A hybrid algorithm for the removal of eye blinking artefacts from electroencephalograms” in Proceedings of the IEEE Statistical Signal Processing Workshop, France, SSP2005, February 2005.
  9. Corsini, L. Shoker, S. Sanei, and G. Alarcon, “Epileptic seizure prediction from scalp EEG incorporating BSS” IEEE Trans. Biomed. Eng., 53(5): 790–۷۹۹, May 2006.
  10. A. Latif, S. Sanei, and J. Chambers, “Localization of abnormal EEG sources blind source separation partially constrained by the locations of known sources” IEEE Signal Process, Lett., 13(3): 117–۱۲۰, March 2006.
  11. Spyrou, M. Jing, S. Sanei, and A. Sumich, “Separation and localisation of P300 sources and the subcomponents using constrained blind source separation” EURASIP J. Adv. Signal Process., Article ID 82912, November 2006.
  12. Hyvärinen and E. Oja, “Independent component analysis: algorithms and applications” Journal of Neural Networks, 13: 411–۴۳۰, ۲۰۰۰٫
  13. Hyvärinen, “Fast and robust fixed-point algorithms for independent component analysis” IEEE Transactions on Neural Networks, 10 (3): 626–۶۳۴, ۱۹۹۹٫
  14. Murenzi, J. M. Combes, A. Grossman, and P. Tchmitchian, (Eds), Wavelets, Springer-Verlag, Berlin, Heidelberg, New York, 1988.
  15. J. Franaszczuk, G. K. Bergey, and P. J. Durka, “Time–frequency analysis of mesial temporal lobe seizures using the matching pursuit algorithm” Soc. Neurosci. Abstr., 22: 184, 1996.
  16. Holschneider, R. Kronland-Martinet, J. Morlet, and  Ph. Tchamitchian, “A real-time algorithm for signal analysis with the help of the wavelet transform” in Wavelets: Time–Frequency Methods and Phase Space, Eds J. M. Combes, A. Grossman, and Ph. Tchamitchian, Springer-Verlag, Berlin, pp. 286–۲۹۷, ۱۹۸۹٫
  17. Murenzi, J. M. Combes, A. Grossman, and P. Tchmitchian, (Eds), Wavelets, Springer-Verlag, Berlin, Heidelberg, New York, 1988.
  18. Guyon, A. Elisseeff, “An introduction to variable and feature selection” J Mach Learn Res, 3:1157–۸۲, ۲۰۰۳٫
  19. Alpaydin “Introduction to machine learning” The MIT Press; 2004.

MH Law, M rio AT Figueiredo, AK Jain, “Simultaneous feature selection and clustering using mixture models” IEEE Trans Pattern Anal Mach Intell, 26, 2004.

  1. Kohavi, GH. John “Wrappers for feature subset selection” Artif Intell, 97:273–۳۲۴, ۱۹۹۷٫
  2. Yang, H. Yoon, C. Shahabi, “A supervised feature subset selection technique for multivariate time series” in: Workshop Feature Selection for Data Mining: Interfacing Machine Learning with Statistics, pp. 92–۱۰۱, ۲۰۰۵٫
  3. Javed, H. Babri and M. Saeed, “Feature selection based on class-dependent densities for high-dimensional binary data” IEEE Trans, Knowl, Data Eng, 24: 465–۴۷۷, ۲۰۱۲٫
  4. M. Sotoca and F. Pla, “Supervised feature selection by clustering using conditional mutual information-based distances” Patt. Recog, 43: 2068–۲۰۸۱, ۲۰۱۰٫
  5. Cheema, T. Henne, U. Koeckemann and E. Prassler, “Applicability of feature selection on multivariate time series data for robotic discovery” in: 3rd International Conference on Advanced Computer Theory and Engineering (ICACTE ‘۱۰), pp. V2-592-V592-597, 2010.

M.W. Kadous, “Temporal classification: extending the classification paradigm to multivariate time series” Doctoral Dissertation, School of Computer Science and Engineering, The University of New South Wales, 2002.

  1. Shahabi, “AIMS: an immersidata management system, in: VLDB First Biennial Conference on Innovative Data Systems Research” (CIDR ‘۰۳), ۲۰۰۳٫
  2. Tanawongsuwan, A. Bobick, “Performance analysis of time-distance gait parameters under different speeds” in: 4th International Conference on Audio- and Video-based Biometric Person Authentication (AVBPA ‘۰۳) Springer, pp. 715–۷۲۴, ۲۰۰۳٫
  3. Brown, A. Pocock, M.J. Zhao and M. Luja´n, “Conditional likelihood maximisation: a unifying framework for information theoretic feature selection” J. Mach, Learn. Res, 13: 26–۶۶, ۲۰۱۲٫

[۱] Wavelet Transform

[۲] Discrete Wavelet Transform

[۳] Aliasing

[۴] Approximation

[۵] Details

[۶] Redundancy

[۷] Curse of Dimensionality

[۸] Correlation

[۹] Generalization

[۱۰] Principle Component Analysis

[۱۱] Suboptimal

[۱۲] Wrapper

برچسب ها

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا
بستن
بستن