پردازش داده ها یک استراتژی مهم در شیمی سنجی و زمینه های مرتبط است زیرا در بسیاری موارد تبدیل داده ها تأثیر زیادی در عملکرد روش (مدل) دارد. با این حال ، یک بررسی دقیق از ادبیات به وضوح اشاره می کند که فقط تعداد کمی از مطالعات سیستماتیک به تأثیر طیف های مشتق بر عملکرد روش های تشخیص الگوی اختصاص داده شده است. این مطالعه جامع ، تأثیر ترتیب طیفهای مشتق و سایر روشهای پیش پردازش داده ها (عادی سازی و استانداردسازی) را بر عملکرد تجزیه و تحلیل خوشه ای ، تجزیه و تحلیل مؤلفه های اصلی و آنالیز تبعیض آمیز اعمال شده برای توصیف و طبقه بندی گیاهان دارویی با توجه به پناه آنها با استفاده از طیف UV. با مقایسه دقت طبقه بندی و پیش بینی اندازه گیری شده توسط اعتبار سنجی متقابل داخلی ، کارآیی روشهای پیش پردازش محاسبه شد. روش مشتق کردن (مرتبه اول) منجر به بهترین طبقه بندی (۱۰۰٪) از گیاهان دارویی با توجه به پناه آنها (Pteridophyte ، Magnoliophyte و Spermatophyte) در مقایسه با سایر روش های پیش پردازش (طیف نرمال-۷۱٫۴٪ ، طیف استاندارد ۷۶٫۲٪ و طیف اصلی -۷۸٫۶٪).