ارزشیابی دانشجویی

نصر اصفهانی, احمدرضا; شریفیان, فریدون

ارزشیابی دانشجویی

Student Evaluation

نویسندگان

احمدرضا نصر اصفهانی

فریدون شریفیان

افرادی که بسان دانشجو به دانشگاه‌ها و مؤسسات آموزش عالی وارد می‌شوند، بخش زیادی از زمان خود را به مطالعه درس‌ها و انجام فعالیت‌های مربوط به رشته تحصیلی اختصاص می‌دهند. آنان درس‌های گوناگونی را می‌گذرانند و زیر تأثیر نتایج برنامه درسی رشته و درس‌ها قرار می‌گیرند؛ به‌همین‌دلیل، برخی دانشجویان را مشتری اصلی نظام آموزش عالی به‌شمار آورده‌اند (Petersen-Perlman et al., 1999).
نقش و جایگاه دانشجویان در آموزش عالی باعث شده است به ضرورت نقش‌آفرینی آنان در ارزشیابی برخی عملکردهای دانشگاهی توجه شود. امروزه، در بسیاری از دانشگاه‌ها، دانشجویان در ارزشیابی اموری مانند کیفیت آموزش و عملکرد اعضای هیئت‌علمی، ارزشیابی درس و در دوره تحصیلات تکمیلی، ارزشیابی استادان راهنما مشارکت جدی و مؤثر دارند.

ارزشیابی دانشجویان از عملکرد اعضای هیئت‌علمی دانشگاه‌ها به‌معنای ابتدایی آن، از سده‌های میانی در دانشگاه‌های کشورهای اروپایی مورد توجه قرار گرفته است. در عصر جدید، علاقه‌مندی بسیاری به ارزشیابی دانشجویی وجود دارد و این موضوع محو در بسیاری از پژوهش‌های نیم سده گذشته بوده است (Ali and Sell, 1998).
به اعتقاد موری (Murray, 1980) در بیشتر دانشگاه‌ها و دانشکده‌های کشورهای امریکای شمالی، ارزشیابی دانشجویی از دهه 1960 و اوایل دهه 1970 شروع شده است. برخی، تاریخ پدیدآیی پژوهش در زمینه ارزشیابی دانشجویی را دهه 1920 دانسته‌اند (Cross et al., 2004) و یادآور شده‌اند که قدیمی‌ترین ارزشیابی دانشجویی از کیفیت آموزش دانشگاهی در دهه 1920 در دانشگاه واشنگتن به‌وسیلة روان‌شناسی به نام «گاتری» به انجام رسیده است. براساس دیدگاه موری، ارزشیابی دانشجویی از حدود 40-35 سال گذشته در بسیاری از دانشگاه‌ها مورد توجه جدی قرار گرفته و این شیوه ارزشیابی در سال‌های گذشته یکی از بحث‌انگیز‌ترین و درعین‌حال پرکشش‌ترین مفاهیم در عرصه آموزش عالی بوده است (Murray, 1980).
درحال‌حاضر، ارزشیابی ازسوی دانشجویان یکی از متداول‌ترین منابع مورد استفاده در ارزشیابی کیفیت آموزش و درس‌های دانشگاهی است. باوجوداین، دانشجویان را نمی‌توان تنها منبع اطلاعاتی برای دریافت بازخورد پیرامون تدریس و درس‌ها دانست (Keane and Labhrainn, 2005; Center for Teaching and Learning, 1994).
باتوجه‌به تأکید آثار موجود، در آموزش عالی به نظام‌های ارزشیابی فراگیر نیاز است (Kaufman, 2002).
بررسی نظام‌های ارزشیابی در دانشگاه‌ها نشان می‌دهد که ارزشیابی‌ ازسوی دانشجویان یکی از انواع ارزشیابی است که همواره به‌صورت منظم و مداوم در دانشگاه‌ها مورد استفاده قرار می‌گیرد (Emery et al., 2003; Aleamoni, 1999). اهمیت ارزشیابی دانشجویی از منظر تأکید بر ضرورت پاسخگویی آموزش عالی نیز قابل توجه است. همراه با شکل‌گیری تقاضاهای بسیار در عرصه مطالبات عمومی از دانشگاه‌ها و افزایش دغدغه‌ کیفیت آموزش دانشگاهی، ارزشیابی‌های دانشجویی به‌صورت گسترده‌ای ازسوی دانشگاه‌های دنیا به‌منزله بخش مهمی از نظام تضمین کیفیت مورد استفاده قرار گرفته است (Kwan, 1999; Timpson and Andrew, 1997; University of Wisconsin-Green Bay, 1998).
استفاده از ارزشیابی‌های دانشجویی، برای ارزیابی تدریس، رشد فزاینده‌ای در سراسر دنیا یافته است و متداول‌ترین روش به‌شمار می‌آید (Timpson and Andrew, 1997; University of Wisconsin-Green, 1998). برای مثال، استفادة منظم از ارزشیابی دانشجویی در دانشگاه‌های امریکای شمالی امری مرسوم و جزء فعالیت‌های عادی پایان نیمسال به حساب می‌آید (Kolitch and Dean, 1999).
سنترا (Centra, 1993) اظهار می‌کند که در میان دانشگاه‌های امریکا به‌ندرت می‌توان دانشگاهی را یافت که از ارزشیابی دانشجویی استفاده نکند. استفاده از ارزشیابی دانشجویی در دانشگاه‌های استرالیا نیز روز‌به‌روز بیشتر مورد توجه قرار می‌گیرد و یکی از ملاک‌های قضاوت در مورد کیفیت تدریس استادان به‌شمار می‌آید (Marsh and Roche, 1992).
به‌رغم تأثیر فراوان فنّاوری و رسانه‌های گوناگون بر تدریس در سال‌های اخیر، مک‌کیچی (Mckeachie, 1990) اظهار داشته است که بیشتر دانشجویان زیر تأثیر کیفیت تدریس استادان هستند. ازاین‌رو، ارزشیابی دانشجویان از تدریس، همچنان روشی مناسب برای بهبود کیفیت تدریس و ارزشیابی استادان باقی خواهد ماند.
در ایران نیز به این نوع ارزشیابی توجه می‌شود؛ به‌طوری‌که بسیاری از دانشگاه‌ها آن را پذیرفته‌اند. هم‌اکنون دانشگاه‌های کشور بیش از گذشته برای تدریس و ارزشیابی آن اهمیت قائل می‌شوند. برگزاری کارگاه‌های آموزشی تدریس و توجه به نمرات ارزشیابی تدریس استادان، به‌منزلة یکی از ملاک‌های ارتقای آنان به‌مراتب دانشگاهی بالاتر، ازجمله نشانه‌های این افزایش اهمیت است. به‌منظور بالا بردن بیشتر این منزلت، در آیین‌نامة جدید ارتقای دانشگاه‌های وزارت علوم، تحقیقات و فنّاوری (1380)، سطح نمرة مورد انتظار ارزشیابی تدریس برای استادیاران از 14 به 15 و برای دانشیاران از 15 به 16 افزایش یافته است.
استفادة روزافزون از ارزشیابی دانشجویی می‌تواند یکی از نشانه‌های کارآمد بودن آن به‌شمار می‌آید. البته این مطلب قابل بحث است که آیا استفاده از این روش به‌خاطر مناسب بودن آن، سهولت جمع‌آوری اطلاعات، نمره‌گذاری و هزینة نسبتاً کم آن گسترش یافته یا اینکه در مجموع، روش مناسبی است. در پاسخ به این پرسش، پژوهش‌های فراوانی نشان داده است که ارزشیابی دانشجویی شیوة‌ مناسبی برای ارزشیابی بسیاری از حیطه‌های تدریس است و نتایج آن نیز معتبر و قابل اعتماد است (Ramsden, 1992; Cashin, 1995).
سزاوار یادآوری است که در زبان انگلیسی معنای ارزیابی و ارزشیابی متفاوت است، ولی در فارسی این‌طور نیست. درحالی‌که فرهنگ وبستر، ارزشیابی را «قضاوت یا تعیین ارزش کردن» تعریف می‌کند، واژة «ارزشیابی» در فرهنگ‌های فارسی، لغت‌نامة دهخدا و فرهنگ معین وجود ندارد. در این دو فرهنگ فقط واژة «ارزیابی» آمده و در لغت‌نامة دهخدا «عمل یافتن ارزش و بهای هر چیز، سنجش و بررسی حدود هر چیز و برآورد کردن ارزش آن» تعریف شده است (بازرگان و همکاران، 1379؛ کیامنش، 1376؛ سیف، 1375). برخی می‌پندارند واژة ارزشیابی و ارزیابی در فارسی به یک معنی به‌کار می‌رود؛ برای مثال، بازرگان و همکاران (1379) اظهار داشته‌اند: «واژه‌های ارزشیابی و ارزیابی، که در نظام آموزشی به‌طور مترادف به‌کار برده می‌شود، به‌معنای داوری دربارة پدید‌ه‌های آموزشی است».
همان‌طورکه گفته شد، در زبان انگلیسی، معنای ارزیابی و ارزشیابی متفاوت است. ارزیابی را «مهارت فراگیران در تشخیص، طبقه‌بندی، نمره‌ دادن و یا درجه‌بندی» افرادی دانسته‌اند که وظیفة آموزش را برعهده دارند (ولف، 1371).
به‌همین‌علت، کشین (Cashin, 1995) می‌گوید اصطلاح درجه‌بندی دانشجویی صحیح است و بر تعبیر ارزشیابی ترجیح دارد. او توضیح داده است که واژة ارزشیابی هنگامی به‌کار برده می‌شود که فرد به قضاوت قطعی دست یابد، درحالی‌که درجه‌بندی بیانگر داده‌های جمع‌آوری شده‌ای است که باید مورد تفسیر قرار گیرند.
همان‌طورکه گفته شد، در فارسی بین دو واژة ارزشیابی و ارزیابی تفاوت قائل نمی‌شوند. اما باتوجه‌به تفاوت ظریف بین این دو واژه در انگلیسی- که ارزشیابی را برای داوری و ارزیابی را برای درجه‌بندی به‌کار می‌برند- به‌نظر می‌رسد استفاده از تعبیر «ارزیابی دانشجویی» صحیح‌تر باشد. چرا که تدریس ازسوی دانشجویان درجه‌بندی می‌شود. به‌عبارت‌دیگر، عمل درجه‌بندی دانشجویان یکی از منابع اطلاعاتی و مراحلی است که برمبنای آن عملکرد استاد ارزشیابی می‌شود. ارزشیابی فرایندی نظام‌دار برای جمع‌آوری، تحلیل و تفسیر اطلاعاتی است که به قضاوت می‌انجامد.
نگارنده باور دارد کار دانشجویان ارزیابی از تدریس است، نه داوری کردن؛ اما به‌خاطر هم‌معنی بودن واژه‌های ارزیابی و ارزشیابی در فارسی و رایج بودن واژة ارزشیابی، در این مقاله نیز، به تسامح، واژة ارزشیابی به‌کار برده می‌شود. در مواردی نیز ممکن است این دو واژه به‌جای هم به‌کار برده شوند. انتظار می‌رود صاحب‌نظران تفاوت بین این دو واژه را تبیین کنند و آنها را با معنای خاص خود به‌کار برند تا به‌تدریج هریک در جای خود به‌کار رود.
درهرحال، دانشجویان می‌توانند به روش‌های گوناگونی تدریس استادان را ارزیابی یا ارزشیابی کنند. پاسخ به پرسش‌های باز، پرسشنامه‌های بسته‌پاسخ و مصاحبه‌های فردی و گروهی از این روش‌هاست (Cannon and Newble, 2000).
بااین‌حال، برخی پژوهش‌ها نشان می‌دهد که استفاده از پرسشنامه‌های چنددرجه‌ایِ بسته‌پاسخ، معمول‌ترین روش ارزشیابی مورد استفاده در دانشگاه‌هاست (Centra, 1993؛ سیف، 1376).
البته در سال‌های گذشته در شیوه طراحی، اجرا و جمع‌آوری ارزشیابی‌های دانشجویی تغییراتی به وجود آمده و در بسیاری از دانشگاه‌ها ارزشیابی مداد-کاغذی در درون محیط کلاس جای خود را به ارشیابی برخط یا مبتنی‌بر وب داده است (Ha et al., 1998).
باتوجه‌به اینکه در مورد شیوه‌های سنتی ارزشیابی دانشجویی که بیشتر به‌صورت نوشتاری انجام می‌شود شناخت بیشتری وجود دارد.

ارزشیابی دانشجویی برخط
برخی صاحب‌نظران بر این باورند که ارزشیابی‌های دانشجویی که در محیط کلاس و با استفاده از پرسشنامه‌های مرسوم مداد-کاغذی انجام می‌شود، پرهزینه و زمان‌بر است، برای مجریان و اعضای هیئت‌علمی پرزحمت است و به‌خاطر زمان اندکی که برای پاسخ‌گویی به این‌گونه پرسشنامه‌ها اختصاص داده می‌شود، داوری همراه با اندیشه و پاسخ‌های ژرف دانشجویان محدود می‌شود. درحال‌حاضر، استفاده وسیع از فنّاوری در عرصه تعلیم و تربیت به‌ویژه کاربرد اینترنت به طراحی، اجرا و گزارش یافته‌های حاصل از ارزشیابی‌های دانشجویی به‌وسیله رایانه منجر شده است (Johnson, 2002).
برای ارزشیابی برخط، مزایا و محدودیت‌های مختلفی برشمرده شده است. از مهم‌ترین مزایای این روش عبارت‌اند از:
- کاهش زمان و هزینه‌ها؛
- سهولت مدیریت فرایند ارزشیابی؛
- دریافت پاسخ‌های عمیق و کامل‌تر ازسوی دانشجویان؛
- جمع‌آوری و گزارش دقیق‌تر یافته‌ها؛
- عرضه گزارش‌های مفصل‌تر از نتایج حاصل از ارزشیابی (Anderson et al., 2005; Johnson, 2002)؛
- عرضه بازخورد فوری در مورد نتایج ارزشیابی (McGourty et al., 2002)؛
- محرمانه ماندن مشخصات دانشجویان (به‌دلیل استفاده نکردن از ارزشیابی به شیوه نوشتاری که ممکن است باعث شناخته شدن دانشجو ازطریق شیوه نگارش و دست خط او شود)؛
- عدم اختصاص زمان کلاس به انجام ارزشیابی و افزایش کارایی و دقت.
همچنین، این شیوه ارزشیابی دارای محدودیت‌های است که ازجمله مهم‌ترین آنها می‌توان به موارد زیر اشاره داشت:
- ضرورت وجود رایانه؛
- باور اعضای هیئت‌علمی حامی ارزشیابی سنتی به صحت و دقت کمتر ارزشیابی برخط؛
- شرکت نکردن همه دانشجویان در تکمیل فرم‌های ارزشیابی (Anderson et al., 2005).
این موضوع به‌ویژه در دانشگاه‌هایی مطرح است که سازوکارهایی برای وادار ساختن دانشجویان برای شرکت در ارزشیابی در نظر نمی‌گیرند.
به‌دلیل عمومیت محدودیت یادشده، راهبردهایی برای افزایش میزان پاسخ‌گویی دانشجویان به فرم‌های ارزشیابی که با استفاده از رایانه تکمیل می‌شوند عرضه شده است. چند مورد از این راهبردها به شرح زیر است:
- آگاه ساختن دانشجویان در مورد نظام ارزشیابی و چگونگی استفاده از آن؛
- در نظر گرفتن فعالیت تکمیل فرم‌های ارزشیابی بسان یکی از تکالیف کلاسی دانشجویان در هر درس. این کار با چشم‌پوشی از اینکه برای تکمیل فرم ارزشیابی امتیازاتی به دانشجویان داده می‌شود یا خیر، جایگاه خود را داراست و توجیه و آگاه‌سازی دانشجویان درباره اینکه نتایج به‌دست آمده از ارزشیابی چگونه مورد استفاده قرار خواهد گرفت.
می‌تواند به همراه دیگر منابع مورد استفاده قرار گیرد. این امر، امکان با هم نگری دیدگاه‌ها و جمع‌بندی نتایج ارزشیابی‌های مختلف را فراهم می‌کند. از منابع دیگر ارزشیابی که می‌تواند در کنار ارزشیابی دانشجویی برای بررسی کیفیت آموزش و درس به‌کار برد، ارزشیابی ازسوی همکاران، بررسی‌های آموزشگر و خود ارزشیابی ازسوی مدیر یا کمیته آموزشی یا هر دو است (Brent and Felder, 2004).

درصورتی‌که قصد بررسی کیفیت آموزش دانشگاهی وجود داشته باشد، هریک از گروه‌ها می‌توانند در مورد جنبه‌هایی از موضوع قضاوت کنند و نباید انتظار داشت که فقط یک گروه بتوانند همه جنبه‌های آموزش دانشگاهی را ارزشیابی کنند. اگر کیفیت آموزش از دیدگاه همه این گروه‌ها بررسی شود، تصویر نسبتاً جامعی حاصل می‌شود. در نگاره 1، در قالب یک نظام فراگیر، ارزشیابی دانشجویی با ارزشیابی ازسوی گروه‌های دیگر مقایسه شده است.
در نگاره 1، ابعادی که هریک از گروه‌ها باید آن را ارزشیابی کنند، مشخص شده است. منظور از ابزارها و روش‌های ارزشیابی:
الف) تکالیف، آزمون‌ها و سازوکارهایی برای دریافت بازخوردهای دانشجویان است.
ب) در قسمت ارزشیابی ازسوی دانشجو، تعاملات خارج از کلاس به‌معنای در دسترس بودن آموزشگر و کمک به دانشجویان در ساعات رسمی است.
ج) عنصر راهنمایی و نظارت نیز مربوط به نقش نظارتی آموزشگر در انجام پژوهش است.
د) در ارزشیابی ازسوی همکاران، مواد و مطالب آموزشی دربردارنده سرفصل‌ها، اهداف یادگیری، راهبردها و روش‌ها و آزمون‌هاست.
ه‍‌) در قسمت خودارزشیابی، اصطلاح کلیه فعالیت‌های تربیتی شامل تدریس، راهنمایی، نظارت، تدوین درس‌ها، تولید مواد آموزشی و انجام پژوهش‌های تربیتی است.
و) سرانجام، منظور از منابع و مطالب حمایتی دیگر مواردی مانند نامه‌ها و نوشته‌های دانشجویان، دانش‌آموختگان، دیگر اعضای هیئت‌علمی دانشگاه و اعضای هیئت‌علمی دانشگاه‌های دیگر است (Brent and Felder, 2004).
در نهایت، کارنما یا پوشه کار، مبنایی مستحکم برای ارزشیابی عملکرد تدریس اعضای هیئت‌علمی فراهم می‌آورد و در بهبود فرایند تعلیم و تربیت نقش اساسی دارد.

نقاط قوت ارزشیابی دانشجویی
هریک از روش‌های ارزشیابی در بعضی موارد مناسب و دارای نقاط قوت و در موارد دیگر نامناسب است. در این قسمت، نقاط قوت روش ارزشیابی دانشجویی با پنج عنوان مجزا بررسی می‌شود.
1. روایی یافته‌ها: با مقایسة روش‌های ارزشیابی و در حمایت از روش ارزشیابی دانشجویی، رمزدن (Ramsden, 1992) بیان می‌کند اجماع صاحب‌نظران بر این باورند که هیچ روشی بالقوه به اندازة ارزشیابی دانشجویی برای ارزشیابی عملکرد تدریس روا نیست. همچنین کشین (Cashin, 1995)، یکی از صاحب‌نظران ارزشیابی، پس از بررسی پژوهش‌های انجام‌شده، این‌گونه اظهارنظر می‌کند: در کل، ارزشیابی دانشجویی ازنظر آماری تمایل به این جهت دارد که روا و قابل اعتماد و تقریباً از جانبداری نیز دور باشد. البته این نوع اظهارنظرها در مقام مقایسه است، وگرنه ترکیب روش‌های ارزشیابی نتایج معتبرتری نسبت به ارزشیابی دانشجویی به‌دست می‌دهد. ازطرف‌دیگر، ارزشیابی دانشجویی، به‌رغم همة قوّت‌ها، فقط یک نشانه از عملکرد تدریس است.
واچتل (Wachtel, 1998) پژوهش‌هایی را که طی هفتاد سال گذشته در مورد ارزشیابی دانشجویان از تدریس استادان انجام شده، بررسی کرده است. وی، ضمن بیان دیدگاه‌های مثبت و منفی دربارة این نوع ارزشیابی، که از پژوهش‌های گوناگون به‌دست آمده است، چنین نتیجه‌گیری می‌کند: با اطمینان می‌توان گفت بیشتر پژوهشگران بر این باورند که ارزشیابی دانشجویان روشی معتبر، قابل اعتماد و ابزاری با ارزش برای ارزشیابی تدریس است. در واقع، ارزشیابی‌های دانشجویان تنها نشانگر تعیین‌کنندة اثربخشی تدریس است که روایی آن کامل و قاطع ثابت شده است. در همین زمینه، کولیچ و دین (Kolitch and Dean, 1999) اظهار داشته‌اند که پژوهش‌های فراوانِ انجام‌شده در مورد روایی و پایایی نتایج ارزشیابی‌های دانشجویی، به استفادة گسترده از این روش در دنیا انجامیده است.
2. همبستگی بین ارزشیابی دانشجویی و سایر روش‌ها: وجود رابطه بین نتایج ارزشیابی دانشجویی و ارزشیابی‌هایی که برمبنای سایر روش‌ها به‌دست آمده است دلیلی برای اعتبار ارزشیابی‌های دانشجویی است. ازجملة این پژوهش موری (Murray, 1980) است. او گزارش کرده است که بین ارزشیابی مشاهده‌گران مستقل و ارزشیابی دانشجویی همبستگی بالایی وجود دارد. همچنین رمزدن (Ramsden, 1991) گزارش کرده است که رابطة مثبتی بین ارزشیابی‌های دانشجویی و پیشرفت تحصیلی دانشجویان وجود دارد. در پژوهشی دیگر، برای بررسی میزان همبستگی دو روش استفاده از پرسش‌های نگرش‌سنج و سؤال‌های بازپاسخ، اظهارنظرهای نوشتاری 3240 دانشجو و نظرهای آنان روی پرسشنامه‌های بسته‌پاسخ را براس‌کمپ و اوری (Braskamp et al., 1981) بررسی کردند. آنان دریافتند که همبستگی فراوان معناداری بین دو روش یادشده وجود دارد.
در پژوهشی که به سبک مصاحبة ژرف با 50 نفر از استادان برجستة دانشگاه سیدنی انجام شده است، آنها پذیرفته‌اند که ارزشیابی‌های دانشجویی تعیین‌‌کنندة کیفیت تدریس آنهاست (Lewis, 1993).
مارش و روچ (Marsh and Roche, 1997) نیز، برای بررسی میزان همبستگی ارزشیابی دانشجویان از تدریس با سایر روش‌ها، پژوهشی انجام دادند. آنها دریافتند که همبستگی بالایی بین نظرهای دانشجویان کنونی و دانش‌آموختگان و همچنین، همبستگی متوسط خوبی بین نظرهای دانشجویان و خودارزشیابی اعضای هیئت‌علمی وجود دارد. این پژوهش همچنین نشان داد که بین ارزشیابی مشاهده‌گران آموزش‌دیده و نظرهای دانشجویان رابطه وجود دارد. برخلاف موارد فوق، بین نتایج ارزشیابی دانشجویان و ارزشیابی همکاران و مدیران از تدریس اعضای هیئت‌علمی همبستگی وجود نداشت؛ اما، در مجموع، همبستگی نسبتاً خوبی بین ارزشیابی دانشجویی و سایر روش‌ها وجود داشته است.
3. دستیابی به چهار هدف عمدة ارزشیابی: ارزشیابی انواع و اهداف گوناگونی دارد که بعضی از انواع آن می‌تواند هدف خاصی را بهتر از موارد دیگر تحقق بخشد. در مورد ارزشیابی ازسوی دانشجویان، متخصصان اظهارنظر کرده‌اند که این روش برای دستیابی به چهار هدف عمدة بهبود تدریس، ارتقا و تشویق استادان، انتخاب درس ازسوی دانشجویان و انجام پژوهش مناسب است (Marsh and Roche, 1993; McKeachie, 1994).
چون دانشجو، در مدت زمان زیادی، از نزدیک تدریس استاد را درک می‌کند، وی بهترین منبعی است که می‌تواند در مورد کیفیت تدریس او نظر بدهد. ازاین‌رو، دیدگاه دانشجو در مورد نقاط ضعف و قوت تدریس استاد می‌تواند مبنای بهبود کیفیت تدریس قرار گیرد. برای کسب نظرهای دانشجویان معمولاً از پرسشنامه‌های نگرش‌سنج استفاده می‌شود. ولی بعضی از مؤسسه‌ها و استادان، برای دریافت نظرهای بیشتر برای اصلاح و بهبود کیفیت تدریس خود، پرسش‌های باز را ترجیح می‌دهند. توجیه آنها این است که پاسخ این نوع سؤال‌ها کمک فراوانی به بهبود تدریس آنان می‌کند و می‌تواند نقاط ضعف و قوت آنها را به‌خوبی نشان دهد. به‌رغم این مزیت، از معایب پرسشنامه‌های پاسخ باز این است که چه‌‌بسا بعضی دانشجویان، به‌خاطر ترس از شناخته شدن دست‌خط‌های خود، از نوشتن نکات منفی دوری کنند. ازطرف‌دیگر، کمّی کردن نظرها کار دشوار و پرهزینه‌ای است که مؤسسه‌ها معمولاً توان انجام آن را ندارند. برای استفاده از مزایای این دو روش، مناسب است که بیشتر از پرسشنامه‌های بسته‌پاسخ استفاده شود. ولی با طرح پرسش‌های بازپاسخ یا در نظر گرفتن محلی برای اظهار‌نظر، این امکان به دانشجو داده می‌شود تا سایر اظهارنظرهای خود را عرضه کند. علاوه‌براین، در مواردی که استاد یا مؤسسة آموزش عالی نیاز به اطلاعات بیشتری داشته باشد، می‌تواند با تعدادی از دانشجویان مصاحبه کند.
4. استفاده از مشاهدات دست اول دانشجویان: به نظر می‌رسد حمایت گسترده و جدی پژوهشگران از ارزشیابی‌های دانشجویی در مؤسسات آموزش عالی بدین‌خاطر است که دانشجویان در طول یک نیمسال تحصیلی در محل تدریس استاد حضور دارند؛ بنابراین به همة توانمندی‌ها و زوایای رفتاری وی پی‌ می‌برند. به گفتة کروکس (Crooks, 1990)، دانشجویان بهترین مشاهده‌گر و گزارش‌کنندة چگونگی تدریس استادان هستند. ازسوی‌دیگر، آنان بهتر از هر فرد دیگری می‌توانند تشخیص دهند که آیا استاد توانسته است به‌صورت مستقیم یا غیرمستقیم (تعیین تکالیف و فعالیت‌های کلاسی) مطالب درسی را به آنان انتقال دهد یا خیر. باوجود ضعف‌هایی در ارزشیابی دانشجویی، باید پذیرفت دانشجویی که ساعت‌ها در کلاس درس استادی حضور داشته، در ساعات راهنمایی به وی مراجعه کرده و تکالیف متعدد کلاس را انجام داده است، احتمالاً از استاد بازخورد دریافت داشته و در امتحانات آن کلاس نیز شرکت کرده است، می‌تواند از بعضی جهات به‌خوبی استاد را ارزشیابی کند. بنابراین، می‌توان گفت دانشجو اصلی‌ترین و دست‌اول‌ترین منبع اطلاعات برای داوری در مواردی چون برخورد استاد با دانشجویان، توانایی تدریس وی و دستیابی به هدف‌های آموزشی است. به‌همین‌منظور، مک‌کیچی (Mckeachie, 1990) می‌نویسد: به‌رغم تردیدهایی که اعضای هیئت‌علمی در مورد توانایی دانشجویان برای بررسی و ارزشیابی تدریس خوب دارند، پژوهش‌ها نشان داده است که در مجموع، آنان داوران خوبی در این مورد هستند. بنابراین، استادان، به‌جای اینکه ضعیف بودن نتیجة ارزشیابی خود را همواره به ضعیف بودن قضاوت دانشجویان و وجود اشکال در فرایند ارزشیابی نسبت دهند، باید دربارة چگونگی فعالیت‌های آموزشی خود بیندیشند و درصدد پیدا کردن نقاط ضعف خود باشند. مشاوره با مدیر گروه و همکاران باتجربه و مطالعه پیرامون اصول و مهارت‌های تدریس می‌تواند رهنمودهای ارزنده‌ای به همراه داشته باشد.
5. سهولت اجرا آسان و هزینه‌های نسبتاً کم: استفاده از دانشجویان برای ارزشیابی تدریس، به‌ویژه استفاده از پرسشنامه‌های بسته‌پاسخ، ساده‌ترین روش ارزشیابی است (سیف، 1376).
اگرچه تدوین این پرسشنامه‌ها و اعتبارسنجی آنها نسبتاً دشوار و وقت‌گیر است، اجرا و نمره‌گذاری آنها بسیار ساده است. هم‌هنگام، هزینه‌های نسبتاً کم این روش نسبت به سایر روش‌ها از عوامل فراگیر شدن آن در دنیاست. جالب اینکه در مجموع، مسئولان و استادان دانشگاه نسبت به انجام این‌گونه ارزشیابی‌ها علاقه‌مند و مشتاق‌اند (Kolitch and Dean, 1999).

محدودیت‌های ارزشیابی دانشجویی
به‌رغم برتری‌هایی که برای ارزشیابی دانشجویی بیان شد، انتقادهایی نیز از آن شده است که در شش قسمت به تشریح آنها می‌پردازیم:
1. نبود توافق در مورد ملاک‌های تدریس اثربخش: از ایرادهایی که واچتل (Wachtel, 1998) به ارزشیابی دانشجویی وارد دانسته است نبود توافق بین صاحب‌نظران در مورد معیارهای تدریس اثربخش است. متخصصان تدریس، استادان و دانشجویان دانشگاه معیارهایی برای تدریس اثربخش بیان کرده‌اند؛ اما دیدگاه‌های آنان کاملاً یکسان نیست. بنابراین، استادان از دیدگاه خود به تدریس اثربخش می‌نگرند و برمبنای آن تدریس می‌کنند و در مقابل، دانشجویان تدریس را برمبنای دیدگاه‌های خود ارزشیابی می‌کنند. البته این نبود توافق در مورد ملاک‌های ارزشیابی مشکل همة روش‌های ارزشیابی است و به ارزشیابی دانشجویی از تدریس منحصر نمی‌شود.
بیان ویژگی‌های تدریس اثربخش ازاین‌رو مشکل است که استاد باتوجه‌به ویژگی‌های گوناگون، ازجمله توانایی دانشجویان و محیط تدریس، باید به سبک خاصی تدریس کند. گاه ضرورت ایجاب می‌کند که استاد بر مباحث ذهنی تأکید کند و گاه بر مباحث عاطفی. گاهی استاد باید انتقال‌دهندة دانش باشد و گاهی درصدد رشد قدرت تفکر و اتکابه‌نفس دانشجویان برآید. ازسوی‌دیگر، کلاس درس، سالن کنفرانس، آزمایشگاه و کوه و صحرا، که محیط تدریس بعضی از درس‌هاست، شرایط خاصی دارند که استاد باید به آنها نیز توجه کند.
موارد یادشده از مسائلی است که ایجاب می‌کند اصول متفاوتی در تدریس مراعات شود و همین مسئله تبیین اصول تدریس اثربخش را مشکل می‌سازد. ازاین‌رو، ارزشیابی درس‌های گوناگون باید باتوجه‌به اصول مربوط به آن انجام شود (Cannon and Newble, 2000).
ازسوی‌دیگر، همواره باید به ویژگی‌های اساسی تدریس توجه داشت. بعضی از این ویژگی‌ها، که مورد توافق اعضای هیئت‌علمی، مدیران و دانشجویان دانشگاه ویسکانسین قرار گرفته، عبارت‌اند از:
· توانایی ایجاد انگیزه در دانشجویان؛
· ایجاد محیط یادگیری مثبت؛
· ایجاد چالش‌های مناسب در دانشجویان به تناسب درس؛
· توجه به نیازهای علمی و سبک‌های مختلف یادگیری دانشجویان.
دراین‌راستا، مارش (Marsh, 2001) می‌نویسد: شواهد پژوهشی قطعی و بدون ابهامی وجود ندارد که بیانگر مفهوم تدریس اثربخش باشد. وی در ادامه می‌افزاید که اگرچه می‌توان معیارهایی برای آموزشگران با کیفیت و کارامد بیان کرد، نمی‌توان با قطعیت فهرستی از معیارها را تنظیم کرد تا برای همة آموزشگران قابل استفاده باشد. در بیان تقریباً مشابهی، مک‌کیچی (Mckaeachie, 1997) نیز بیان کرده است که تدریس اثربخش روشی نیست که همواره خوب کار کند. آنچه در مورد یک دانشجو یا کلاس مؤثر است ممکن است در جای دیگر مؤثر نباشد.
مورد دیگری که به پیچیدگی تدریس و در پی‌ آن، ارزشیابی می‌انجامد این است که تدریس آمیزه‌ای از علم و هنر است که سنجش ابعاد هنری دشوارتر از بعد علمی آن است. علاوه‌براین، کم‌تجربه بودن دانشجویان، به‌ویژه دانشجویان سال‌های اول و دوم و کم بودن آگاهی آنان از ویژگی‌های تدریس خوب در دانشگاه موجب می‌شود تا دانشجویان نتوانند تدریس را به‌خوبی ارزشیابی کنند.
2. نبود توافق در مورد ماهیت تدریس: این انتقاد وجود دارد که برداشت استادان و دانشجویان در مورد چگونگی تدریس در دانشگاه متفاوت است؛ برای مثال، ممکن است یک استاد علوم انسانی نقش خود را طرح مسئله بداند و از دانشجویان بخواهد که جواب آن را با مطالعة منابع مربوط و گفت‌وگو با استاد و هم‌کلاسان خود پیدا کنند. در این شیوه، استاد تسهیل‌ یادگیری و نه صرفاً انتقال‌ دانش، را برعهده دارد. درحالی‌که استاد دیگری ممکن است پس از طرح مسئله، خود بدان پاسخ دهد. بعضی از استادان ممکن است تصور کنند استادی که به سبک نخست تدریس می‌کند نمرة ارزشیابی پایین و دومی نمرة بالا می‌گیرد. همچنین، ممکن است استادان سخت‌گیر و افرادی که چشمداشت بسیاری از دانشجویان دارند نمره‌های کمتری در ارزشیابی به‌دست آورند. ضمن اعتراف به وجود این ضعف‌ها، برای بررسی میزان ثبات در برداشت دانشجویان و دانش‌آموختگان دربارة تدریس، اورآل و مارش (Overall and Marsh, 1980) پژوهشی انجام دادند. این دو پژوهشگر میزان همبستگی ارزشیابی دانشجویان صد درس را در زمان تحصیل و دست‌کم یک سال پس از دانش‌آموخته شدن بررسی کردند. همبستگی بین این دو مجموعه 83% بود و از بلوغ دانشجویان در ارزشیابی از تدریس استادان حکایت می‌کرد. دلیل انتخاب دانش‌آموختگان این بود که چون بعضی از آنان در رشته‌های تخصصی خود مشغول به‌کار شده بودند و نیازها و واقعیت‌ها را لمس می‌کردند، بهتر می‌توانستند چگونگی تدریس استادان دوران تحصیل خود را ارزشیابی کنند. وجود همبستگی بین ارزشیابی دانشجویان و دانش‌آموختگان در پژوهشی نسبتاً جدید مارش و روچ (1997) باز تأیید شده است.
3. مهارت ناکافی دانشجویان برای ارزشیابی بعضی از حیطه‌های تدریس: عده‌ای می‌پندارند دانشجویان برای ارزشیابی بعضی از جنبه‌های مهم تدریس صلاحیت لازم را ندارند؛ برای مثال، رمزدن (Ramsden, 1991) می‌نویسد: دانشجویان نمی‌توانند مقدار زمان و کوششی را محاسبه و ارزشیابی کنند که استاد درس برای تدوین و ارائه محتوای درس در کلاس صرف کرده است. افزون‌براین، آنها نمی‌توانند در مورد موضوعاتی مانند میزان ارتباط محتوا با موضوع درس، کیفیت و به‌روز بودن آن به‌صورت معتبر ارزشیابی کنند.
از دیگر مواردی که دانشجویان توان ارزشیابی عادلانة آن را ندارند میزان دانش تخصصی استادان دربارة موضوع تدریس است. موارد یادشده از‌جمله مواردی است که همکاران بهتر از دانشجویان می‌توانند در مورد آن قضاوت کنند. ازاین‌رو، در پژوهشی که 50 نفر از استادان برگزیده دانشگاه سیدنی در آن شرکت داشتند، ضمن قبول ارزشیابی دانشجویی برای جواب‌گویی به بعضی از سؤالات، استفاده از آن را برای ارتقای استادان نپذیرفتند. این موضوع زمانی شدت می‌یابد که مسئولان مربوط بیش از اندازه به تفاوت‌های عددی ناچیز داده‌های ارزشیابی توجه کنند (Lewis, 1993).
برخی پژوهشگران، ضمن پذیرش ناکافی بودن توانایی دانشجویان در ارزشیابی بعضی از حیطه‌های تدریس، توضیح داده‌اند که دانشجویان توانایی ارزشیابی موارد زیر را دارند: «آنچه در کلاس فرا گرفته‌اند، قدرت استاد در برقراری ارتباط با دانشجویان، میزان آمادگی استاد برای عرضه درس و در دسترس بودن استاد برای پاسخ‌گویی به سؤالات» (Lally and Myhill, 1994; Menges, 1994).
در ضمن، موارد دیگری را به این مقوله‌ها اضافه کرده‌اند که عبارت‌اند از توانایی استاد در عرضه دقیق و واضح مطالب، با ارزش و مناسب‌بودن مواد خواندنیِ در نظر گرفته شده، امتحانات و تکالیف تعیین شده.
4. تحت‌تأثیر قرارگرفتن دانشجویان: این امکان وجود دارد که بعضی استادان با شگردهای خاصی رضایت دانشجویان را جلب کنند و موجب شوند تا ارزشیابی آنان برخلاف واقع خوب جلوه کند. در این راستا، نتایج بعضی از پژوهش‌ها نشان داده است که «دانشجویان در ارزشیابی از کار استادان خود بیشتر زیر تأثیر ارزش سرگرم‌کنندگی درس و آموزش آموزشگر قرار گرفته‌اند و کمتر به کیفیت و محتوای درس و روش آموزش او توجه می‌کنند» (سیف،‌ 1370).
طرفداران این نظر معتقدند استادانی که در تدریس خود از شیوه‌های سرگرم‌کننده استفاده می‌کنند و با زبردستی در نحوة بیان و انجام سایر کارهای مورد رضایت دانشجویان، خود را استادی باسواد و خوب جلوه می‌دهند، می‌توانند نمرة بهتری در ارزشیابی کسب کنند.
انتقاد مشابه دیگری که سیف (1370) بررسی کرده این است که به باور تعدادی از پژوهشگران ارزشیابی ازسوی دانشجویان، زیر تأثیر عوامل کلی، از‌جمله شهرت خوب و بد، سخت‌گیری و آسان‌گیری آموزشگر، یا شیوه برخورد مثبت و منفی او با شاگردان قرار می‌گیرد. این پدیده موجب می‌شود که دانشجویان زیر تأثیر عوامل یادشده قرار گیرند و نتوانند ابعاد گوناگون تدریس را به‌طور واقعی ارزشیابی کنند. این انتقاد در پژوهشی که سیف (1370) انجام داد، تأیید شد. وی یافته‌های خود را به اظهارنظر دانکین و بارنز (Dankin and Barnes, 1986) مستند کرده است. آنها می‌پندارند پژوهش‌های روان‌شناسی چند دهة گذشته، به وضوح نشان داده است که صفات شخصیتی و ویژگی‌های کلی محیطی، بر ادراک‌ها و قضاوت‌های افراد تأثیر می‌بخشند. در همین باره، گرجی (1376) در پژوهشی که در دانشگاه‌های اصفهان انجام داده، ادعا کرده است که ضریب همبستگی معناداری بین محبوبیت اجتماعی استادان نزد دانشجویان و ارزشیابی آنها از عملکرد تدریس استادان وجود داشته است. اگرچه این پژوهش از یک طرح سادة همبستگی استفاده کرده و نتایج آن نمی‌تواند از اعتبار آماری بالایی برخوردار باشد، اما می‌تواند بسان یک نشانگر مورد توجه قرار گیرد.
5. نامناسب بودن ابزار و شیوه‌های اجرا و تجزیه‌و‌تحلیل: تهیة ابزار معتبر و قابل اعتماد، به‌ویژه پرسشنامه‌های بسته‌پاسخ، برای ارزشیابی دانشجویان از تدریس کار دشواری است. اما ممکن است همة مراکز و دانشگاه‌هایی که از این روش استفاده می‌کنند ابزار مناسبی در دست نداشته باشند. در مورد اهمیت این مسئله، رمزدن و دادز (Ramsden and Dodds, 1989) اظهار داشته‌اند که در تهیه و تدوین سؤالات ارزشیابی و جمع‌آوری و تجزیه‌و‌تحلیل داده‌ها، باید دقت و توجه بسیار زیادی داشت، زیرا مهارت فراوانی برای انجام این امور لازم است.
بعضی از منتقدان با انجام ارزشیابی دانشجویی مخالف نیستند، بلکه به شیوة عرضه نتایج و استفاده از آن انتقاد می‌کنند. این عده باور دارند که نمی‌توان نمره‌های به‌دست آمده از جنبه‌های گوناگون تدریس را با یکدیگر جمع کرد و سپس میانگین گرفت و این نمرة واحد را مبنای قضاوت قرار داد. این گروه می‌پندارند دست‌کم نمره‌های پرسش‌های گوناگون ارزشیابی باید در چندین حیطة جداگانه محاسبه شوند و ارزش عددی حیطه‌های گوناگون مبنای قضاوت قرار گیرد. در همین زمینه، انتقاد دیگری که به پرسشنامه‌های ارزشیابی وارد می‌شود این است که به‌رغم ماهیت تقریباً متفاوت بعضی از رشته‌ها و ضرورت طرح حیطه‌های متفاوت، یا تأکید بر آنها در ارزشیابی، درحال‌حاضر، رشته‌های گوناگون با یک پرسشنامه ارزشیابی می‌شوند و بدتر اینکه با یکدیگر مقایسه نیز می‌شوند. دست‌کم در مواقعی که قرار است ارزشیابی دانشجویی برای مواردی مانند ارتقا استفاده شود، باید از مقایسة نتایج ارزشیابی استادان در رشته‌ها و دانشکده‌های گوناگون پرهیز شود. البته انجام مقایسه بین رشته‌هایی که تدریس در آنها تقریباً مشابه است بلامانع است.
6. تغییر در روند صحیح تدریس: از ایرادهای وارد بر ارزشیابی دانشجویی، امکان سوق دادن استادان به‌سمت معیارهای مورد نظر دانشجویان در تدریس است، برای مثال، ممکن است تعدادی از دانشجویان اهل مطالعة عمیق نباشند، یا فرصت آن را نداشته باشند. این‌گونه افراد معمولاً انتظار دارند که استاد ساده بگیرد. اگر استادی بر سخت‌گیری خود و بر انجام آنچه به صلاح واقعی این دانشجویان است اصرار ورزد، احتمالاً نمرة خوبی در ارزشیابی کسب نخواهد کرد.
در این زمینه، تعدادی از پژوهشگران ادعا کرده‌اند که دانشجویان سبک‌های گوناگونی در یادگیری دارند. ازاین‌رو، شیوه‌های تدریسِ مورد پسند آنها نیز متفاوت است. تعدادی از دانشجویانی که به یادگیری سطحی تمایل دارند علاقه‌مندند که کار اصلی استاد انتقال دانش باشد. درحالی‌که دانشجویانی که به دنبال یادگیری ژرف هستند، عموماً به روش‌های تدریس و محتواهایی تمایل دارند که چالش‌های فکری و ذهنی به دنبال داشته باشد (Timpson and Andrew, 1997).
ازآنجاکه آزمون فعلی ورود به دانشگاه در ایران برمبنای پرسش‌های چند گزینه‌ای است، بسیاری از دانش‌آموزان، به‌ویژه دانش‌آموزان سال‌های آخر دبیرستان، بیشتر خود را برای این‌گونه آزمون‌ها آماده می‌کنند و بنابراین مطالعات آنها سطحی است. برعکس، در کلاس‌های دانشگاه، معمولاً به شیوه‌هایی که بر مطالعات ژرف استوار است تدریس می‌شود. بنابراین، بسیاری از دانشجویان در فهم درس‌ها با مشکلاتی روبه‌رو می‌شوند. این گروه از دانشجویان ممکن است علت کسب نکردن موفقیت کامل خود را شیوه‌های تدریس استادان بدانند و توقع داشته باشند که استادان دانشگاه نیز به سبک دبیرستان عمل کنند. در این شرایط، اگر استادان با فشار جمع فراوانی ازسوی دانشجویان روبه‌رو شوند، ممکن است شیوه‌های تدریس خود را در جهت خواست آنان تغییر دهند.
از مباحث مطرح‌شده، می‌توان نتیجه گرفت ارزشیابی دانشجویی استفادة گسترده‌ای در دنیا یافته است. به‌رغم وارد بودن برخی از انتقادها به این روش، بسیاری از پژوهشگران آن را برای سنجش بعضی از ابعاد تدریس روشی معتبر و قابل‌اعتماد می‌دانند. هم‌هنگام، تأکید شده است که استفاده از یک ابزار (ارزشیابی دانشجویی) تصویری ناقص و گاه غیردقیق از اثربخشی تدریس آموزشگر عرضه می‌کند. دانشجو فقط یکی از منابع جمع‌آوری اطلاعات به حساب می‌آید و نباید استفاده از سایر روش‌ها فراموش شود (Timpson and Andrew 1997; University of Wisconsin-Green Bay, 1998).
چرا که ارزشیابی دانشجویی زمانی بیشترین فایده را خواهد داشت که بخشی از یک برنامه ارزشیابی فراگیر باشد که شامل ابزارهای ارزشیابی مختلف و نیز طرح نظام‌مند برای توسعه حرفه‌ای هیئت‌علمی است (Kaufman, 2002).
بسیاری از پژوهشگران جایگاه ممتاز و ویژه‌ای را برای روش دانشجویی، نسبت به سایر روش‌ها، قائل شده‌اند و بر استفاده از آن در هر ترکیبی از روش‌ها تأکید کرده‌اند (Ramsden, 1991; Kolitch and Dean, 1999).
همچنین، این نکته را نیز باید به خاطر داشت که کارامدی و دقت ارزشیابی دانشجویی به مسائل بسیاری مربوط می‌شود که باید مورد توجه قرار گیرند. ازجملة آن موارد مناسب بودن ابزار، فرایند جمع‌آوری اطلاعات، نمره‌گذاری، تجزیه‌وتحلیل، تفسیر و قضاوت برمبنای داده‌هاست.
پس از بررسی محدودیت‌ها و قوّت‌های ارزشیابی دانشجویی، می‌توان نتیجه گرفت که نقاط قوّت این روش به اندازه‌ای است که آن را کارامد می‌سازد. البته، همان‌طورکه گفته شد، باید احتیاط‌های لازم در تهیة ابزار، جمع‌آوری داده‌ها، تجزیه‌و‌تحلیل و تفسیر داده‌ها صورت پذیرد. در این رابطه، مک‌کیچی (Mckeachie, 1990)، یکی از صاحب‌نظران ارزشیابی، ضمن پذیرش برخی نقطه ضعف‌ها در این روش، اظهار می‌دارد که گرچه وجود این ضعف‌ها تا حدودی موجب می‌شود ارزشیابی استادان کاملاً درست انجام نشود، ولی این اختلاف داوری به حدی نیست که یک استاد ضعیف را خوب ارزشیابی کند و یا برعکس.
گفته شد که برای انجام ارزشیابی و قضاوت صحیح، باید دیدگاه افراد مختلف، ازجمله دانشجویان، همکاران، مدیران دانشگاهی و خود افرادِ مورد ارزشیابی، مدِنظر قرار گیرد. این برای آن است که توانمندی‌های تدریس ابعاد گوناگونی دارد که هرکدام از افراد یادشده تنها می‌توانند در یک یا چند مورد آن بهتر داوری کنند؛ برای مثال، دانشجویان بهترین افرادی هستند که می‌توانند در مورد توانایی انتقال مطالب استاد به دانشجویان قضاوت کنند و همکاران بهترین افرادی هستند که می‌توانند در مورد مناسب بودن محتوای عرضه‌شده در کلاس درس اظهارنظر کنند.
براساس همین توجیه، تیل و فرانکلین (Theall and Franklin, 2001) بر این باورند که نمی‌توان انتظار داشت دانشجویان منبع اصلی عرضه بازخورد در مورد محتوای درس و چگونگی همکاری عضو هیئت‌علمی در گروه یا دانشکده باشند. ازسوی‌دیگر، همکاران دارای این موقعیت نیستند که بدانند در بستر فعالیت‌های روزمره کلاس چه می‌گذرد و دانشجویان چگونه و با چه کیفیتی برنامه درسی اجرا شده را تجربه می‌کنند. نگاه منطقی و یافته‌های پژوهشی مؤید این است که در مورد اخیر، دانشجویان یکی از معتبرترین منابع برای کسب این اطلاعات هستند.
فرایند تدریس بسیار پیچیده‌تر از یک فرایند سادة درون‌داد- برون‌داد است. بنابراین در ارزشیابی دقیق و کامل باید از نظرسنجی دانشجویان فراتر رفت تا تصویر روشنی از عملکرد اعضای هیئت‌علمی به‌دست آید. ازاین‌رو، توصیه می‌شود در مواردی که دانشجویان تجربة مستقیم دارند، از نظرهای آنها استفاده شود و در سایر موارد، از دیدگاه سایر منابع ارزشیابی بهره‌گیری شود.
ارزشیابی دانشجویی فواید و نقاط مثبت فراوانی دارد. ولی فقط با استفاده از این روش نمی‌توان همة اهداف ارزشیابی را محقق ساخت. دراین‌باره، سیف (1370 و 1375)، به‌رغم انتقاد‌هایی که بر ارزشیابی دانشجویی وارد دانسته، می‌پندارد که دانشجویان به‌شدت زیر تأثیر قدرت سرگرم‌کنندگی استاد و صفات شخصیتی و ویژگی‌های کلی محیطی قرار می‌گیرند. در ضمن، او استفاده از ارزشیابی دانشجویی را در مواردی تجویز کرده و می‌نویسد که اگر در استفاده از این روش احتیاط‌های لازم، ازقبیل داشتن ابزار مناسب و گرد‌آوری صحیح اطلاعات، به‌عمل آید و از نتایج آن برای بهبود کیفیت تدریس استفاده شود، نباید نگران بود. وی می‌افزاید که هنگام استفاده از ارزشیابی دانشجویی برای تصمیم‌گیری‌های شغلی، باید از سایر روش‌های ارزشیابی به‌منزلة روش مکمل استفاده کرد (سیف، 1375؛ سیف، 1370).
همچنین، شایسته است که از دروس متفاوتی که استاد در گروه‌های آموزشی گوناگون و سال‌های متعدد تدریس کرده است ارزشیابی به‌عمل آید (سیف، 1376).
جدول 1. وزن نظرهای دانشجویان و همکاران در
ارزشیابی تدریس استادان

مقوله‌های تدریس

دانشجو (درصد)

همکار (درصد)

مجموع (درصد)

مهارت طراحی آموزشی، مانند سازماندهی محتوای درسی

10

15

25

محتوای مناسب، مانند تناسب داشتن محتوا با اهداف درسی

10

15

25

مهارت در ارائة آموزش، مانند داشتن بیان مناسب

25

--

25

تخصص در محتوای درس، مانند مناسب بودن مثال‌ها

6

9

15

مدیریت کلاس، مانند در دسترس بودن استاد در ساعات مقرر

10

--

10

مجموع

61

39

100

اگر بپذیریم که دانشجویان نمی‌توانند در مورد همة ابعاد تدریس داوری کنند، این پرسش مطرح می‌شود که در یک نظام ارزشیابی فراگیر که باید داده‌ها از راه‌های مختلف تهیه شود، تا چه حد باید به نظر دانشجویان اهمیت داد؟ به‌عبارت‌دیگر، برای نظر دانشجویان چه وزنی باید قائل شد؟ نگارنده به پاسخ قاطعی در متون تخصصی مربوط برخورد نکرده است. اما تعداد کمی از دانشگاه‌ها، ازجمله دانشگاه پوردو (Purdue University, 1998)، وزن‌هایی را مشخص کرده‌اند. این دانشگاه، که ارزشیابی از تدریس را در پنج مقوله به‌شرح جدول 1 در دو پرسشنامة جداگانه ازسوی دانشجو و همکاران انجام می‌دهد، در مجموع، 61% سهم برای دانشجو و 39% سهم برای همکاران قائل شده است.
آنچه باید به‌منزلة یک اصل اساسی مدِنظر قرار گیرد این است که نباید بیش از حد به شواهد و نتایج به‌دست آمده از هیچ‌یک از منابع ارزشیابی‌کننده متکی بود.
اگرچه ارزشیابی دانشجویی می‌تواند برای ارتقای کیفیت تدریس مفید باشد، اما الزاماً این نتیجه حاصل نمی‌شود. به‌عبارت‌دیگر، ارائة نتایج ارزشیابی به استادان تغییرات وسیعی در تدریس آنها به وجود نمی‌آورد، بلکه استادان نیاز دارند بدانند تدریس کارامد چه ویژگی‌هایی دارد و چگونه می‌توانند تغییرات لازم را در تدریس خود ایجاد کنند. به نظر می‌رسد استادان علاقه‌مند به ارتقای تدریس از این‌گونه آموزش‌ها استقبال خواهند کرد.
برخی پژوهش‌ها نشان داده است که اگر نتایج ارزشیابی‌های دانشجویی با مشاورة متخصصان و آموزش‌های لازم برای بهبود کیفیت تدریس همراه شود، مقاومت استادان در مقابل ارزشیابی‌های دانشجویی نیز کاهش می‌یابد (Arreola and Aleamoni, 1990).
نتیجه دلخواه ارزشیابی‌های دانشجویی هنگامی حاصل می‌شود که فقط به نتایج کمّی و عددی بسنده نشود، بلکه به این موضوع نیز توجه شود که چگونه نتایج پایین ارزشیابی استادان می‌تواند به نتایج بهتری تبدیل شود. بدیهی است اگر در این فرایند از مشاورة افراد باتجربه و متخصص استفاده شود، نتایج بهتری حاصل می‌شود.
اگرچه مطالب بسیاری در تأیید ارزشیابی دانشجویی بیان شد، باید توجه داشت که داده‌های آماری به‌دست آمده را افراد مطلع باید تفسیر کنند و پس از آن، قضاوت نهایی عرضه شود؛ برای مثال، اگر درسی برای نخستین‌بار به فردی واگذار شود، نباید انتظار داشت که نمرة ارزشیابی او با فردی برابر باشد که چندین بار آن را تدریس کرده است. همچنین، اگر در یک نیمسال اتفاق‌های ناگواری برای استاد پیش آید، نباید انتظار داشت که نمرة وی همانند دیگران باشد. از موانع دیگر، نبودن تسهیلات مورد نیاز و وجود کلاس‌های پرجمعیت است که معمولاً به کاهش نمرة ارزشیابی استادان منجر می‌شود. بنابراین، باید به استادان فرصت دهند تا اگر توضیحاتی در مورد نتایج ارزشیابی دانشجویان دارند، بیان کنند تا با ملاحظة آنها قضاوت شود. برای پرهیز از قضاوت‌های نادرست، اتحادیة استادان دانشگاه نیوزیلند اعلام کرده است هنگام تفسیر داده‌های ارزشیابی باید به نوع و هدف تدریس، سوابق و دانش قبلی دانشجویان، منابع در دسترس و داوطلبانه یا اجباری بودن درس توجه شود (Hall and Fitzgerald, 1995).
اگرچه نمره دادن دانشجویان روی پرسشنامه‌های مربوط نوعی ارزشیابی و داوری درباره کیفیت تدریس استاد است، ارزشیاب اصلی فرد یا افرادی هستند که برمبنای داده‌های موجود داوری می‌کنند و تصمیم‌هایی را برای افراد می‌گیرند. بنابراین، باید باتوجه‌به همة شرایط و مسائل موجود در محیط در مورد نمره‌های ارزشیابی قضاوت کرد. رمزدن (Ramsden, 1999) در مورد ضرورت تفسیر محتاطانة نمره‌های ارزشیابی دانشجویی هشدار می‌دهد و می‌نویسد که این نمره‌ها از نوع هنجارمدار هستند، نه ملاک‌مدار. او ادامه می‌دهد ارزشیابی دانشجویی هیچ داوری مطلقی عرضه نمی‌دهد که یک استاد بد یا خوب است، بلکه فقط در مقام مقایسه، اطلاعاتی ارائه می‌دهد. کسی که بیشترین نمره را به‌دست می‌آورد ممکن است به‌گونه‌ای تدریس کند که کاملاً رضایت‌بخش نباشد. لزوم تفسیر محتاطانه زمانی مهم‌تر می‌شود که فقط از یک روش، مثلاً ارزشیابی دانشجویی، برای بررسی کیفیت تدریس استادان استفاده شود.
به‌رغم اینکه استفاده از روش ارزشیابی دانشجویی در دانشگاه‌های کشور سیر صعودی داشته و پر کردن برگه‌های ارزشیابی وقت فراوانی از دانشجویان می‌گیرد و منابع مادی و انسانی فراوانی نیز برای جمع‌آوری آنها صرف می‌شود، به نظر می‌رسد که از نتایج آن استفادة بهینه‌ای نمی‌شود. درحال‌حاضر، عمدتاً نمره‌های به‌دست آمده را برای استادان ارسال می‌کنند. از این نمره‌ها گاهی در پایه و ارتقای رتبة استادان نیز استفاده می‌شود. علاوه‌براین، شایسته است دانشگاه‌ها اقداماتی در جهت بهبود اجرا و استفاده از نتایج ارزشیابی مبذول دارند و از انجام امور قالبی و تکراری پرهیز کنند. دانشگاه‌ها باید به‌سوی برآورده ساختن همة اهداف مورد انتظار از ارزشیابی، نظیر انجام پژوهش‌های ضروری و ارتقای کیفیت تدریس استادان، گام بردارند. در این راستا انجام اقدامات زیر مناسب به نظر می‌رسد:

- استقرار نظام ارزشیابی منطبق با محتوا و موضوع هر درس؛
- یاری رساندن به اعضای هیئت‌علمی برای تفسیر نتایج ارزشیابی مربوط به عملکرد خود؛
- آموزش دانشجویان برای نقش‌آفرینی در نظام ارزشیابی؛
- تأکید بر اهمیت بازخوردهای تکوینی و پایانی؛
- ایجاد فرصت‌هایی برای تأمل اعضای هیئت‌علمی بر عملکرد تدریس خود (Cross et al., 2004).
- جدی گرفتن ارزشیابی و اعمال سیاست‌های تشویقی؛
- ترویج فرهنگ انجام و پذیرش ارزشیابی در نظام آموزشی، به‌ویژه در میان استادان و دانشجویان؛
- انجام پژوهش در مورد ارزشیابی دانشجویی؛
- طراحی و اجرای صحیح؛
- مشارکت ارزشیابی‌شوندگان در فرایند ارزشیابی؛
- توجیه استادان و دانشجویان در مورد معیارهای تدریس اثربخش در دانشگاه؛
- بررسی اعتبار و پایایی ابزارهای سنجش؛
- نمره‌گذاری و تفسیر صحیح یافته‌ها؛
- فراتر رفتن از اعداد و ارقام و توجه به ابعاد کیفی ارزشیابی.
نگارنده باور دارد که اجرای پیشنهادهای عرضه‌شده منطقی و مفید است. البته باید یادآور شد که فرایند تغییرات آموزشی کند است و بنابراین نباید انتظار داشت یک‌باره همة آنها انجام شود. علاوه‌براین، تحقق آنها به مدیران توانا، متعهد و علاقه‌مندی نیاز دارد که بتوانند با مشارکت همه‌جانبة اعضای هیئت‌علمی و توجه دقیق به همة اجزای فرایند ارزشیابی، زمینه‌ساز اجرای پیشنهادها باشند.

کتاب‌شناسی
بازرگان، عباس؛ فتح‌آبادی، جلیل و عین‌اللهی، بهرام. (1379). «رویکرد مناسب ارزیابی درونی برای ارتقای مستمر کیفیت گروه‌های آموزشی در دانشگاه‌های علوم پزشکی». مجلة روان‌شناسی و علوم تربیتی، 5(2)، 1-26.
سیف، علی‌اکبر. (1370). «ارزشیابی دانشجویان از استادان: تا چه اندازه می‌توان به آن اعتماد کرد؟». پژوهش‌های روان‌شناختی، 1(1و2)، 12-24.
سیف، علی‌اکبر. (1375). روش‌های اندازه‌گیری و ارزشیابی آموزشی. تهران: دوران.
سیف، علی‌اکبر. (1376). «روش‌های ارزشیابی کیفیت فعالیت‌های‌ علمی- آموزشی اعضای هیئت‌علمی دانشگاه‌ها». مجموعه مقالات نخستین سمینار آموزش ‌عالی در ایران (ج.2). تهران: دانشگاه علامه طباطبایی.
کیامنش، علی‌رضا. (1376). روش‌های ارزشیابی آموزشی (رشته علوم ترتیبی). تهران: دانشگاه پیام نور.
گرجی، یوسف. (1376). «رابطة بین میزان محبوبیت اجتماعی استادان ازنظر دانشجویان و نحوة ارزشیابی دانشجویان از فعالیت‌های آموزشی آنان». مجموعه مقالات نخستین سمینار آموزش ‌عالی در ایران (ج.2). تهران: دانشگاه علامه طباطبایی.
مردانی، ابراهیم. (1378). بررسی نظام ارزیابی عملکرد اعضای هیئت‌علمی دانشگاه اصفهان از دیدگاه استادان (پایان‌نامة منتشر نشده کارشناسی‌ارشد). دانشکدة علوم تربیتی، اصفهان.
وزارت علوم، تحقیقات و فنّاوری. (1380). آیین‌نامة ارتقای مرتبة اعضای هیئت‌علمی. بازیابی شده از: https://www.msrt.ir
ولف، ریچارد. (1371). ارزش‍ی‍اب‍ی‌ آم‍وزشی‌ م‍ب‍انی س‍ن‍ج‍ش‌ ت‍وان‍ای‍ی‌ و ب‍ررسی‌ ب‍رن‍امه، ترجمة علی‌رضا کیامنش. تهران: مرکز نشر دانشگاهی.

Aleamoni, L. M. (1999). “Student Rating Myths Versus Research Facts from 1924 to 1998”. Journal of Personnel Evaluation in Education, 13(2), 153-160.
Ali, D. L. and Sell, Y. (1998). Issues Regarding the Reliability, Validity and Utility of Student Ratings of Instruction: A Survey of Research Findings. Calgary: University of Calgary.
Anderson, H. M., Cain, J. and Bird, E. (2005). “Online Course Evaluations: Review of Literature and a Pilot Study”. American Journal of Pharmaceutical Education, 69(1), 34-43.
Arreola, R. A. and Aleamoni, L. M. (1990). “Practical Decisions in Developing and Operating a Faculty Evaluation System”. In M. Theall and J. Franklin (Ed.), Student Ratings of Instruction: Issues for Improving Practice. San Francisco: Jossey Bass.
Braskamp, L. A., Ory, J. C. and Pieper, D. M. (1981). “Student Written Comments: Dimensions of Instructional Quality”. Journal of Educational Psychology, 73(1), 65–70.
Brent, R. and Felder, R. M. (2004). A Protocol for Peer Review of Teaching. Retrieved from: https://www.engr.ncsu. edu/wp-content/uploads/drive/1nsrTgNg0sR3rNGxZoLhU 3cBUzWg1167e/2004-ASEE(Peer%20Review).pdf.

Cannon, R. and Newble, D. (2000). Handbookfor Teachers in Universities and Colleges: A Guide to Improving Teaching Methods. London: Kogan Page.
Cashin, W. E. (1995). Student Ratings of Teaching: The Research Revisited (IDEA Paper No. 32). Manhattan, KS: Kansas State University.
Center for Teaching and Learning, University of North Carolina. (1994). Student Evaluation of Teaching. Retrieved from: cfe.unc.edu/pdfs/FYC16.pdf.
Centra, J. A. (1993). Reflective Faculty EEaluation: Enhancing Teaching and Determining Faculty Effectiveness. San Francisco: Jossey-Bass.
Crooks, T. J. (1990). Student Evaluation of Teaching. Paper Presented at Higher Education Research and Development Society of Australia (HERDSA) Conference,Wellington.
Cross, S., et al. (2004). Student Rating of Teaching Effectiveness: Recommendations for Use by Departments and Faculty. Retrieved from: http://www.schreyerinstitute. psu.edu/pdf/
Dunkin, M. J. and Barnes, J. (1986). “Research on Teaching in Higher Education”. In M. Wittrock (Ed.), Handbook of Research on Teaching (pp.754-777). London: Macmillan Publishing Company.
Emery, C. R., Kramer, T. R. and Tian, R. G. (2003). “Return to Academic Standards: a Critique of Student Evaluations of Teaching Effectiveness”. Quality Assurance in Education, 11(1), 37-46.
Felder, R.M. and Brent, R. (2004). “How to Evaluate Teaching”. Chemical Engineering Education, 38(3), 200-202.
Guralnik, D. B. (1986). Webster's New World Dictionary of the American Language (2nd ed.). New York: Prentice Hall.

Ha, T. S., Marsh, J. and Jones, J. (1998). A Web-based System for Teaching Evaluation. Paper Presented at New Challenges and Innovations in Teaching and Training into the 21st Century, Hong Kong.

Hall, C. and Fitzgerald, C. (1995). “Student Summative Evaluation of Teaching: Code of Practice”. Assessment and Evaluation in Higher Education, 20(3), 307-314.
Johnson, T. (2002). Online Student Ratings: Will Students Respond? Paper Presented at the Annual Meeting of the American Educational Research Association, New Orleans, Louisiana.
Kaufman, D. M. (2002). Student’s Evaluation of Faculty Teaching. Paper Presented at SFUFA Forum.
Keane, E. and Labhrainn, I. M. (2005). Obtaining Student Feedback on Teaching and Course Quality. Retrieved from: http://www.nuigalway.ie/celt/documents/evaluation_ ofteaching.pdf.
Kolitch, E. and Dean, A. V. (1999). “Student Ratings of Instruction in the USA: Hidden Assumptions and Missing Conceptions about "Good" Teaching”. Studies in Higher Education, 24(1), 27-42.
Kwan, K. (1999). “How Fair are Student Rating in Assessing the Teaching Performance of University Teachers?” Assessment and Evaluation in Higher Education, 24(2), 181-193.
Lally, M. and Myhill, M. (1994). Teaching Quality: The Development of Valid Instruments of Assessment. Canberra: Australian Government Publishing Service.
Lewis, J. M. (1993). “Teaching Styles of Award-Winning Professors”. In Ellis R (Ed.), Quality Assurance for University Teaching (pp. 149-164). Bristol: The Society for Research into Higher Education and Open University.

Marsh, C. J. (2001). Perspectives: Key Concepts for Understanding Curriculum. London: UK: Falmer.

Marsh, H. W. and Roche, L. A. (1992). “The Use of Student Evaluations of University Teaching in Different Settings: The Applicability Paradigm”. Australian Journal of Education, 36(3), 278-300.
Marsh, H. W. and Roche, L. A. (1993). “The Use of Students’ Evaluations and an Individually Structured Intervention to Enhance University Teaching Effectiveness”. American Educational Research Journal, 30(1), 217-251.
Marsh, H. W. and Roche, L. A. (1997). “Making Students' Evaluations of Teaching Effectiveness Effective: The Critical Issues of Validity, Bias, and Utility”. American Psychologist, 52(11), 1187-1197.
McGourty, J., Scoles, K. and Thorpe, S. (2002). Web Based Student Evaluation of Instruvtion: Promises and Pitfalls. Paper Presented at the 42nd Annual Forum of the Association for Institutional Research, Toronto.
McKeachie, W. J. (1990). “Research on College Teaching: The Historical Background”. Journal of Educational Psychology, 82(2), 189-200.
McKeachie, W. J. (1994). Teaching Tips: Strategies, Research, and Theory for College and University Teachers. Lexington, MA: D. C. Heath and Company.

McKeachie, W. J. (1997). “Student Ratings: The Validity of Use”. American Psychologist, 52(11), 1218-1225.
Menges, J. R. (1994). “Improving Your Teaching”. In W. J. Mckeachie et al., Teaching Tips: Strategies, Research, and Theory for College and University Teachers. Lexington: D. C. Heath and Company.
Murray, H. G. (1980). Evaluating University Teaching: A Review of Research. Toronto: Ontario Confederation of University Faculty Associations.
Murray, H. G. (2005). Student Evaluation of Teaching: Has It Made a Difference? Retrieved from: https://www.stlhe.ca/ wp-content/uploads/2011/07/Student-Evaluation-of-Teaching1.pdf.
Overall, J. U. and Marsh, H. W. (1980). “Students' Evaluations of Instruction: A Longitudinal Study of Their Stability”. Journal of Educational Psychology, 72, 321–325.
Petersen-Perlman, D., O’Brien, M., Carlson, H., and Hilson, L. (1999). “Choreographing Partnership: Modeling the Improvement of Teaching and Learning”. Teaching in Higher Education, 4(2), 253-265.
Purdue University. (1998). Teaching Evaluation Report: Proposed Measures Internet.
Ramsden, P. and Dodds, A. (1989). Improving Teaching and Courses: A Guide to Evaluation. Melbourne: Centre for the Study of Higher Education, University of Melbourne.
Ramsden, P. (1991). “A Performance Indicator of Teaching Quality in Higher Education: The Course Experience Questionnaire”. Studies in Higher Education, 16(2), 129-150.
Ramsden, P. (1992). Learning to Teach in Higher Education. London: Routledge.
Theall, M. and Franklin, J. (2001). “Looking for Bias in All the Wrong Places: A Search for Truth or a Witch Hunt in Student Ratings of Instruction?” In M Theall, P. C. Abrami, and L. A. Mets, (Eds.), The Student Ratings Debate: Are They Valid? How Can We Best Use Them? (pp. 45-56). San Francisco: Jossey-Bass.
Timpson, W. W. and Andrew, D. (1997). “Rethinking Student Evaluations and the Improvement of Teaching: Instruments for Change at the University of Queensland”. Studies in Higher Education, 22(1), 55-65.
University of Wisconsin-Green Bay. (1998). Final Report: Task Force on Teaching Evaluation.
Wachtel, H. K. (1998). “Student Evaluation of College Teaching Effectiveness: A Brief Review”. Assessment and Evaluation in Higher Education, 23(2), 191–211.
Wright, W. A. and O’Neil, M. C. (1994). “Perspectives on Improving Teaching in Canadian Universities”. The Canadian Journal of Higher Education, 24(3), 26-57.

دانشنامه جامع علوم انسانی

ارزشیابی دانشجویی

دانشنامه جامع علوم انسانی، دای‍رة‌ال‍م‍ع‍ارف‌ آم‍وزش‌ ع‍ال‍ی‌- جلد 2

دانشنامه جامع علوم انسانی

ارزشیابی دانشجویی

دانشنامه جامع علوم انسانی، دای‍رة‌ال‍م‍ع‍ارف‌ آم‍وزش‌ ع‍ال‍ی‌- جلد 2

هم رسانی