ĐIỀU GÌ KHÁC BIỆT? TRẮC NGHIỆM THAM CHIẾU TIÊU CHÍ VÀ TRẮC NGHIỆM THAM CHIẾU NHÓM CHUẨN
Bạn đã bao giờ cảm thấy khó hiểu trước một tình huống như thế này chưa?
Trong kì học mùa thu, một học sinh tên Bruno đã làm tốt bài đánh giá định kì (một bài kiểm tra nhằm đánh giá sự tiến bộ của học sinh, được thực hiện 9 tháng một lần, giúp giáo viên lên kế hoạch điều chỉnh, hỗ trợ học sinh cho phù hợp và kịp thời). Cậu đạt 55/100 điểm, kết quả này được coi là tốt so với độ tuổi của cậu. Thứ hạng phần trăm của cậu là 88, một thứ hạng khá cao, cao hơn nhiều bạn học khác.
Cuối năm học đó, trong kì học mùa xuân, Bruno lại tham gia một bài đánh giá tương tự. Lần này cậu đạt 60 điểm, vẫn đạt mức tốt, nhưng thứ hạng phần trăm của cậu đã giảm xuống, chỉ còn 38.
Chuyện gì đã xảy ra? Điểm số mà Bruno đạt được ở kì đánh giá mùa xuân (60/100) rõ ràng cao hơn kết quả kì đánh giá mùa thu (55), nhưng thứ hạng phần trăm của cậu lại thấp đi, từ 88 xuống 38.
TRẮC NGHIỆM THAM CHIẾU TIÊU CHÍ VÀ TRẮC NGHIỆM THAM CHIẾU NHÓM CHUẨN
Để tìm câu trả lời cho tình huống trên, chúng ta cần hiểu sự khác biệt giữa trắc nghiệm tham chiếu tiêu chí (criterion-referenced test) và trắc nghiệm tham chiếu nhóm chuẩn (norm-referenced test).
Ngay cả các chuyên gia, nếu chỉ nhìn vào hình thức của trắc nghiệm cũng không thể chỉ ra sự khác biệt giữa trắc nghiệm tham chiếu tiêu chí và trắc nghiệm tham chiếu nhóm chuẩn. Điểm khác nhau giữa chúng chính là điểm số - đôi khi một số bài trắc nghiệm có thể cung cấp cả kết quả tham chiếu nhóm chuẩn và kết quả tham chiếu tiêu chí.
Thế nào là trắc nghiệm tham chiếu tiêu chí?
Các bài trắc nghiệm tham chiếu tiêu chí so sánh kiến thức hoặc kỹ năng của một người với tiêu chuẩn định trước, mục tiêu học tập, mức độ thực hiện hoặc một bộ tiêu chí. Với bài trắc nghiệm tham chiếu tiêu chí, kết quả của mỗi thí sinh được so sánh trực tiếp với tiêu chuẩn, mà không so sánh với các học sinh khác cùng thực hiện bài kiểm tra. Các bài kiểm tra tham chiếu tiêu chí thường sử dụng các điểm số được gọi là “điểm cắt” để phân học sinh thành các mức: “dưới trung bình”, “trung bình” và “trên trung bình”.
Nếu bạn đã từng đến một lễ hội hoặc công viên giải trí, chắc hẳn bạn sẽ thấy những tấm biển ghi nội dung: “Bạn phải có chiều cao … để tham gia trò chơi này”. Một mũi tên chỉ vào một vạch kẻ nhất định trên chiếc thước đo chiều cao; người điều khiển trò chơi sẽ so sánh chiều cao của mỗi người với vạch này trước khi cho phép người đó tham gia chơi.
Lưu ý là không quan trọng có bao nhiêu người đang cùng xếp hàng, hoặc bao nhiêu người cao hay thấp hơn bạn; việc bạn được phép chơi trò chơi này hay không là do chiều cao của bạn quyết định. Ngay cả khi bạn là người cao nhất trong hàng, nếu đỉnh đầu bạn không chạm vạch kẻ trên thì bạn sẽ không được tham gia chơi.
Trắc nghiệm tham chiếu tiêu chí cũng tương tự như vậy: Điểm số của một cá nhân và cách phân loại theo điểm số này không bị ảnh hưởng bởi kết quả bài làm của các học sinh khác. Nhìn vào các biểu đồ bên dưới, bạn có thể thấy điểm số và vị trí xếp loại của học sinh (ngay dưới mức thành thạo – proficient cut score) không thay đổi, cho dù em đó có kết quả trắc nghiệm thuộc nhóm tốt nhất, trung bình hay nhóm thành tích thấp.
Điều này có nghĩa là điểm số mà học sinh ghi được tại bài trắc nghiệm tham chiếu tiêu chí sẽ cho bạn biết năng lực của học sinh đó so với các tiêu chí đã định sẵn là như thế nào, chứ không so sánh học sinh đó với các học sinh cùng lớp, cùng tuổi.
Thế nào là trắc nghiệm tham chiếu nhóm chuẩn?
Các đánh giá tham chiếu nhóm chuẩn lại so sánh kiến thức hoặc/và kỹ năng của một học sinh với kiến thức hoặc kỹ năng của một nhóm học sinh được lấy làm chuẩn (gọi tắt là nhóm chuẩn). Thành phần của nhóm chuẩn phụ thuộc vào mục đích của đánh giá. Đối với các kì đánh giá học sinh trên diện rộng, nhóm chuẩn thường là một mẫu vài nghìn học sinh cùng độ tuổi, đại diện cho học sinh thuộc lứa tuổi đó trên toàn quốc (và đôi khi, thực hiện tại cùng một thời điểm trong năm học). Cũng có thể thu hẹp các nhóm chuẩn hơn nếu cần, tùy theo đặc điểm của nhóm mà ta cần lấy làm chuẩn, chẳng hạn như độ tuổi, trình độ Tiếng Anh, điều kiện kinh tế - xã hội, sắc tộc…
Một ví dụ về trắc nghiệm tham chiếu nhóm chuẩn mà nhiều gia đình quen thuộc là biểu đồ tăng trưởng cân nặng của trẻ em trong văn phòng bác sĩ nhi khoa, biểu đồ này cho biết tỷ lệ phần trăm cân nặng của trẻ so với các trẻ được lấy vào nhóm chuẩn. Một đứa trẻ được đánh giá ở mức 50 có nghĩa là bé có cân nặng cao hơn 50% số trẻ trong nhóm mà người ta lấy làm chuẩn và thấp hơn 50% còn lại; một đứa trẻ ở mức 75 có nghĩa cân nặng của em này cao hơn 75% các em bé trong nhóm chuẩn; Điều quan trọng cần lưu ý là các phép đo tham chiếu nhóm chuẩn như thế này không cho biết cân nặng của em bé như vậy là đang phát triển bình thường hay bất thường, mà chỉ so sánh bé với các em bé trong nhóm chuẩn.
Các đánh giá sử dụng trắc nghiệm tham chiếu nhóm chuẩn thường như vậy: kết quả xếp hạng phần trăm của một học sinh cho ta biết thông tin về thành tích của học sinh đó so với kết quả của các học sinh trong nhóm được lấy làm chuẩn, nhưng không cho ta biết em học sinh đó đáp ứng hay chưa đủ điều kiện đáp ứng một tiêu chuẩn hoặc tiêu chí cụ thể.
Trong các biểu đồ bên dưới, bạn có thể thấy rằng, mặc dù điểm số của em học sinh (màu đỏ) không thay đổi nhưng thứ hạng phần trăm của em đó lại thay đổi, tùy thuộc mức độ hoàn thành bài trắc nghiệm của các em học sinh trong nhóm chuẩn. Nhìn vào biểu đồ ta có thể thấy em học sinh ở thứ hạng cao, trung bình, hoặc thấp nhưng chúng ta không thể kết luận về mức độ thành thạo/ năng lực của em học sinh này?
Điều này có nghĩa là thứ hạng của một học sinh tính toán theo kết quả một đánh giá tham chiếu nhóm chuẩn sẽ cho bạn biết học sinh cụ thể đó đã làm bài tốt như thế nào so với các bạn trong nhóm chuẩn hóa, nhưng sẽ không cho bạn biết liệu học sinh đó đã đạt, vượt, hay không đạt một số tiêu chuẩn, tiêu chí đã xác định.
So sánh trắc nghiệm tham chiếu tiêu chí và trắc nghiệm tham chiếu nhóm chuẩn
Một số đánh giá cung cấp cả kết quả tham chiếu tiêu chí và tham chiếu nhóm chuẩn, và điều này đôi khi làm chúng ta nhầm lẫn. Chẳng hạn, bạn hoàn toàn có thể có một học sinh có thứ hạng phần trăm cao, nhưng vẫn không đáp ứng tiêu chí về trình độ. Khi đó, chúng ta nên đưa ra kết luận là học sinh đó rất giỏi, vì vượt trội so với các bạn cùng lớp, hay em đó làm bài không tốt vì không đạt được những tiêu chí mà bài trắc nghiệm đặt ra?
Ngược lại, một học sinh có thể được xếp ở thứ hạng phần trăm rất thấp, nhưng vẫn đáp ứng các tiêu chí về trình độ. Vậy có phải học sinh này thực sự học kém không, vì em đó không làm bài tốt như các bạn cùng lứa, hay ta nên kết luận là học sinh học tốt, vì em đã đáp ứng các tiêu chí mà ta đặt ra?
Trong các trường hợp như trên, giáo viên cần sử dụng khả năng chuyên môn và hiểu biết của bản thân về học sinh, về nội dung và mục tiêu dạy học hay kết quả mong đợi của chương trình, về điều kiện học tập của em học sinh đó, để quyết định việc cần làm tốt nhất đối với mỗi học sinh. Kết quả các bài kiểm tra đánh giá chỉ là một trong những kênh thông tin giúp giáo viên ra quyết định dạy học.
Chuyện gì đã xảy ra với Bruno?
Quay lại câu chuyện mà ta đề cập ban đầu, vậy chuyện gì đã xảy ra với Bruno?
Giữa hai kì đánh giá tương tự nhau vào mùa thu và mua xuân, mặc dù điểm số không khác nhau là mấy (55 và 60/100) nhưng thứ hạng phần trăm lại từ 88 xuống 38. Vì điểm số tham chiếu tiêu chí không thay đổi nhiều, cậu vẫn được xếp vào nhóm “thành thạo”.
Cũng giống như Bruno, các học sinh được lấy làm nhóm chuẩn cũng tham gia kì đánh giá hai lần, một lần vào mùa thu và một lần vào mùa xuân. Vậy tại sao Bruno lại rớt từ hạng 88 xuống 38, trong cùng một nhóm chuẩn.
Đây là một dấu hiệu mà giáo viên của Bruno rất cần quan tâm. Mặc dù Bruno vẫn đạt các tiêu chí về mức độ thành thạo nhưng rõ ràng cậu đã không theo kịp các bạn học của mình và có nguy cơ tụt lại phía sau trong những năm tới. Bên cạnh đó, nếu mức độ yêu cầu của các tiêu chí được nâng lên (điều này hoàn toàn có thể xảy ra khi các chuẩn đánh giá thay đổi), thì Bruno có thể không đạt được các tiêu chí mới và sẽ cần cố gắng nhiều hơn trong năm học tới.
Đây là lý do tại sao bên cạnh thông tin về thành tích học tập của học sinh (học sinh học được cái gì), giáo viên cần phải theo dõi cả tiến trình phát triển của học sinh.
Tầm quan trọng của “Điểm bách vị phân về sự phát triển của học sinh” (Student Growth Percentiles - SGP)
Sự tiến bộ (Gain) của học sinh được tính bằng cách lấy điểm số hiện tại của học sinh trừ điểm số đạt được trước đó. Kết quả này cho ta biết học sinh có thêm kiến thức, kỹ năng gì, nhưng không cho ta biết liệu một học sinh có theo kịp các bạn học của mình hay không, liệu em đó đang có xu hướng vượt lên trước hay tụt lại phía sau để giáo viên có biện pháp gia tăng sự tiến bộ của học sinh cho phù hợp.
Sự phát triển (Growth) – Đặc biệt là Điểm bách vị phân về sự phát triển của học sinh là một phép đo tham chiếu nhóm chuẩn nhằm so sánh sự tiến bộ (gain) của học sinh giữa các giai đoạn khác nhau và so với sự tiến bộ của các bạn học cùng nhóm trong khoảng thời gian tương tự. Nhóm chuẩn bao gồm các học sinh cùng độ tuổi với lịch sử điểm số tương tự nhau, có nghĩa là học sinh có thành tích thấp được so sánh với các học sinh có thành tích thấp khác và học sinh có thành tích cao được so sánh với các học sinh có thành tích cao khác.
Do đó, SGP giúp nhà giáo dục nhanh chóng tìm ra liệu một học sinh đang có đang học tập và tiến bộ một cách bình thường hay không, liệu có đang tiến bộ quá nhanh hoặc quá chậm so với các bạn cùng nhóm khảo sát không. SGP cũng cho phép giáo viên kiểm tra xem hai học sinh với cùng điểm số có thực sự ngang bằng nhau về học lực hay thật ra chúng đang có nhu cầu học tập rất khác nhau.
Với trường hợp Bruno, thông tin SGP vào mùa thu của cậu giúp giáo viên nhận thấy cậu tiến bộ chậm hơn dự kiến. Vì vậy, giáo viên cần chủ động thực hiện các biện pháp riêng với Bruno để giúp cậu bắt kịp bạn bè. Giáo viên cũng có thể cần đánh giá cậu thường xuyên hơn, theo dõi chặt chẽ sự tiến bộ của cậu. Với những nỗ lực như vậy mới có thể hi vọng Bruno kết thúc năm học mà vẫn giữ được vị trí trong lớp như khi năm học bắt đầu, và được chuẩn bị sẵn sàng để đón nhận những thử thách học tập ở các năm học tiếp theo.
Theo RENAISSENCE

- Seminar khoa học tháng 5: TỰ CHỦ ĐẠI HỌC VIỆT NAM - GÓC NHÌN PHÂN TÍCH CHÍNH SÁCH GIÁO DỤC. THỰC TRẠNG VÀ GIẢI PHÁP
- Seminar khoa học tháng 3: THE ROLE OF THE MUNICIPALITY OF REGGIO EMILIA IN PROMOTING ECEC OF HIGH QUALITY
- ENGLISH CULTURAL WORDS ACQUISITION AND STUDENTS’ COMPREHENSION READING COMPETENCY
- ĐÁNH GIÁ RỦI RO TÀI CHÍNH ĐỐI VỚI CÁC CƠ SỞ GIÁO DỤC ĐẠI HỌC VIỆT NAM TRONG BỐI CẢNH TỰ CHỦ
- A PRELIMINARY STUDY ON STUDENT - LECTURER INTERACTION IN ONLINE LEARNING MODE TO ENHANCE LEARNING EXPERIENCE
- THE KEY FACTORS FOR ENSURING AUTONOMY AND ACCOUNTABILITY OF HIGHER EDUCATION INSTITUTIONS IN Vietnam
- SỰ CẦN THIẾT XÂY DỰNG VÀ PHÁT TRIỂN THƯƠNG HIỆU ĐỐI VỚI CÁC TRƯỜNG ĐẠI HỌC NGOÀI CÔNG LẬP
Tin cùng loại
