교육학의 방법 및 기술- 교육 평가 2편
교육학에서의 교육 평가의 역사를 보게 되면 면접과 구두시험 또는 필기시험에 의해서 교육의 효과나 사람의 능력이나 학력을 평가하는 필요성은 예전부터 존재하고 있었다고 하며 예를 보자면 1천여 년 전에도 존재하였던 고조선이었던 고대 한국에서부터 시작되었던 과거제를 예를 들을 수가 있습니다. 19세기 후반에 들어서면서 서양에서는 과거의 평가하는 방법이 주관적이다 보니 신뢰성이 매우 낮다는 생각과 함께 반성이 일어나게 되었으며 이를 기준으로 객관적으로 하기 위해서 연구가 시작되었다고 합니다. 영국의 피셔서는 1864년도에 척 두부라는 것에 대해서 연구하였으며 미국의 라이스는 1894년도에 영어의 스펠링에 관하여서 객관적 테스트를 만들었으며 이를 커리큘럼으로 근대화시켰다고 합니다. 교육이 보급과 함께 시작된 커리큘럼의 제작과 학생의 편성 그리고 교육자료 등, 여러 가지의 과제와 심리학적인 진보 등 배경으로 일어났던 20세기에 들어서서 더욱 객관적인 측정이 필요로 됐으며 손다이크의 미국에 학자는 측정 운동의 대표자로 볼 수가 있습니다. 또한 교육의 측정하는 운동은 표준화가 된 테스트를 요구하게 되었으며 이에 따라 지도 효과를 최대한으로 객관적으로 측정하고자 노력하였다고 합니다. 1908년에 가게는 산수에 관하여 표준화된 검사를 기반으로 교과에 관하여서도 표준화된 검사가 잇따라서 제작되고 공표되었다고 합니다. 이러한 교육의 효과는 물론 객관적인 측정의 경우 표준화 검사에 의해서만 가능했다고 할 수 없으며 교사가 스스로 만든 객관적인 테스트로도 가능하였다고 하며 이러한 점은 못 해도 그때 당시의 논문체의 테스트 비하면은 그 채점의 객관성과 더불어 여러 가지 문제를 제기할 수 있다는 점에서도 훨씬 뛰어났다고 할 수가 있습니다. 이른바 이렇게 객관적인 테스트가 연구하여 새로운 안으로 생각해 내었으며 그 선전과 보급으로 이루어졌다고 하며 이에 대해서는 매몰의 노력과 수고로 이루어낸 결과를 매우 높게 평가된다. 1905년의 프랑스의 비네 의해서 지능측정이 이루어지며 처음으로 지능검사가 노력과 수고로 이루어져 개발되었다고 하며 그 이후로는 미국에서는 다양한 지능검사의 발전을 이루어나갔다고 합니다. 성격 분야에 대해서도 측정을 하고자 하는 시도가 이루어졌으며 퍼널 들어가 시도한 것이 그 예라고 할 수가 있습니다. 교육측정 운동에 대해서도 1930년도를 전후가 하나의 뉘우침으로 하여 새로운 교육 평가의 사상이 발생하였으며 교육측정이 지난날에 존재하였던 주관적인 평가를 배척하면서 객관적인 평가를 위해서 수량적인 면으로 자료를 구하고자 하였던 점에서는 크나큰 발전을 이루었으나 다른 면에서 바라볼 때에는 교육적인 목적이나 가치를 추구하고자 하는 데에만 의의를 두었다는 인식은 사라졌으며 오직 수량적인 부분의 자료에만 중점을 두고 있다는 느낌이 크다고 할 수가 있습니다. 이는 교육의 목표 면에서 학생의 가치관과 태도 그리고 감상과 같은 사항들에 대해서는 객관적인 측정이 무난한 목표와 동일하게 중요하게 여기며 평가해야 하는데 이에도 불구하고 측정하기 어렵다는 이유를 가지고 무시하는 경향도 나타났다고 합니다. 이뿐 아니라 1920년이 되어서는 그 체제를 다시 다듬으며 새로운 심리학의 발생과 함께 발전한 신 교육적 운동이 객관적인 측정 운동에 대해서 새로이 전환되는 시기나 기회를 마련하였으며 이는 즉 새로운 심리학과 새로운 교육의 발생으로 단순하게 인간을 지적인 존재로만 파악하는 것이 아니라 지적이며 사회적이고 적극적이며 신체적인즉슨 종합적인 종합체로서 파악하며 그 전체의 교육 위치를 다시 잡기 시작하였다고 할 수가 있습니다. 이러한 면에서 보게 되어도 수량적인 측정만으로는 문제를 해결할 수 없다고 보며 측정에서의 평가로 기본구상으로 변경하게 되었으며 용어의 경우도 교육측정보다는 교육평가라는 말이 더 적절하다는 생각이 존재한다고 합니다. 교육의 평가 유형으로는 3가지의 유형이 존재하는데 진단평가와 형성평가 그리고 종합평가가 있습니다. 먼저 진단평가를 보자면 영어로는 diagnostic evaluation이라 하며 형평성과 종합평가와 마찬가지로 학생들의 행동에 대해서 어느 측면에 관하여서 가치화나 의사결정 그리고 기술과 분류를 목적으로 하고 있다고 하지만 첫째로는 교수가 시작되는 시초에 학생들을 적절하게 배치하려는 것이 있으며 둘째로는 학생들이 학습에서 갖게 되는 결함의 진단이라는 두 가지의 목적이 진단평가가 다른 유형의 평가와는 구별이 되는 주된 특징이라고 할 수가 있습니다. 시작되기 이전에 교수가 실시하는 진단평가의 경우에는 학생들의 학습이 시작되기 이전에 그들이 어떠한 출발점에 놓여 있는가를 결정한다고 하며 이를 목적으로 하는 진단의 경우 대개는 세 가지의 형태로 나누어 볼 수가 있다고 합니다. 첫 번째로는, 계획이 된 학습 단위의 목표를 성취하는 데에 있어서 선행조건이 된다고 추측이 되는 시발 행동과 기능을 학생이 소유하고 있는지 없는지에 결정하는 것이며 두 번째로는, 주어진 학습의 단위 또는 과정의 목표들을 학생이 이미 달성했는지 이로써 보다 높은 수준의 학습 프로그램을 제공하여야 하는지에 대해서 여부를 결정하는 것이 두 번째의 형태이며 세 번째의 경우는 학생들이 지니고 있는 어떠한 특성 즉 흥미나 성격, 직업이나 적성 그리고 기능이나 선행학습과 같은 것들을 통하여 정도를 비추어 분류하며 이에 따라서 적절하게 교수의 전략이나 교수 방법의 대안을 제공하려는 것이 바로 세 번째의 형태이며 이러한 세 가지의 형태로 요약이 될 수 있다고 합니다. 다음으로 두 번째의 진단평가 형태는 교수가 진행 중일 때 주는 것으로서 이 평가의 경우 주된 기능을 학생들의 학습에서 나타나는 계속된 결함의 원인과 그 밑에 놓여 있는 환경을 결정하려는 것이라고 할 수 있으며 물론 형성평가도 학습 도중에 학습의 결함을 진단할 수 있는 기능을 가지고 있다고 합니다. 하지만 형성평가의 경우 학습 목표에 관해서는 교수 방법과 교재 자체의 개선에 의해서 학습을 개선을 하며 증진을 하는 것인데 이에 반해서 진단평가의 경우 이러한 개선으로 교정되지 아니하는 신체적과 정서적, 문화적 환경에서 결함을 찾으려고 하는 데에 목적이 있다고 할 수가 있습니다. 대한민국에서는 학생들의 집단을 여러 가지의 다양한 형태의 동질 집단으로 분류하며 그에 따라서 적절하게 교수 방법을 투입을 하는 모습들을 볼 수가 있으며 이와 같은 배치기능에 관하여서는 진단평가의 경우 중요한 역할을 한다고 합니다. 다음으로는 formative evaluation이라 형성평가를 보자면 학습 및 교수가 진행되고 있는 유동적인 상태에 존재하고 있는 도중에 학생들에게 피드백을 해주며 교육과정과 수업 방법을 개선하기 위해서 하는 평가이며 이러한 형성평가는 학생들의 학습을 올리기 위한 목적일 뿐 아니라 그에 뒤이어서 교수들의 방법을 더 나아가게 고치며 교육과정에서 어떠한 개선을 이루기 위해서 실시하는 평가라고 할 수 있으며 학습이 끝난 뒤에 실시하는 총평가와는 다르게 학습이 형성되고 있는 시기에 실시하는 평가이기에 학습증진에 대해서 극대화가 이뤄지도록 하는 것이 목적이라고 할 수 있습니다. 이러한 점은 곧 형성평가를 통하여서 이와 같은 목적을 달성할 수 있는 증거를 가져야 하며 평가 때문에 학생이나 교사에게 좋지 않은 효과를 미치지 않도록 통제를 해야 하며 형성평가의 특징을 세 가지로 볼 수 있으며 첫 번째로는 형성평가의 경우 교수나 학습이 아직 유동적인 시기에 교과나 교수 그리고 학습의 개선을 위해서 실시하는 평가이며 이러한 형성평가의 목적의 경우 점수를 매긴다거나 학생의 성적을 판정한다거나 교사의 능력을 평가하려는 것을 가진 목적이 아니라 학생의 학습을 증대시키기 위한 것으로서 무엇을 개선해야 할 것인가에 대한 것을 찾으려는 평가라고 합니다. 두 번째로는 형성평가의 경우 교수와 학습 과정을 제1 찬 적으로 이끌어가며 잘못된 부분을 고쳐 나가야 할 교사가 제작하는 것이 원칙으로 종합 평가 혹은 진단평가의 경우 평가 전문가 또는 측정전문가가 제작할 수 있으며 때로는 평가이론이나 기술에 대해서 해박한 지식 그리고 경험을 가지고 있는 전문가가 제작한 평가도구가 더 유용한 정보를 제공해 주기도 하지만 형성평가의 경우 지금 진행 중인 프로그램에 대해서 어떠한 정보를 얻어가려는 것이기 때문에 가르치고 있는 교사가 자신의 것을 제작하여 측정하는 것이 합당하다고 할 수가 있습니다. 세 번째로는 교육의 목표 또는 교수의 목표를 기반으로 평가를 하는 것이 형성평가의 중요한 특징 중의 하나로서 다시 말하면 목표지향평가를 한다는 것이 특징이라고 할 수가 있으며 교육과정 어떤 것이든 학생들이 어떠한 목표를 달성하도록 짜인 경험의 조직체라고 할 수 있으며 이러한 설정을 해 놓은 목표에 대해서 학습상황에서 성취하고 있는가 없는가를 결정하는 것은 교사의 역할이라고 할 수가 있습니다. 또한 목표가 결정이 되기 전에 교육과정이 존재할 수 없으며 목표도 모르는 상황으로 수업을 할 수 없다고 할 수 있다. 또한 형성평가의 중요한 목적으로는 이렇게 설정이 된 목표를 학생들이 수긍할 만한 정도를 가지고 성취하고 있는가를 결정하는 일이며 성취하지 못할 경우에는 어떤 부분에서 개선을 해야 하는지를 결정하는 정보를 제공하려는 데에 의의가 있다고 할 수가 있습니다. 마지막 세 번째인 summative evaluation인 종합평가는 한 학습과제나 단위, 교과가 끝난 다음에 기말이나 연말에 종합적으로 교육목표의 달성 정도에 대해서 평가를 하는 것으로 총합 평가와 형성평가의 차이를 보자면 첫 번째로는 평가의 목적이 다르며 총합 평가의 경우 전체 교과목에서 또는 그것이 주요한 부분에 걸쳐진 부분적인 성과에서 어느 정도가 달성이 됐는지에 대해서 총평하는 것이 목적이며 다시 말하면 형성평가의 경우 학습의 형성에 목적을 가진다면 총합 평가의 경우 행정적 의사결정에 대해서 그 목적을 가지고 있다고 할 수 있습니다. 두 번째로는 총합 평가의 경우 대체로 한 학기가 끝날을 떄 1회 또는 필요에 따라서 두 번 정도 하는 것이 보통이며 때에 따라 1년에 한 번 정도 하는 경우도 있다고 하면 이에 반면 형성평가의 굥우 교과가 포함하고 있는 학습과제에 따라서 적어도 한 번에서 두 번 정도 실시한다고 하며 대부분의 경우 학습이 시작이 되기 전에 진단평가를 하며, 이를 기반으로 예비 학습이 끝나면 본 학습에 들어가며 이때 형성평가를 수시로 진행한다고 할 수가 있으며 반면에 총합 평가의 경우 학습이 끝난 후 빈도가 낮으며 길이가 긴 검사라고 볼 수 있습니다.