您的当前位置:首页正文

第十六章 跨文化交际能力测试

2021-08-19 来源:好走旅游网
第十五章 跨文化交际能力测试

全球化的进程对大学生跨文化交际能力提出了更高的要求,只拥有熟练的语言技能,而缺乏跨文化交际技巧的大学生将在未来的工作学习中受到挑战。所以,大学学习不仅要注重语言基础能力的培养测试,更应将跨文化交际能力的培养和测试作为一项不容忽视的内容。

第一节 跨文化交际能力构成研究

对于跨文化交际能力构成要素的研究是培养跨文化交际能力的重中之重。许多跨文化交际学界的专家都对这一课题有所涉猎。下面是三位学者提出的理论,是对跨文化交际能力构成研究的重要成果。

1.Yong Yun Kim的跨文化交际能力构成理论

Kim是跨文化交际研究领域杰出的学者,他运用社会心理学、应用语言学和社会学方法,把影响跨文化交际能力的因素结合起来,形成一个新的跨文化交际能力模式。他认为,跨文化交际能力由认知能力、情感能力和行为能力构成,三者相互联系,相互影响,不可分割。一个认知能力强的交际者,例如:熟练掌握目的语,熟悉目的语文化,在情感层面上,与目的语文化交流的动机更强烈,表现出积极的交际态度;同时,情感上对目的语文化持积极态度,学习目的语和目的文化的动机强烈,通过掌握目的语交际系统—言语和非言语促进了认知能力的发展,在行为上表现出良好的交际技巧。

认知因素 (+) 交际编码、规则的知识 文化理解能力 (+)

适应动机 情感因素 身份弹性 (+)

行为因素 技术能力 协调能力

注:“+”代表正关联

图16-1 跨文化交际能力构成要素的关系

① 认知能力要素

交际是一个复杂的过程,是交际者对交际目的进行编码,形成信息,再通过一定的渠道或者方式传达到接受者,由接受者解码反馈的过程。交际过程中的各个环节都受到交际双方性别、年龄、受教育程度、文化背景等干扰。跨文化交际的认知能力要求交际者具有能够理解并破译不同言语和非言语编码的能力,具体包括三方面的能力。

1)掌握目的文化的交际体系 语言是交际的主要手段之一,掌握目的文化的交际体系要求掌握目的文化的语言。这里的语言不只包括语言知识还包括语用知识。语用知识能够帮助交际者得体使用语言,如以对方习惯接受的方式表达赞扬、邀请、拒绝等意图和情感。

1

2)文化理解

话语模式和行为模式基于文化,对于目的文化的理解程度决定了交际者对其话语模式与行为模式的理解和接受程度,是移情能力的基础。文化是一个宽泛的概念,其分类形式多样,一般认为文化的重心包含于伦理方面、宗教方面、政治方面和经济方面。理解文化是一个浩大的工程,要求了解其历史、政治、宗教、价值观等方面的知识。

3)认知综合能力

所谓认知的综合能力是整合信息的能力。一个高水平的跨文化交际者能够更深入地了解目的语和目的文化,从而形成一种心理倾向,能够辨别本族文化和其他文化的细微差别。

② 情感能力要素

情感能力是跨文化交际能力的重要组成部分,要求交际者具有跨文化交际意识、尊重其他文化、克服民族中心主义、种族主义等交际障碍的能力。具备良好的移情能力有利于在行为上采取得体的交际策略。情感能力包括三方面内容。

1)适应动机

适应指交际者在跨文化交际语境中适应他者文化系统的交际模式,能够按照对方习惯接受的方式交际。主体适应的速度和程度取决于主体的动机。融入对方文化动机强烈的人,接受对方文化的心理准备充分,行动积极,适应速度较快;反之,动机弱则不利于克服自身文化系统的干扰,适应速度较慢。此外,年龄对于适应也有影响,年轻人比较容易接受新的目标语文化,而年纪大的人接受起来就比较困难。

2)身份弹性

身份弹性是一种基本的社会心理定位,涉及到主体对自身、自身文化和目的文化的尊敬,即主体是否愿意改变其建立在原有文化体系中的行为模式和习惯。这种弹性或适应性有利于减少对其他文化的偏见,从而使交际者实现交际目标。

3)审美情绪

审美情绪与Ruben提出的移情较为接近。移情是从对方的角度看待问题,而审美情绪更加深入,指交际者在跨文化语境中的交际行为是否符合目的文化的审美习惯。了解对方的审美习惯有利于主体欣赏、理解对方的文化产品,包括美术、音乐、体育等;同时也有利于主体理解日常生活中遇到的对方文化中的笑话、幽默、喜、怒、哀、乐等情绪的表达。

③ 行为能力要素

跨文化交际能力指主体能与不同文化背景的个人或者群体进行有效沟通的能力。交际是一种行为,交际能力体现在具体交际行为中,所以跨文化交际的行为能力是跨文化交际能力的最终体现。行为能力的最终形成需要认知能力所获得的知识做支撑,情感能力做铺垫,即通过具体行为表达个人的认知和情感经验。跨文化行为能力包括三方面内容。

第一,技术能力,包括基本的语言技能、工作技能、学术技能等一切能够获得有用信息、解决不同问题的技能。

第二,协同一致能力,指交际者能够以得体的举止与当地人和谐相处的能力。

第三,应对变化的策略能力,指交际者能够克服文化差异,运用合适的交际策略解决问题、实现交际目标的能力。

2.Brian Spitzberg的跨文化交际能力构成理论

Spitzberg认为跨文化交际能力由知识、动机、技巧三个因素构成,三者相互影响、相互依存。跨文化交际能力需要足够的跨文化知识、积极的动机和有效的交际技巧,三个因素应同时具备,任何一个因素都不能单独构成跨文化交际能力。

① 知识

知识指交际者应该了解目的文化中交际对象、语境以及人们对得体行为的要求等信息。

2

这些知识是交际者正确解读交际对象传达的言语和非言语信息的基础,同时也是交际者选择得体交际行为的依据。缺乏跨文化交际知识,交际者便会无法确定自己的交际行为在目的文化的某一语境中是否得体、有效。

跨文化知识包括广义文化知识(涉及各国文化的知识)和狭义文化知识(涉及某一特定文化的知识)。广义文化知识从宏观上解释跨文化交际现象,对交际者的跨文化交际行为做一般性的指导。例如:了解各国文化中存在不同的文化模式和交往规则可以帮助交际者意识到文化差异的重要性,提高对跨文化现象的敏感度。了解文化对人际交往模式的影响可以帮助交际者理解跨文化交际语境中交际对象的行为取向。跨文化交际能力还需要掌握某一特定文化的知识和常识,如:该文化不同于其他文化的特点,以及其主流文化模式和优势等。特定的跨文化交际目标要求交际者掌握特定语境的知识,如:进行跨文化商务沟通要求交际者掌握目的文化中有关商务活动的常识,出国留学要掌握与学习和生活有关的文化常识等。

② 动机

动机指交际者在预期和进行跨文化交际活动时的情感联想。与知识一样,不同的情感因素影响跨文化交际的效果。人类的情感包括感觉和意图。感觉指人们在与来自不同文化背景的人交际时体验到的情感状态。尽管人们总是混淆情感和思想,但是情感并不是思想,而是人们对思想和经验的情感和心理反映。跨文化交际中人们会有幸福、哀伤、急切、愤怒、紧张、惊讶、迷惑、轻松和快乐等情感体验。感觉涉及到交际者对其他文化的敏感性,以及对交际对象和某一特定文化的态度。有的人不习惯面对不熟悉的东西,其他文化中陌生的景色、声音、味道使他们退却。提高体验陌生事物的动机有利于提高跨文化交际能力。

意图或目的是指导行为的目标和计划,指导交际者在具体交际活动中的行为取向。人们对来自不同文化背景的人往往持有某种定势性的看法,这种看法可以帮助交际者缩小采取应对措施的选择范围,意图会受这种定势的影响。如果在交际行为发生之前,交际者对交际对象或其文化持有负面的看法,那么在交际中,这种负面看法会影响到对交际对象行为的客观判断。如果交际意图或目的是积极的,交际双方彼此的判断和评价准确,表明交际者跨文化交际能力较强。

③ 技巧

技巧是在跨文化交际中表现出来的得体、有效的交际行为。交际者只掌握必需的跨文化交际知识、持有积极的交际动机还不足以完成跨文化交际任务,他必须能够运用一定的行为技巧。这好比一个人想游泳,他看了很多关于如何游泳的书,掌握了游泳技巧的知识,他有强烈的游泳的动机,但是他还是不会游泳,因为他没有掌握游泳的技能。

很多跨文化交际学者对Spitzberg的理论作以修改,提出相似的模式。例如:研究跨文化交际能力培养的学者提出“意识”是与“知识”、“动机”和“技巧”同样重要的第四因素。Paulo Freire认为,意识主要指对自我以及与自我相关联的人或事务的认识,包括探索、实验和体验,是自我反省的,可以自我展现也可以向他人展现。意识具有不可逆的特点,一旦有“意识”便不能回到原来无意识的状态。意识可以提高认知、情感和行为技巧,因此在跨文化交际能力培养中应该有培养跨文化交际意识的内容。

3.Judith Martin 与Thomas Nakayama的跨文化交际能力构成理论

Judith Martin 与Thomas Nakayama编写的《语境中的跨文化交际》中提出一种新的跨文化交际能力模式,包括知识因素、情感因素、心智活动特征和情境特征四个要素。

3

知识因素 - 文化价值观、 信仰和行为 - 言语和非言语脚本 - 认知的简化-僵化 - 民族中心主义 情感因素 - 回避倾向 - 跨文化焦虑 - 跨文化交际意愿 跨文化交际能力 心智活动特征 - 言语表现 - 非言语表现 - 角色扮演 情境特征 - 环境语境 - 预先接触 - 地位差别 - 第三方的干扰 图16-2 跨文化交际能力模式

① 知识因素

跨文化交际能力中的知识因素指交际者对交际对象所在文化了解的程度,了解对方文化越多,跨文化交际能力越强。交际者应该了解目的文化的价值观念和信仰,了解交际对象来自何种文化模式:个体主义—集体主义,高语境—低语境,高权力距离—低权力距离,高不确定性回避—低不确定性回避。交际者还应掌握目的语文化的言语和非言语交际脚本。交际理论家Charles Beger认为言语和非言语脚本对交际有指导作用。脚本存在于人脑的长时记忆中。一个知识经验丰富的交际者拥有较多的能够指导他理解和预见交际对象交际行为的剧本库,当他与他人交际时他会从记忆库中找到类似的经验指导他的行动,如果他没有经历过同样的交际场景,他会利用类似的经历作为参考,甚至借鉴以前观察到的他人(包括书籍中,电影、电视等)的经验。在日常生活中,我们评价一个人有经验,就是这个道理。

认知的简化和僵化指交际者在与来自其他文化的人交际时,处理信息的方式过于简单僵化。Kim在论述文化冲突时把这种现象用作一种维度,认为人们认知的简化和僵化可以促进思维定势的形成。这种认知习惯导致个体目光狭隘,容易对其他文化产生负面的判断。有跨文化交际能力的交际者往往具有较为开放的、灵活的认知体系,而认知体系简单僵化的交际者不具备跨文化交际能力。

民族中心主义指个体以自己所在的文化或群体为中心评判其他文化和群体。民族中心主义者通常对其他文化群体持有消极的态度或采取敌对的行为,他们认为自己文化群体的价值观念最为正确,并以此为衡量一切的尺度。民族中心主义是跨文化交际能力发展的障碍,此种观念的持有者对宏观文化的理解程度较低。

② 情感因素

跨文化交际中的情感因素指交际者对待来自不同文化的交际对象和跨文化交际行为的

4

态度——接近或疏远,其重要特点是对跨文化交际活动产生的焦虑,即因正在进行的或预期进行的跨文化交际活动产生恐惧和焦虑心情。跨文化交际焦虑程度高的人倾向于避免与来自于外来文化的人交际,在他们眼里那些人都是行为奇特的“他者”,对“他者”奇特行为的不理解使他们觉得紧张、焦虑,并因此躲避交际。是否愿意进行交际,即交际动机,是跨文化交际能力构成中的重要情感因素。Jeffey Kassing设计的下列问题可以反映你是否有进行跨文化交际的意愿:

表16-1 跨文化交际意愿量表

假设您有绝对的自由选择的权力,在以下六种情境中您可以选择交流或不交流。表明每种情境中您选择愿意交流所占的比重,记住您要指出的不是在这些情境中进行交谈的可能性,而是在这些情境中您想要交谈次数的比例。在左侧横线上写出想要交流次数的比例。0=从不, 100=总是 1. 与我认为和我很不同的人交谈。 2. 与外国人交谈。 3. 与我对其文化知之甚少的人交谈。 4. 与其他种族的人交谈。 5. 与其他文化的人交谈。 6. 与以英语为第二语言的人进行交谈。(注:“英语”可改为“汉语”如果被试的母语是汉语。) 得分:您的分数值域在0-600之间,300分以下表明不愿意进行跨文化交际,350分以上表示有一点愿意进行跨文化交际,400分以上表示中度愿意,500分以上表示高度/非常愿意进行跨文化交际。 Young Kim 认为个体处理心理压力的能力可以影响其接近或避免跨文化交际的态度。在跨文化交际语境中,文化差异带来潜在的不确定性,这会增加交际者的压力,有的个体善于把握压力,有的则不掌握减轻压力的方法。Gudykunst 和Kim 认为有效的跨文化交际者应该在一定程度上能够容忍含混和不确定性。交际者处理压力和容忍含混的能力越强,跨文化交际能力越高。

跨文化交际能力中的知识因素和情感因素相互支持、相互影响,跨文化交际知识越多,跨文化交际的心理压力越小,进行跨文化交际的动机越强;交际动机越强烈,获得跨文化交际经验的机会越多,积累的跨文化知识就会越来越多。

③ 心智活动因素

跨文化交际能力中的心智活动因素是知识和情感因素的体现,内容包括言语和非言语表达以及角色扮演。言语表达指个体如何运用语言。交际者可能了解很多目的语的语言知识,但是语用能力很差,不能在实际对话中使用目的语流利表达。很多留学生到目的语国家不是为了学习语言知识而是为了有更多的机会练习使用目的语。了解并运用目的语可以增强交际者的认知能力,提高跨文化交际质量。语言脚本可以减少不确定性,心智活动把语言脚本付诸实践,一个不了解目的语的人不会知道目的语中基本的交际方式,如:问候、邀请、日常用语等。

非言语表达也是重要的心智活动之一。交际者要注意对方文化中肢体语言、时间语言、颜色语言、空间语言、辅助语言等非言语符号的细微差别。与言语交际的情况类似,一个具备目的文化非言语交际知识的人不一定能够准确使用该非言语符号系统。因此,在出国之前应该刻意做一些专门的练习,提高运用非言语符号系统的能力。例如:如果准备去日本,你应该在家人和朋友面前练习鞠躬。此外,味道也是很重要的非言语符号,在出国之前应该了解目的文化对味道的喜好和日常的习惯,有的国家,如:美国,喜欢用香水或其他化妆品掩

5

盖人体的自然味道,而很多国家的人们却不习惯使用香水。

角色扮演与语境有关,指交际者在目的文化中如何根据自己的角色身份得体地使用言语和非言语符号。人们在社会生活中扮演不同的社会角色,文化记载了社会对不同社会角色的期望和要求,是个体扮演角色的脚本;换而言之,人们根据自己文化内部的角色期待扮演自己的社会角色,个体的言行符合其扮演的角色身份。文化是社会角色的行为规范,不同文化对同一社会角色言行的期待不同,跨文化交际者应了解目的文化对自己所扮演角色的期待,并调整自己的行为模式,使自己的言行符合目的文化的要求。

在美国,教师与学生尽量保持平等的关系,对学生的约束较少,学生可以自由提问,教师和学生一般使用非正式的、生活化的语言对话,所以一个美国教师在课堂上身着牛仔裤,坐在桌子上讲课可以理解为制造轻松活泼的课堂气氛;而在韩国,学生期待教师为人师表,仪表言行都应该正式、庄重,美国教师的行为在韩国文化中不符合其扮演的角色身份要求。 不同文化对职业以及性别的言语和非言语表达方式以及行为模式的期望不同,跨文化交际者要能够调整不同语境中角色身份的行为差异,以对方文化可接受的得体方式进行交际。

④ 情境特征

跨文化交际能力的第四个因素是发生跨文化交际的真实语境。个体可能在某一语境中表现出较强的交际能力,而在其他语境中则无法自如应对,因此交际能力的大小依语境变化,影响跨文化交际能力的情境特征包括环境语境、预先接触、地位差别和第三方的干扰等。

环境对交际的影响很大,某些环境承载的文化信息量很大,在这样的环境中,交际者很容易感到紧张,从而影响到言语和非言语表达。例如:日本的茶道是一个文化内涵很深的仪式化的活动,而不仅仅是大家在一起喝茶的活动,美国人不了解茶道的内涵和程序,在整个茶道仪式中感到莫明其妙和无所适从,他下一次参加茶道的动机会减少。

与目的文化是否有过接触对提高跨文化交际能力意义重大。如果个体在出国前曾经与目的文化的人有过接触,那么发展跨文化交际能力要相对容易。当然,与目的文化的交际者建立信任感需要一定的时间,但是一般来讲,与当地人接触越多,了解对方文化知识越多,与对方文化接触的紧张感越低,交际动机越强,移情能力越高。

人们所扮演的社会角色存在社会地位差别,不同文化背景的人们对社会地位有不同的认识,在权力距离高或权力距离低的不同社会,人们往往对与自己平等、低/高于自己的人在情感态度和言行上表现出不同取向。美国人倾向于降低身份距离,他们对父母直呼其名,百姓和媒体公开评论当权者的言行和决策。在权力距离高的国家,地位决定一切,甚至在对话中谈话者的发言顺序都由地位身份来确定。电影《安娜与国王》中,西方女性安娜看到泰国国王的仆人见到国王时要马上跪拜,觉得难以接受,因为她认为这是对仆人人性的不尊重。西方文化与泰国文化对地位的不同理解导致跨文化误解,安娜不能以西方文化的价值观改变泰国国王的习惯,泰国国王也不该依泰国人的习惯要求西方人(安娜)见到他就行跪拜礼。

第三方的干扰或参与也是改变交际情境的因素之一。第三方的出现可以改变你在交谈中的地位,如:你的上司加入你和同事之间的谈话,你就要注意当前的话题是否得当,并调整言语和非言语表达方式。如果第三方是女士,那么交际者就要注意对方文化中与女性交际的要求。

一个人的跨文化交际知识增加了,交际动机随之增加;交际动机增加在行为上表现为积极参与交际活动。积极的参与使交际者增加经验知识,学到更多的跨文化交际知识,推动积极情感能力的发展,形成良性循环。

4.跨文化交际能力构成要素小结

Scheitza从各种理论中总结了跨文化交际能力的各种构成要素。这些要素根据个人态度、知识、交际、自信和社会关系可以做出如下归类:

6

① 态度

1)对于跨文化交际的动机和兴趣;

2)对于不同文化的积极态度,接受差异的能力; 3)现实期待;

4)对于其它文化价值观和行为的尊重; 5)礼貌、友好、交际手段;

6)处理不同想法的开放程度和灵活程度; 7)耐心和容忍度;

8)主动精神、自尊和持久度;

9)处理精神压力的能力,保持动机的能力; 10)社会智能;

11)认知综合能力,即接受对外国人行为的解释的能力。

② 知识

1)对于文化差异的常识和注意程度; 2)对于其他国家及其社会组织的知识;

3)对于其他文化的规则、模式和习俗的知识; 4)对于交际和互动规则的知识。

③交际

1)交际能力,良好的语言掌握能力;

2)对于不同言语交际和非言语交际模式的了解和注意能力;

3)辨别并有效使用不同交际风格的能力,对于谈话方式的适应能力; 4)和来自不同文化的人开始并保持有效对话的能力; 5)避免并澄清误解的能力; 6)反问并有效获取信息的能力。

④自我展现

1)为双方建立可以接受的身份的能力; 2)面对困难时保持冷静和自制的能力; 3)接受第三种文化角度的意愿和能力; 4)承认他人需要和愿望的能力; 5)对于文化定势的思考能力; 6)灵活性和适应性。

第二节 跨文化交际能力测试概述

测试是检查受试者学习效果、衡量受试者能力和反拨教师教学的一种手段,是任何能力培养体系中不可或缺的组成部分。在跨文化交际能力培养体系的构建中,测试是难度比较大的研究部分,因为人的能力和素质是很难量化和测量的。

1.语言测试发展阶段

要了解跨文化交际能力测试的发展,我们首先要关注现代语言测试的历史发展状况,其大体经历了以下四个主要的发展阶段:

第一个阶段:传统时期或前科学时期(自20世纪初到50年代初),在这一时期,语言测试基本上不是在语言学理论的指导下开展的,测试方法主要包括作文、口试、翻译等形式,测试结果主要靠考试实施者的直觉来评判,缺乏科学性。

第二个阶段:心理测量--结构主义时期或科学时期(20世纪50年代末、60年代初到70年代),这一时期的语言测试以结构主义语言学为理论基础,同时,心理学的行为主义理

7

论以及心理测量学的原则和方法对语言测试起到了重要的指导作用。Robert Lado 于1961年出版了著名的《语言测试——外语测试的开发与使用》,这本书是第一部全面论述语言测试的原理、原则和方法的专著,可以说Robert Lado 是现代语言测试的创始人。这一时期的主要测试方法是分立式测试,即分别测试语言知识的各个成分或某一单项技能的测试形式。

第三个阶段:心理语言学和社会语言学时期或后现代时期(20世纪70年代至80年代初),在这一时期,语言测试的语言学理论基础从结构主义语言学转向了社会语言学,测验更多地关注如何从功能性、社会性和语言应用的角度考查应试者,测试方法从分立式转向了综合式,即同时测试不只一项知识或技能的测试形式。

第四个阶段:交际法语言测试时期(20世纪80年代初至今),70年代末到80年代美国语言教学界开展了一场“水平运动”(Proficiency Movement)。很多语言教学界人士认为,语言教学以及语言测验要以语言水平为中心,而语言水平表现为交际能力。这一时期,人们更多地把精力集中在探讨语言交际能力方面,1990年,Bachman在Canale和Swain模型的基础上提出的语言交际能力模型,成为语言测试发展史上一个新的转折点。

从发展趋势来看,交际性语言测试是一个重要的方向,为跨文化交际能力测试提供了发展的基础。

2. 跨文化交际能力测试的信度、效度和可行性

测试的信度与效度是所有测试都在努力达到的目标。没有信度和效度的测试对教学者和学习者都可能产生误导作用,从而导致教学的南辕北辙。信度与效度原是计量学中的两个重要概念,20世纪30年代被引入语言测试领域。60年代,以Lado等为代表的第二代结构主义测试学家对这两个概念进行了系统的阐述和论证,并发展了一系列如何保证和计算这两个“度”的方法,标志着语言测试已形成科学的体系,成为一门独立的学科。语言测试的取向、理论及实践上的发展和纷争都是以信度与效度为主线进行的,信度与效度是语言测试永恒的主题。正如李筱菊所概括“归根结底,两者体现着语言测试作为测量科学与语言测试作为人文科学的矛盾,或者更广泛地说,语言测试科学与语言测试艺术的矛盾……是贯穿整个语言测试的深层主线”。(李筱菊,2001)

① 测试的信度

信度指的是测量的一致性。考试是否具有信度体现在:当同一考生在其他变量不同的情况下(即不同环境,不同条件下)参加同一难度的考试时,其分数结果是否一致或相近。这就需要统一的评分等级和等级描述,严格培训、筛选评分员,以及双评分(double marking)或多人次评分(multiple marking)等。对于测试信度的保障主要应从以下两个方面入手:

1) 测试的设计过程

测试的设计过程对于测试的信度有至关重要的决定性。首先测试应该涵盖学习的绝大部分内容,但试卷长度应适中。其次,试题应有明确详细的要求,使被测试者的真实能力不会受到审题偏差的影响。

跨文化交际能力测试针对的受试者不同,测试的内容在信度上应该有相应的调整。例如,如果受试者是初中或高中的学生,英语尚处于初级水平,那对于他们的跨文化交际能力的测试不妨采用汉语,或者是降低词汇量,将英语的难度控制到他们能够接受的程度,以防受试者因为读不懂题意而影响了其真实的跨文化交际能力的表现。在题量上的权衡也是很有必要的,题目过少,覆盖的文化内容不够广泛,测试结果不能判定受试者的真实跨文化交际能力;题目过多,又容易使受试者产生厌烦情绪,导致答题不够认真,影响测试信度。跨文化交际能力测试试题的内容也应尽量的简单明了,既然是测试学生的文化和交际能力,就不应刻意加大词汇和语法结构的难度,如果受试者在不明题意的情况下揣测作答,测试的信度就难以保证。

2)测试的评价过程

8

对测试结果的评价影响测试的最终信度。如果评价不客观,测试就没有信度可言。因此,在这一阶段,评价是否客观是影响测试信度的关键。

对于跨文化交际能力测试试卷的评价是分析结果、得出结论的重要过程。标准、具体的试卷答案是保证测试信度的重要前提,答案应体现正确的跨文化交际观,对交际中各种实际出现的情况给予客观的分析和全面的思考,不能单纯地以“正确”或“错误”来回答辨析题和案例分析题。另外,跨文化交际能力测试的评分者应首先对自己的文化观和交际观进行自我批判,不能带着自身的文化偏见去评分。在主观题评分过程中,如果遇到自己难以判定的答案,应与其他教师共同商议,或参考权威观点,切忌想当然地妄加揣测。

由于测试包括受试者的态度、意识、行为能力等方面的内容,因此跨文化交际能力测试有一定的难度。在测试的设计及评价过程中,许多主观因素如设计者、评分者和受试者以及客观因素如环境、测试内容、测试安排都会或多或少影响到测试的信度。所以我们必须安排好测试的每一个环节,增加测试的信度。

② 测试的效度

测试的效度(validity)主要关注需要考查的知识点是否都考查到了,测试是否能最大限度地反映出考生真实的语言能力。效度的高低是衡量测试最重要的指标,是测试的基本出发点,一项测试如果效度很低,那么它就失去意义了。需要指出的是,测试的效度是一个相对的概念,某一项测试用于一个测试目的时效度可能是很高的,可如果把它用于其它目的的测试就未必有效。比如说,把剑桥商务英语证书考试的试题拿来测试在校大学生的英语水平,其效度就是很低的,因为学生平时接触的并不是商务环境下使用的英语,其所得分数并不能代表学生的真实英语水平。测试效度主要体现在以下几个方面:

1) 内容效度(content validity)

内容效度是指测试是否考查了考试大纲规定要考的内容,或者说考试的题目在多大程度上能代表它所要测量的目标。根据考试大纲的具体要求,可以从三个方面判断测试的内容效度:第一,测试内容是否和测试目标有关;第二,测试内容是否具有代表性;第三,测试内容是否适合测试对象。

对于跨文化交际能力测试,测试内容与教学内容应该具有一定的关联性,但是跨文化交际能力测试又不同于其他的关于知识记忆的测试。美国教育学家B. Bloom在其《教育目标分类》中把教育目标按照从低到高的次序分为六个层次,这六个层次分别是:知识、理解、应用、分析、综合、评价,对达到每个目标的要求不同:

1.知识:辨别或记忆具体的事实、一般的概念、原则、术语、事物的分类、过程和倾向等。知识层次是最低的一个层次,考试最低的要求就是看考生对学习过的知识掌握的情况如何。

2.理解:要求考生用自己的语言来复述、解释、归纳所学的知识。这是一种低层次的理解,没有上升到判断和推理,只是在认识基础上的记忆。 3.应用:要求考生在不同环境下应用某些抽象的原理和方法。语言测试中这样的题目有很多,例如考生已经学习了某个语法知识,能不能按照要求写出合乎语法的句子,这就是一种应用。 4.分析:要求考生把某一事实或概念分解为若干个组成部分,然后指出它们之间的内在联系。语言测试应强调应用而不是分析。 5.综合:要求考生将各个部分组合成为一个整体。如外语测试中的写作测试就属于综合性测试。

6.评估:要求考生对某篇作品、某种方法、某种结论作出评估。

跨文化交际能力测试包括以上所有六个层次的测试,但应更注重应用、分析、综合以及评价能力,因为跨文化交际能力归根到底就是需要对交际过程中遇到的情况进行综合分析,

9

然后进行评价,最后表现在实际行为中的具体应用。所以测试者可以有意识地降低知识理解类题目的比例,相应加大分析应用类题目的比例。

另外,真实性是跨文化交际能力测试区别其他测试方法的一个重要特征,也是保证测试效度的重中之重。然而对于什么是语言测试的真实性,测试界的看法不一。大致看来对其定义有三种观点:

第一种是将真实性定义为“直接性”。Harrison 等人认为“测试只有用作交际时才是交际性的”,所以,“我们的测试应当尽可能直接”;而以Davies为代表的一方却不以为然,认为“交际性测试并非要求测试本身应该是交际性的”。客观地说,能力是不能直接考查出来的,因为大脑神经的活动过程无法用试卷来测量。从这个意义上来说,所有的测试都是间接测试。

第二种是将真实性定义为与现实生活的相似程度。由于现实生活中语言的使用变化很大,我们不知道哪种语言任务可以作为真实性的标准,因此交际性测试很难与生活中的真实情景相吻合。现实生活中的任何一段言语材料一旦被提取用作测试材料,必然会失去原来所具有的时间、地点和对象等条件特征,从而降低真实性;测试的场合和任务不可避免的带有人为的和理想化的因素,不管设计得如何巧妙,总会有料想不到的情况。此外,要求受试者对外国的材料作出与外国人相同的反应是不符合实际的。

第三种是把真实性和测试的表面效度等同起来。这一定义也存在问题,因为测试的表面效度完全是由评估者主观决定的。针对交际性测试真实性定义方面存在的不足,有些学者提出了解决的途径,Besse等人提出了所谓的“教学真实性”,即在听过或者读过一篇材料之后,学生或受试者应知道在何种语言、社会、文化参照范围内,一个以目的语为母语者可能如何理解这篇材料,并可能对其内容做出何种反应,尽管学生或受试本人不一定有同样的反应。Bachman提出应该从情景真实性和交际真实性来定义测试的真实性,即在命题时,使测试任务的特征与将来目的语使用的情景特征相一致,这样的测试才算具有了情景真实性。而交际真实性则强调受试者与测试任务之间的交际关系(interaction)。

一般说来,提高交际真实性要比提高情景真实性更为复杂困难。尽管如此,Bachman认为通过提高受试者语言能力等方面的参与完成测试任务的水平,测试的交际真实性是能够得到提高的。Bachman的语言测试的真实性定义和标准对于交际性测试的开发和评价极有参考价值,因为提高测试的真实性可以提高测试的效度。

2)预测效度

预测效度涉及测试的预测能力,即测试结果到底在多大程度上能够预测出将来会发生的可能性,或者说对考生未来行为作出的预测性的准确度有多高。我们常用考试来作出某种决策,如选拔某些人出国学习,选拔考生进入高校读大学等。这时我们关心的是考试是否真地选拔了该选拔的考生?选错了没有?漏选了没有?预测效度一般是拿一次测试的结果同后来的测试结果进行比较,看看两者是否具有相关性。比如一组学生先参加了我们自己设计的测试,又考了四级,如果这两次得分情况相关系数很高,说明我们自己设计的试题有较好的预测效度。

跨文化交际能力测试的预测效度也是很重要的。那么如何提高跨文化交际能力的预测效度呢?首先我们应该了解学生未来会遇到的交际场合,学生可能会和来自哪种文化的人进行交流,交际过程中可能碰到哪些真实问题,然后针对这些问题设计出题目,使学生的成绩能够在最大程度上预测出其在真实交际语境下的表现。

3)信度与效度关系

信度和效度的关系很复杂,主要体现在以下三个方面:

第一,信度与效度都是测量测试的有效性,即两者都检查测试是否起到了应起的作用,达到了什么程度,这两者对任何形式的测试来说都是非常重要的。

10

第二,可靠的测试并不一定有效。假如我们要考查学生的语法知识,测试的内容就应该是有关语法知识的题目,不能考词汇,否则无效。

第三,不可靠的测试必然无效。只要测试的结果可靠,就能引出一定的结论;但如果结果不可靠,就不可能得出任何结论,因而,失去了可靠性,有效性也就不复存在了。

在跨文化交际能力测试中,有些常见的错误是将某种文化定势,比如说:“在A情境下,一个拉丁美洲人将会有Y行为。”测试设计者不应从自己的个人经历或读过的文字材料中主观地描述一个文化情境,因为这很有可能只代表了这一文化中少数人的行为。更好的题目可以是:“一个墨西哥人在Y情境下可能会有X行为。”或者“一个生活在利马(秘鲁首都)的中产阶级秘鲁男人在Y情境下可能会有X行为。”每种文化中都存在各种不同的文化模式,所以测试设计必须小心对待。

信度和效度是紧密相连、不可分割的。跨文化交际能力测试的目的是测量考生的文化意识、文化知识和文化技能等多方面的综合素质,所以在设计试卷时,不能为了追求单纯的信度或单纯的效度而忽视另一方,而应采取一种积极平衡的态度,即研究并发现影响考生成绩的因素,消除不利因素的影响,加大有利因素的影响,这样才能既保证效度,又有了信度。

4)可行性

可行性即测试的可操作性,它与测试的信度和效度之间存在质的区别;可行性是指制约施考过程的因素,而信度和效度主要考虑的是考试质量或结果。我们知道,制约施考过程的因素包括:资源因素、人力因素和时间因素。资源因素指考试场地、考试所需的设备、阅卷设施等。人力因素指考官、监考人员、阅卷人员等。时间因素指实践考试所用时间。因此,我们在设计考试时,必须先考虑到这些因素,否则,一个不实用的考试再完美也只能是纸上谈兵。

对跨文化交际能力的测试需要多样的测试形式、特定的场景搭建、真实语境的还原等与普通测试不同的资源支持,只有这样才能保证测试的科学性及可靠性。但是,我们在设计测试题目时必须考虑到可行性问题,即使设想的很好,如果不能在实际操作过程中有效地实施,就会导致本末倒置的状况,结果也只是追求形式的完善,而忽略了实际操作中会遇到的障碍,造成不必要的损失。

第三节 跨文化交际能力测试的内容与方法

经调查研究发现,出现在文化测试卷上的试题往往都是考查一些浅显的历史、地理问题,很难准确地测出受试者的跨文化交际能力。那么究竟如何测试跨文化交际能力呢?是否我们设计的题目应该针对测试目的呢?是否应该涵盖艺术和文学方面的知识呢?是否应该与语言知识紧密相关呢?跨文化交际能力测试应该主要从三方面测试受试者的能力:文化意识、文化知识和文化技能。

学生在学习了与目的文化相关的知识一个学期或者一年后,是否有一些观念上的改变呢?他们对于目的文化的态度是否随着与之接触的加深而变得更积极了呢?他们是否能将这种态度推及到其他文化呢?首先我们应当明白文化测试的内容是什么。测试跨文化交际能力,实际上就是测试文化理解力的掌握程度。当然在初级阶段也包括对于文化知识的考查。在总结几位专家观点的基础上,我们认为文化测试命题应包括以下几个方面:

● 文化知识( knowledge) : Valette ( 1977),Lafayette,Schulz(1975)都同意测试中应该包含

考查文化知识类的内容。通过掌握文化知识,语言学习者可以了解目标语文化中的一般背景知识,从而为深层次的文化敏感性、宽容性打下基础。Nostrands(1970)的文化目标中的the ability to describe, or to ascribe to, the proper part of the population a pattern in the culture or social behavior, the ability to recognize a pattern when it is illustrated属于这一

11

类。

● 文化理解(understanding): Valette(1995)测试目标中的understanding differences和

understanding the values of the target culture都属于这一范畴。Nostrands(1970)的the ability to “explain” a pattern与这一类相符。

● 文化表现( behavior) : Nostrahds ( 1970)的文化目标中的the ability to react appropriately in

a social situation, the ability to predict how a pattern is likely to apply in a given situation, the ability to evaluate the form of a statement concerning a culture pattern, the ability to describe or manifest an attitude important for making one acceptable in the foreign society, the ability to describe or demonstrate defensible methods of analyzing a sociocultural whole, the ability to identify basic human purposes that make significant the understanding which is being taught可以被归为文化表现类。他们实际上也就是跨文化交际能力在现实生活中的应用。

但是对于Valette (1977)的command of etiquette和Seelye(1984)的cultural connotations of words and phrases等文化能力,我们就不必生硬地把它们确切地定位于某一阶段。三个阶段都可以包含对于这些能力的考查。

莱萨德-克劳斯顿(Lessard-Clouston)提出文化测试包括三个方面的内容:一是文化意识,即对目的文化差异的敏感性和对目的语文化的实际功能的理解;二是文化知识,即关于目的文化和社会文化情境的信息,比如目的语国家国情、惯常的社会行为方式、价值观等;三是文化技能,指运用目的语文化进行交际的能力。文化测试应当与文化教学的目的挂钩,二者不能脱节。具体说来,可以采取以下几种方法来测试文化教学效果:

1.测试文化意识

对于学生态度的转变的最客观最简单的评价莫过于在课程开始时对他们进行一次测试,课程结束之后再进行一次测试。以下我们将介绍四种测试方式,但实际上它们中没有一种能够帮教师下结论说某一个学生的态度如何转变了。这些测试会告诉教师的是所有学生作为一个整体态度转变的情况。另外,这些测试应该是匿名进行的。

我们之所以不能用一次测试的成绩来给一个学生对文化的态度下结论,主要基于两个原因:测试的信度和效度。上文中提到,信度指的是测量的一致性。考试是否具有信度表现在:当同一考生在其他变量不同(即不同环境,不同条件下)时参加同一难度的考试时,其分数结果是否一致或相近。测试的效度主要关注是否需要考查的知识点都考查到了,测试是否能最大限度地反映出考生真实的语言能力。效度的高低是衡量语言测试最重要的指标,是语言测试的基本出发点,一项语言测试如果效度很低,那么它就失去意义了。需要指出的是,语言测试的效度是一个相对的概念。某一项测试用于一个测试目的时可能效度是很高的,可如果把它用于其它目的的测试就未必有效。每个学生在测试时都会有运气的成分在其中,所以测试的成绩是不足以说明某个学生的能力强弱的。

尽管对于能力的测试比较难以把握,但我们可以尽量去避免或者减小误差。测试态度主要有四种方式:

① “社会距离”量表

第一种是通过“社会距离”量表来测试学生态度,该表测量的是受试者与其他文化的社会心理距离。下表即是“社会距离”量表的一个范例:

根据你自己对各个国家的人的感觉,在下表中用对号标出你愿意与之建立的社会关系。在填写过程中要将不同国家的人作为一个整体,以你对这一整体的第一反应为准,不要考虑你曾经遇到过的好的或不好的个体。请迅速做答。

表 8-1“社会距离”量表

12

1.作为结婚对象 2.作为亲密朋友 3.作为邻居 4.作为同事 5.仅作为相识的人 法国人 西班牙人 美国人 英国人 日本人 阿拉伯人 俄国人

② 描述符距离

第二种方法测量的是“语义差别”,即测量两个描述符之间的距离,这种方法让受试者对某一种文化或某一种文化中的人进行判断,例如:

根据你自己的感觉和看法,在你觉得合适的位置对每组描述符用对号作标记。

你认为美国人:

好的 / / / / / / 坏的 美丽的 / / / / / / 丑陋的

干净的 / / / / / / 肮脏的 有价值的 / / / / / / 一文不值的 善良的 / / / / / / 残忍的 令人愉快的 / / / / / / 令人不愉快的

开心的 / / / / / / 忧伤的 易于相处的 / / / / / / 难以相处的

诚实的 / / / / / / 不诚实的 公平的 / / / / / / 不公平的

对于这一测试方法, 教师可以让学生先总结一下他们自己心目中某一种文化的优点和缺点,然后根据这些优缺点来制定“语义差别”量表的两极内容。这样,通过利用自己总结的条目,学生会认为该测试更有意义。

③ 单一文化态度测试

第三种测试学生态度的方法是由Grice在1934年发展的,至今仍在使用。这种方法给出受试者许多描述,要求受试者在他同意的描述前划对号。例如:

以下是对日本人的一些描述,请在你同意的描述前划对号。 1. 做事效率很高; 2. 诚实可靠; 3. 工业化程度高; 4. 嫉妒心强; 5. 感情丰富; 6. 畏惧上帝; 7. 自恋;

13

8. 容易理解沟通; 9. 家庭生活理想; 10.爱面子

④ 问卷测试

第四种态度测试的方法展现了不同的内容。这一问卷被用来测量双语学习者每年自尊心的变动情况。问卷中每一条均可以口试或笔试的形式用双语提问,要求学生用“基本同意”或“基本不同意”来回答。

1. 我对自己很满意; 2. 我在家中很愉快; 3. 我喜欢学校; 4. 我的老师喜欢我;

5. 当老师提问我时,我不紧张; 6. 我可以做好很多事; 7. 我的朋友都喜欢我; 8. 我喜欢说汉语; 9. 我喜欢说英语; 10.我喜欢阅读; 11.我喜欢数学; 12.我喜欢音乐课; 13.我喜欢艺术课; 14.……

以上是四种可以测试文化学习者对待目的文化和对待自身的态度的保留。可以帮助教师更好地了解文化学习者的心理特征,以便因材施教,达到事半功倍的效果。

2.测试文化知识和文化技能

根据Seelye的观点,在拉丁美洲一些国家的美国殖民地,用以测试双语文化学习者的测试题主要分为两类:(1)测试与社会行为能力相关的知识;(2)测试与社会行为无关的知识。第二类题目中包括本族文化者没有直接意识到的一些抽象的或不明晰的模式,但是这些模式可能对人的行为产生直接影响。这类题目还包括广博的学术知识,以及一些外缘文化,即非目标语核心文化的内容。此外,一些理想的信仰模式(实际上并不真实存在)和那些非主流的文化模式应在测试题目中尽量避免,除非他们被明确地确认为不正常的模式,以免加深受试者对错误价值观念的印象。

以下七个方面的测试内容和相应的方法可以为跨文化交际能力测试提供方向: ① 受文化制约的行为意识

学习者应该理解不同文化中人们的行为方式,因为人们往往利用社会允许的方式满足一些生理和心理需要。 测试方法:

➢ 题目:做一个口头或书面报告,题目为:Why do most Americans go to church on Sunday? ➢ 要求:口头报告可以选择用汉语或英语来做,时间控制在五分钟内。书面报告应不少于

500字,以双倍行距格式打印,语言可以为汉语或英语。学生将在上课时在班级中陈述自己的观点,书面报告应复印,保证人手一份。 ➢ 评分标准:报告应解释清楚教堂在美国文化生活中的特殊意义、重要性及其原因。语法、

拼写、发音方面的错误不扣分。为了保证学生能够充分了解任务的内容,教师应给出一

14

些背景材料。

② 语言和社会变量的相互作用

学习者应了解一些社会身份变量,如年龄、性别、社会地位以及居住地等对人们话语和行为的影响。 测试方法1

➢ 题目:学生通过阅读材料或者采访至少两个以英语为母语的人,做一个英语口头报告,

找出因性别或年龄等因素的差异而导致的人们在词汇和表达方式方面的不同之处。 ➢ 要求:至少提前两周布置该作业,并要求在课堂上进行报告。 ➢ 评分标准:70%以上的学生能够较为清楚地理解报告内容。 测试方法2 ➢ 题目:判断已给出的四个书面英语对话应属于以下哪种社会层次的人们之间的谈话:城

市工人阶级、城市中产阶级、城市上层社会人士、农村平民。

➢ 要求:每个对话长度适中,学生应在课堂上于20分钟内作出答案。 ➢ 评分标准:四个对话必须被正确地判断。

③ 社会习俗

学习者应知道社会习俗对人们行为的影响,并了解目的文化中的人们在通常情况下和紧急状况下采取何种行为。

➢ 题目:用准确恰当的语言和身势语展示美国人如何回应下列六种场合:

1. 有人称赞你的新衣服。 2. 你不小心撞到了别人。

3. 有人不小心撞到了你并且向你道歉。

4. 你在一个人的生日晚会上祝福他生日快乐。 5. 你在一个朋友的婚礼上向她表达你的祝福。 6. 你被介绍给你的一个同龄人和一位教师。

➢ 要求:用英语在课堂上表演这些活动,老师和其他同学可以表演另一个角色。每个场景

的表演时间不超过一分钟。 ➢ 评分标准:每个场景应包含至少一个美国人常用的手势,运用以英语为母语的人比较容

易理解的口语表达,没有语法错误。在每个场景中的回应必须符合美国文化的习惯。

④ 词和短语的文化内涵 学生应该意识到,即使最平常的目的语词汇和短语在特定文化背景下,也可以激发人们不同的形象联想。

➢ 题目:从学过的单词表中找出五个名词、五个动词,确认目的文化中与这些词相关联的

形象。

➢ 要求:十个单词应在课堂活动进行的前两天给出。课堂测试进行30分钟。在测试中,

教师将展示25张图片或者特征描述(走、坐、手势),学生从中找出与目的文化相关联的。

➢ 评分标准:学生必须能够准确确认出其中7个单词。

⑤ 对文化观点的评价

学生应该具有对目的语文化进行概括的能力,并能对已有的观点作出评价和修改。 ➢ 题目:评价10个用英语给出的对德国文化作出的概括,分别给出下列结论:(a)可能正

15

确;(b)可能错误;(c)我不知道其是否正确。对于可能错误的概括,简要陈述能够驳斥其错误的证据。对于不确定其是否正确的概括,简要陈述你还需要哪些附加信息才能得出结论。(每正确地确认一个正确或者错误的文化概括,即得分,对于那些不确定其是否正确的文化概括,如能对需要哪些附加信息提出好的建议,也得相同分数。) ➢ 要求:10个概括应在测试时给出。答题时间为45分钟。 ➢ 评分标准:必须答对80%或80%以上。

⑥ 对其他文化的研究

学习者应该掌握从文学作品、媒体、人和个人观察中搜寻和组织与目的文化相关的信息的技巧。

➢ 题目:针对你感兴趣的有关于目的语文化的一个问题进行研究:

1. 在期刊中找到至少五篇与该问题有关的论文,其中至少应有一篇来自于专业刊

物。找到五本可能包含与该问题有关信息的书。为每篇论文和每一本书准备一个独立的索引,使用标准的目录模式。

2. 在找到的这些出版物上定位与你的问题相关的页码。在索引卡上标注页码。 3. 阅读这些材料,在索引卡上记录最重要的信息。 4. 写出大纲,理清需要研究的问题。 5. 列出可能影响你研究的主要变量。

6. 列出20个问题,并向以英语为母语的人提问,以便为你的研究提供更多的信息。

问题中应包括一些可以暴露被调查人的偏见的问题。

7. 列出10种其他的查找信息的方式,并给它们以同样方式建立索引卡。

8. 做一个简要的报告,口头报告或篇幅不超过250字的笔头报告均可。探讨你最初

要研究的问题的可行性。

➢ 要求:以上八项活动中的每一项均应给学生不超过一周的时间来做。每一项完成后应交

由老师进行评价,并给予反馈。

➢ 评分标准:前七项每一项最高为10分,最后一项为30分。学生必须达到70分以上。

第四节 跨文化交际测试题型

宏观上,跨文化交际能力测试的内容和方法不一而足,通常可以采取两种方式: 一种就是在一张试卷中,单独列出一部分试题来考察学生的跨文化交际能力。Moore (1994)认为文化测试部分在整张试卷中的比例应该是20%。另一种方法就是将文化部分的试题融入其他部分,比如阅读、翻译、听力、写作等。这一种方法的缺陷是因为测试范畴属于综合性,从而不易分辨出多项组成因素。

在确定了考试的大框架(如考试目的、受考能力范畴)后,我们着手规划如何来实现这些目标,也就是如何测试语言学习者的跨文化交际技能。这个过程牵涉到具体方法的制定。我们能用哪些考试题型测试语言学习者的文化知识、文化理解能力和文化表现力呢?

本节主要介绍各种考题形式和各自的特点。为了便于讲解,我们参照Brown和Hudson(1998:658-667)提出的语言能力评估分类法,将考题形式分为三大类进行讲解: selected-response assessment(择答题类评估方法),constructed-response assessment(做答题类评估方法),personal-response assessment(个性化答题类评估方法〉。

1.择答题类评估方法

● 多项选择题

多项选择题通常由两部分组成:题干(stem)和备选项(options)。备选项中包括正确选项(key)和干扰项(distractors)。备选项数目不定,有三项的、四项的或五项的,大部分考试以四

16

项为常用形式。多项选择题是目前考试中用途最广、最常见的考题形式,是间接考试、客观考试和分离式考试的典型代表(邹申,2000)。

Valette (1977:263 - 281)在文化测试的研究中提出采用匹配、多项选择题和正误判断题的形式来测量学生的文化知识(诸如历史、地理等)。Lado (1961)亦主张客观语言测试的方法。他认为文化知识可以被客观地测量出来。下面是Lado的例子:

It was spring again in Madrid, March 21, and a cheerful sun filtered through the window. The large clock in the dining-room struck the half hour. “Two thirty,” said father, “and the food looks good.”

The time of this meal is:

1. normal everyday time. 2. special occasion time. 3. not Spanish.

The expected response is “1. normal everyday time.” 多项选择题具有以下特点: 1)评分客观且操作简易,有条件的话可以用机器阅卷,因此阅卷人的信度可以得到保证。 2)多项选择题是一题一个考点,因此考题具体且目标明确,学生阅读题后清楚考点所在。 3)由于多项选择题只要求学生选项,故考试中不存在语言技能交叉或混合的现象。 4)多项选择题在语言测试中的用途广泛。测试范围包括文化知识(如目标语文化的历史、地理知识等)和文化理解。测试层次可覆盖识记、领会及文化表现。

然而,如同它引人注目的优势,多项选择题本身的局限性也使它成为反对者的众矢之的。Moore (1994:163-182)是极力反对采用多项选择题的代表。他认为这种考试会迫使学生只会记住一些细枝末节,从而使文化学习变成了零散知识的记忆因而导致文化定势(cultural stereotypes)。多项选择题的局限性大致有以下几种:

1)在一定程度上鼓励学生盲目猜题(blind guessing)。

2)命题工作费时费力,对命题人员的业务素质要求高。

3)作为间接考试的一种形式,能否有效地测量文化能力仍是悬而未决的问题。 4)过多的使用可能对教学带来负面后效作用,不利于跨文化交际能力的培养。 但是根据最新调查显示,正误判断和多项选择题依然是大部分外语教师测量文化时最常用的方式( Moore, 1994)。这样的题目由于可操作性强,,始终受到广大教师的青睐。 ● 正误判断题

正误判断题一般由一个句子组成。从句子结构上讲,这个句子可以是简单句,也可以是复合句或复杂句。它既可表述一个事实,亦可表述一个观点。

Valette (1977:263-281)在文化测试的研究中提出采用正误判断题的形式来测量学生的文化知识(诸如历史、地理等) 。Valette的文化测试题目如下:

1) Question: Is this a typical action or not? a =true; b= false

Item: For breakfast Herr Braun had orange juice, ham, and scrambled eggs. Answer: a.

2) Please decide whether the following statement is true or false according to your knowledge of Americans’ norms or practice.

When someone compliments the watch you are wearing, you would say, “Oh, you like it? It's not worth much.”

正确答案: False.

正误判断题有以下特点:

17

1)题目相对容易撰写,命题难度不高。 2)评分客观且容易。 3)题目的覆盖面广。

但是,正误判断题由于只有正误两个答案,猜题的概率高达50%。为了减少猜题的因素,一些学者(Alderson, 1995; Heaton, 1991转引自邹申,2000)建议采用三个备选答案的方法。除了T和 F外, 命题人员可以另列一个答案:not given。或者我们可以在该项目的提示中写明:According to the passage, are the following statements true (T) or false (F), or is it impossible to draw any conclusion (I)? ● 匹配题

匹配题一般总是由两大部分组成:匹配栏与被匹配栏。该项目的答题要求是应试者在两栏中进行正确配对。例如,匹配事实(Match the Facts):把人物和事件分为两栏,让学生找出对应的人物和事件。Match the following persons with their contributions:

1. Franklin Roosevelt a. American novelist

2. Isaac Newton b. English writer and lexicographer 3. Samuel Johnson c. American president

4. J.D. Salinger d. English mathematician, physicist, astronomer and philosopher 正确答案:1, c; 2,d; 3,b; 4,a

撰写匹配题时,也可以采用左右数量不等的选项,这样可以减少应试者猜测的机会。请看Valette的匹配题: Match the following persons with their contributions:

1. Rochambeau a. poet and president of Senegal 2. Senghor b. feminist writer

3. DeBeauvoir c. pioneer aviator and novelist 4. Curie d. discoverer of radium

e. commander of French troops during the American Revolution

正确答案:l, e; 2,a; 3, b; 4, d

匹配题具有评分容易的特点。它也有自身的局限性:第一,它的主要作用仅在于考查学生的语言知识、单项语言技能或简单的运用知识,无法测试学生的综合语言运用能力。

2. 做答题类评估法

● 简答题

简答题是通过学生的简短回答来测试学生在某一方面的能力或技能。Valette提议采用简答题来考查学生如何理解目标语文化中的礼节和文化的具体表现。简答题可以要求学生用完整的句子回答,或用单词或词组回答。

使用简答题形式时特别要注明答题的要求:用一句话来回答?还是用一段话来回答?字数是否有限制?例如: How might you explain to the foreign teachers and to the Foreign Affairs Office why this misunderstanding occurred? You are to write an explanation of about 50 - 60 words based on the given passage.

简答题的优点是:第一,学生在回答时没有任何提示可以参照;第二,学生必须在理解的基础上才能正确答题,可以排除盲目猜题的现象;第三,强调运用语言的产出性技能,而不是接受性技能。

简答题最大的弱点也就是主观题所具备的最大弱点:评分难以做到客观、公正。因此应该提供较为详细的评分标准。 ● 翻译题

18

翻译测试:我们亦可采取翻译的方法来考察学生的跨文化交际能力。比如2003年八级英译汉测试就涉及对学生跨文化交际能力的考核,下面摘录两例:

1. 考查学生对英语国家社会文化背景知识的必要了解。

In his classic novel, “The Pioneers”, James Fenimore Cooper has his hero, a land developer; take his cousin on a tour of the city he is building.

我们在阅卷过程中发现,大多数学生把classic一词翻译成了“古典”(在库柏的古典小说“拓荒者”中……)。实际上美国的历史短暂,该词被翻译成“古典”是讲不通的,理想的翻译是“经典”。

2. 学生误将汉语使用习惯迁移到相应的翻译材料之中,不自觉地将中国的习惯混同于西方的习惯。

Cooper was illustrating a distinctly American trait, futuremindedness: the ability to see the present from the vantage point of the future. 文中划线部分的意思是“美国人从将来看现在”。而将近一半的学生把它翻译成了“从现在看将来”。我们中国人所受的教育就是从现在看将来,个体所能把握的只有现在。而美国人的思维是一种将来的思维。美国的历史很短,更多地在对于将来的计划和想像中表现出自己的民族特性。这句话中没有任何生词,但是却有将近一半的学生翻译反了。问题的根源到底在哪里呢?我们认为这主要是学生的汉语思维在作怪。他们认为不可能还有从将来看现在的能力,所以不假思索,就自己创作出了那样的译文。较贴近原文意义的译文是:他们能够站在未来的高度来看现在的一切。

翻译题的优点在于它不是单纯考查学生的文化知识,而是亦能考查出学生内化了的文化能力,即学生跨文化交际能力的运用。如果采用翻译题来考查学生的文化能力,那么评分标准应该与普通的翻译评分标准有严格区别。 ● 口试

Seelye(1984)认为可以采取口试的方法来测试学生的跨文化交际能力。目前英语口试的组织形式主要分为两种:直接口试和半直接口试。直接口试是一种传统的口语能力测试方式,考官与考生需要进行面对面的交流,考官根据考生的表现当场评定考生的成绩。此种方法能突出测试的真实性,从而能够较好地测量跨文化交际能力。缺点是不太经济,费时费力。半直接口试是一种以录音磁带为媒介,事先录制好试题的口语测试方式。测试时考官与考生不进行面对面交流,考生根据录音要求回答问题。考试结束后,考生录音带寄往测试中心,由经过训练的考官统一进行审听评分。此测试的缺点是由于考官与考生不进行面对面的交流,所以测试的交互性( interactiveness)不高。

3. 个性化答题类评估方法

在前面的两小节中,我们讨论了目前在英语测试中常用的一些考题形式,这些考题形式都是大规模测试可以采用的形式。接下来我们将介绍课堂文化测试可以采用的方式。这里我们参照Seelye(1984)提出的观点,Seelye认为除了可以采取口试和客观考试测量学生的跨文化交际能力外,还可以采用课堂检查表(classroom checklist);模仿(simulation);视觉测试(visual)、听觉测试(audio);触摸型测试( tactile)等。另外文化测试研究者Moore (1994)认为既然文化教学的目的是增强学生的跨文化敏感性,那么评估的方法应该是测量学生的洞察力和文化意识。他提出了一种学期作品建档法(portfolios)来衡量学生的文化知识,认为应该强调学习的过程而不是学习结果。下面将一一介绍: ● 课堂检查表(classroom checklist)

课堂检查表亦称学生活动的细目表,即教师将学生需要掌握的文化目标以课堂活动的形式制成一张表。教师通过学生是否成功完成了表上的各种活动来了解学生是否掌握了该课程

19

的文化目标。此种方法只适合于小班考试。 ● 模仿( simulation)

模仿的特定控制场景就是根据测试目的将被测试者放到目标语文化中的一种方式。模仿是测量语言学习者跨文化交际能力最理想的办法。被测试者会被安排给一种角色,如拉丁美洲学生领导、法国总统、农民、商人或志愿者。一系列解决问题的场景将以目标语文化中的形式展示出来。但是这类测试的准备和标准化需要大量的工作。 ● 视觉测试(visual)和听觉测试(audio)

视觉测试就是考查学生是否能识别出异域文化中的典型场景。为了了解学生是否会识别出售彩票者的形象,可以采取在幻灯片上播放以下拉丁美洲的几个片断:街头糖果小贩、生意人、卖口香糖的男孩,还有出售彩票者的头像。然后让学生识别出来。视觉测试只适合于班级测试。

听觉测试原理类似于视觉测试。听觉测试就是考查学生能否听辨出异域文化中的典型场景。学生需要对听力剌激做出反应。磁带可以灌录彩票出售者现场叫卖的声音,一段宣扬宗教的演说,收音机商业广告等。

值得一提的是,听觉测试既适合班级测试也适合大规模考试。大规模听力考试同样可以设计文化方面的试题。 ● 触摸型测试( tactile)

触摸型测试就是利用具体物体测试学生对于文化的敏感度。可以给学生一张彩票,让他在报纸中寻找获胜号码。也可以给学生一把刀、叉子、汤匙、盘子,然后看他如何吃墨西哥大餐。中小学老师可以采用这种方法,但大规模测试不太可能采用这种方法。目前还没有教师探索触摸型测试的可行性。 ● 学期作品建档法( portfolios)

学期作品建档法属于延续性评估类,时间跨度可短可长。该方法并不要求学生答题,而是考查学生的语言实际运用情况。学期作品可以包括学生本人按照某一主题所写的文章、收集和整理的资料、制作的电脑文件、软件、光盘或幻灯片等。下面是Moore的例子:

Chaz, a seventh-grade student originally from Quebec, undertook a study on “Greetings and Leave-takings” in French. He and his teacher worked together to identify eight French speakers, of both sexes and different ages and economic status in the community. Armed with amateur enthusiasm and experience and a school-owned camcorder, Chaz interviewed these eight French speakers. Two were students from Haiti, two were native-speaking French teachers from France, two were students from Quebec and two were neighbors who came from the Ivory Coast. He prepared five questions with the help of his teacher: 1) How do people in their French community greet each other? 2) How do they take leave of each other? 3) Do these forms vary among age groups? 4) Do they vary by sex? 5) What gestures accompany these acts?

Chaz共花了20小时准备这一项目。结果是他获得了一套关于如何用法语打招呼和告别的语言样本。教师可以根据学生提交上来的这些作品来评判他们的成绩。

学期作品建档法有以下特点:

1)对于学生来说,有利于提高他们的学习积极性;鼓励实践和复习所学内容;提高他们在学习过程中的参与程度和加强同学间的合作。

2)对于教师来说,可以使他们更全面、更细致、多角度地了解学生跨文化交际能力的提高情况。该方法给教师提供机会来观察学生在不同语境中完成各类真实任务的能力。

但是学期作品内容的确定应兼顾代表性和可行性,制定的评阅标准要具有客观性和公正性(邹申,2000)。

以上介绍了文化测试中可能采用的一些测试方法。有些方法适合于大规模考试,有些方

20

法适合于课堂测试。测试方法的选取主要依赖于测试的目的,同时要考虑到实际操作条件和制约因素。

第五节 小结

跨文化交际能力测试的结果是检验跨文化交际能力培养体系是否合理的重要反馈,是指导教学、保障教学质量的有力依据。所以我们必须从各个维度保证其信度和效度。信度是确保效度的基本前提,没有信度的测试就没有效度。但是,有信度的考试未必就一定有效度,因为效度关注测试是否能达到目的以及对测试成绩的合理解释和使用,信度则关注测试结果的一致性。信度和效度不是独立的、完全割裂的,它们相互依赖,形成互补,因此在测试的不同阶段需各自做出综合全面的考虑。测试从设计、实施到评分的过程较长,各阶段的重点不同,但对信度与效度都要做系统的考虑,各个环节都不能疏漏并需贯穿测试的全过程。而各个阶段确保信度和效度体现对受试者的人文关怀,是高质量测试的基本保障,也是实现测试的科学化、合理化、公正化和现代化的必经之路。同时,我们应当正确看待文化测试结果。文化测试结果并不等于学生的实际文化能力,尤其是笔试结果。笔试时学生有时间思考,而真实交际环境则需要交际参与者的临场发挥,随机应变。笔试时学生根据上下文或选择项可以作出较为正确的判断,但在真实交际情境中,学生受母语文化的习惯干扰,很多不合目的文化习惯的话语可能会脱口而出,要正确对待这种情况。

本章提及了跨文化交际能力的各种测试内容、测试方法和测试形式,比较全面地对现阶段跨文化交际能力的测试作以总结,测试方法和形式具有一定的代表性和可行性。但这些方法并没有穷尽所有,文化测试研究者和实施者还应该针对具体的情况,分析测试的形式和可行性,以求在最大程度上保证跨文化交际能力测试的信度和效度,有效地反拨教学。

21

22

因篇幅问题不能全部显示,请点此查看更多更全内容