当前位置:主页 > 人才与院校 > 人力资源 >

人才评鉴之误

2012-06-20 00:00

作者:

来源:


  国内某大企业的招聘专员们,众星捧月地围着一位仙风道骨的老者,会议桌上摆满了应聘者简历。老者是公司重金请来的风水大师,他提供的服务从办公室选址及内部装修装饰,渗透到人才招聘。生辰八字、属相、笔迹、姓名、面相,构成这家企业选人的葵花宝典。
 
  而在西方发达国家则呈现了另一种景象。“多数求职者认为招聘专员会花四五分钟看一份简历。”招聘中介机构“阶梯”(The Ladder)最近公布了一份研究报告,“而实际上,招聘专员只用6秒钟扫一眼简历就做出合适/不合适的决定。”
 
  人才评鉴的效度关乎企业用人得失,更关乎人才的职业生命。最令人震惊的是,如此重要的事情,却采用如此随意的方式进行。根据哈佛大学的一项研究,80%的人才流失源于选才失误。无论是东方式的故弄玄虚,还是西方式的漫不经心,结果都是怀才不遇和怀财不遇—有才能的人得不到体面的工作,有财力的企业找不到能力强的人才。
 
  草率评鉴人才的做法,无异于“草菅人命”,是一种不能承受之轻。
 
  伪人才纵横四海,假测评行走江湖
 
  中介机构质量良莠不齐,造成“伪人才”盛行;而在人才评鉴领域,非科学、准科学、伪科学方法论鱼目混珠,科学方法论曲高和寡。    
 
  伪人才何以盛行  企业花重金聘用高级人才,却因为看错人而用错人,导致“伪人才”潜伏在关键岗位。在十几年的人才测评师生涯中,我所测评过的职业经理人年薪从几十万到几百万不等,从测评结果来看,名誉、地位、收入与能力没有很高的相关性。许多人貌似“人才”,却不能领导企业走向成功,甚至危害企业的生存和发展。
 
  伪人才纵横四海,靠的是六种看家本领:
 
  第一,优质学历、资历与形象;第二,卓越的面试经验和技巧;第三,个人品牌管理能力强,具有在公司内部营销自己的出色能力(唐骏的《我的成功可以复制》里分享了不少此类经验);第四,表面业绩好,有时,运气和市场因素也会成全某些伪人才的业绩指标,而且他们精于包装之道;第五,上行管理能力强,与上级建立良好的个人关系,深得上级的信任,甚至不惜借助潜规则向上爬;第六,管理自己职业生涯的能力强,精打细算职场得失,知道什么时候该跳槽,也知道往哪里跳。
 
  伪人才靠着以上本领,势如破竹,即使阅人无数的企业家,若不借助评鉴工具,用肉眼看人也难免看走眼。富有传奇色彩的前GE首席执行官杰克·韦尔奇,在战略思维上似乎无可挑剔,但他退休之际为自己选择的接班人,现在看来似乎是一个错误。咨询顾问Peter Cohan认为,杰克威尔奇在三个候选人中,没有选择最棒的Jim McNerney而选择了比较差的Jeff Immelt,但好在他没有选择最差的Bob Nardelli。
 
  横亘在企业与人才之间的中介机构质量良莠不齐,也造成伪人才盛行。低端招聘中介机构卖的是简历,高端招聘机构如高管聘请机构(俗称猎头),应深入了解企业文化、岗位要求、上级领导风格、行业特点,而且对候选人的各方面素质做详尽调查,但事实上,有意愿而且有能力在企业和高管人才之间做匹配的猎头顾问实属凤毛麟角。猎头顾问的原始动机是猎到猎物—只要人才到岗就可以收取费用。
 
  容易流行的假测评  一些企业觉得,让猎头负责人才的鉴定,就好像让装修公司的人验收装修质量一样,让人放心不下,于是,专业的人才评鉴机构出现了。如果说猎头公司是对高端人才的追踪、初选和包装推荐,那么人才评鉴公司就是拆开包装做“人才验收”。但令人失望的是,态度上兢兢业业、诚惶诚恐地验收人才,能力上知道看门道而非看热闹的专业人才评鉴公司也是凤毛麟角。在人才评鉴领域,非科学、准科学、伪科学方法论鱼目混珠,科学方法论曲高和寡。
 
  说人才测评是算命,是对测评业内人士的最大侮辱。可是相信算命的人力资源管理者不在少数。为什么类似算命的测评有很多人信?其实心理学家早在1948年就通过实验揭示了迷信的心理基础—福勒效应(Forer effect): 人们把人类的共性当成自己的个性。心理学家福勒(Bertram R. Forer)让学生们做一份性格问卷,告诉大家测评的结果是针对每个人的性格分析。但实际上,他给每个学生的分析都是一模一样的、从各类星象学拼凑而成的文字。学生们对这个分析的评价是“非常准!”(平均打分4.26,0~5分区间)
 
  2009年,通过一年的努力,严谨的英国科学委员会为科学重新下了一个定义:“科学是基于证据,通过系统方法理解自然界和人类社会的过程。” 这个定义有三个要点:第一,强调“基于证据”,这一点对人才评鉴十分适用;第二,强调系统方法;第三,把人类社会纳入科学研究的对象。所谓系统方法,指的是客观观察、量化、实验、统计分析、归纳、可复制、同行评议。在众多的特征下面,科学精神的实质是怀疑,科学的一个特征是假说可以被证伪。当一个理论、工具号称永远正确,一百年不变的时候,我们就要怀疑它的科学性了。
 
  在人才评鉴领域,越是科学的东西越枯燥乏味,越不敢自称绝对真理,越不容易流行。伪科学则相反。维基百科上列了一串长长的伪科学清单:星象学、笔迹学、颅相学、由日本学者收集大量统计数据的血型与性格,甚至测谎仪、心理分析皆榜上有名。有些伪科学,例如由德国解剖学家提出的颅相学,历史上一度以科学的面目出现。另一些伪科学源于对有限研究成果的无限制应用,例如基于神经科学研究发现的开发左右脑理论和NLP。还有一些伪科学如微表情识别,源于媒体的夸大报道和娱乐界的夸张创作(例如美剧Lie to Me)。
 
  伪科学测评方法论,以及部分以心理测验为名目的算命术(例如根据喜欢什么动物推断个人特征),无一例外极其简单形象、生动好玩,而且因为福勒效应,加上自己实现的预言(self-fulfilled prophecy,即人们相信一个预言会出现,就会相应地做出反应或自我暗示,结果让本来不一定发生的预言发生了。“信则灵”也是如此)和选择性记忆,也相当地“准”,大行其道绝非偶然。这些只可用于个人消遣的把戏,却被很多企业明里暗里用于招聘选拔,实在是一种不能承受之轻。
 
  心理类型学以MBTI和九型人格为最流行,有其科学成分。MBTI是基于心理学大师荣格的理论,经过心理测量学的研究检验并不断改进,为众多心理学家所接受。九型人格在主流心理学界获得的认可不如MBTI,但在社会上的影响力方面大有超过MBTI之势。心理类型学把人分成有限的几类(MBTI把人分成16类),把特定的个体锁定在特定类别以内、其他类别之外,既增进了自我认知,又局限了自我认知。心理类型学属于准科学,用MBTI于人才选拔就好比用步枪打坦克,是一种不能承受之轻。
 
  提到人才测评,多数人想到的是问卷和软件。人才测评,“滥”就滥在问卷,“软”就软在软件。问卷是自说自话。雪上加霜的是,很多问卷来自国外,即使做了本地化,也大多水土不服。既是翻译的问题,又是文化的问题。在测评领域,越是效度高、档次高的东西,越不容易软件化,电脑代替人脑是遥远的事。适合电脑化的测评工具,目前局限于自我报告的人格测验和智力测验。一般来讲,传统的纸笔测验很容易做到施测电脑化和评分、报告自动化。而中端的结构化访谈和高端的评鉴中心,充其量目前只能做到部分施测电脑化和评分汇总的电脑辅助。
 
  凭感觉看走眼,用工具“测不准”
 
  鉴人如鉴宝。肉眼看不准,自然会借助工具。问题是,伽利略的“度量可以度量的,把不可以度量的变成可以度量的”这一说法,是否适用于人才?                                                                           
 
  很多空降高管给人的印象,正如新华都高层人士对唐骏的印象,是“说得多,秀得多,做得少”。他们一旦进入企业,往往上演 “三刻拍案惊奇”:第一拍,“拍胸脯”—信誓旦旦。第二拍,“拍脑袋”—主观臆断。第三拍,“拍屁股”—干不好只好拍屁股走人。
 
  企业家为把企业做大而求贤若渴,却难免饮鸩止渴。主要出于以下五个误区。
 
  忠诚误区  企业家难免会有君王情结,非常看重职业经理人的忠诚。然而企业终究不是企业家个人的王国,企业家与经理人之间是契约关系。忠诚是相互的,终身无条件依附企业的人,是奴才而非人才。
 
  学历误区  好多成功的企业家学历不高,往往对高学历人士有一种好奇心和莫名的好感,领导高学历的人也会满足虚荣心。
 
  经历误区  唐骏的高薪,很大程度上跟他的辉煌经历有关。这个世界愿意为经历付钱,却不愿为能力买单。像刘邦和萧何那样,为没打过仗的韩信设坛封将的绝无仅有。
 
  业绩误区  找一份连年亏损的上市企业年报,看看CEO给股东的致辞,就知道什么是业绩包装了。业绩不仅可以包装,而且很难用KPI衡量。业绩的好坏只有一部分是可以用管理者能力的高低来解释的,具体取决于地域市场、产品市场、上级和下属的风格和能力等很多因素。
 
  孟尝君情结  很多企业家像古时的孟尝君,爱才,迷信多样化,积攒人才,有点像收藏古董,食客三千中,多数人只是食客。王安石曾作如此评价:
 
  世皆称孟尝君能得士,士以故归之,而卒赖其力以脱于虎豹之秦。
 
  嗟乎,孟尝君特鸡鸣狗盗之雄耳,岂足以言得士!不然,擅齐之强,得一士焉,宜可以南面而制秦,尚何取鸡鸣狗盗之力哉?夫鸡鸣狗盗之出其门,此士之所以不至也。
 
  我们从中可以学到两点:
 
  第一,物以类聚,人以群分。道不同,不相为谋。不能把鸡鸣狗盗和雄才大略的人放在一起。第二,人才不能储备。没有用武之地,人才就会像食品一样腐败变质,“保鲜期”很短。
 
  害群之马的主要人格障碍  企业不仅容易“空降”伪人才,也容易在校园招聘和社会招聘上栽跟头。如果说高管招聘问题主要在于选优,那么新员工招聘问题主要出在劣汰。
 
  大型企业招聘量大,容易让有破坏性心理问题的害群之马混进企业,可谓引狼入室。据美国国家心理卫生研究所(NIMH)的数据,各类精神疾病年发病率为22.1%。在中国,不是特别严重的心理问题一般都会被视为“脾气不好”。因此该数据虽略嫌夸张,但基本可以参考。以下是按照心理问题分类的统计:
 
  反社会人格障碍: 2.1% (USSG美国公共卫生署);边缘人格障碍: 2% (NIMH);精神分裂症: 1.3% (USSG);抑郁症: 9.5% (NIMH);焦虑症: 2.8% (NIMH)。对企业危害最大的是反社会人格障碍、偏执型人格障碍、边缘型人格障碍。
 
  人格障碍是在个人成长经历中逐渐形成的,绝非一朝一夕可以转变,这类人往往成为企业的负资产。企业管理者,特别是人力资源管理者,必须在招聘这一关过滤掉以上三种变态人格。最后还要警惕抑郁症,这是自杀的罪魁祸首。
 
  空降高管经常由于看走眼或水土不服,效果不理想。按照Noel Tichy的说法,企业如果不得不从外面找CEO,已经说明企业在人才梯队培养上失败了。企业必须从内部培养人才。问题是谁值得培养?这又回到选人的老问题。众多企业并不善于在早期发现高潜质领导人才,梯队建设压错宝,是内部选拔不能承受之轻。
 
  “测不准”的魔咒  鉴人如鉴宝。肉眼看不准,自然会借助工具。问题是,伽利略的“度量可以度量的,把不可以度量的变成可以度量的”说法,是否适用于人才? 源自物理学的“测不准原理”,是否成了人才测评技术的魔咒?
 
  所谓测不准,就是效度低。以我的知识和经验,效度第一杀手是测评标准之误,第二杀手是测评工具之误,第三杀手是测评师的低素质。
 
  标准之误  测评什么,其实比怎么测评更加重要。请允许我用一种时下流行的说法,把人才标准的演进划分成1.0、2.0、3.0时代。人才标准的1.0时代,是地主找长工、手工作坊找帮工的时代盛行的人才标准,今天仍有企业以此为选人用人的核心,依据人口统计学指标(demographics),就是性别、年龄、教育程度、工作经历这些硬指标。
 
  人才标准的2.0时代,是工业化时代的测评标准,在硬指标符合基本条件之后,重点从四个方面的软指标看人才,用英文首字母缩写表示为KSAO,即知识(Knowledge)、技能(Skills)、基本能力(Ability)以及其他(Other,包括价值观和性格等)。注重人和岗位之间的匹配(Person-job fit)。这个时代测评开始盛行。
 
  人才标准的3.0时代,以20世纪70年代美国心理学家麦克里兰(David McClelland)的优秀人才心理素质研究为标志。受美国政府委托,麦克里兰研究美国驻外外交官中优秀者与平庸者之间的区别,从而帮助政府甄选优秀外交官。以往的外交官来自著名大学,通过美国史、西方文明史、英语、经济、政府五门考试择优录用,这些高材生能胜任但并不优秀。麦克里兰的研究发现,最关键的心理素质有三:
 
  第一,跨文化人际敏感性:理解不同文化背景的人所讲的话的真正涵义,并预测其反应的能力;第二,正面看待他人的心态:对于不同文化背景及持不同政见的人,尊重其人格,认可其价值,即使面对压力亦能如此;第三,领悟政治关系的速度:迅速了解谁能影响谁以及他们政治倾向的能力。
 
  麦克里兰把区分优秀与平庸的心理素质称为competency,国内有各种翻译,例如素质、资质、能力、心理素质、“胜任力”等等(其中胜任力的翻译是一种误导。因为麦克里兰的研究就是为了超越胜任)。这个时代的用人标准不仅考虑人与岗位的匹配,同时考虑人与企业匹配(Person-organization fit)。
 
  自从素质概念产生之后,企业纷纷建立自己的素质模型但收效甚微,甚至适得其反。成功使用素质模型的例子首推GE前CEO杰克·韦尔奇的三个E模型:Energy,做事要有激情; Energize,领导干部要让自己的团队做事情有激情;Edge,勇气和决断,对人对事要敢于采取果断措施。后来他觉得3个E还不够,又补充了一个Execute,执行,即完成使命的效果。前面三个E是为领导人才设定的能力标准,第四个E是业绩标准。
 
  人才的标准放之四海而皆准?如果是这样,企业只需给通用标准赋予个性化的诠释,大可不必劳民伤财地“重新发明轮子”。
 
  工具之误  在人力资源从业者心中,测评的原型是心理测验,有能力测验和人格测验(包括对性格和价值观的测评)。单凭能力测验可以汰劣,不能择优。
 
  智力的重要性并不因情商的流行而下降。智力是学习能力、适应环境的能力,但智力并不是智力测验所能测评的能力。所有智力测验里面,问题都界定好了,条件也确定好了,甚至连供选择的答案都有。而商业世界中的智力高下,在界定问题之时已见分晓,现实中没有标准的答案,而答案却有着数不清的标准。
 
  人格测验其实不应称为测验,因为没有难度,更准确的说法是人格问卷。人格与业绩的相关性一直饱受争议。理论上,人格与业绩应该有很大关系,只是人格难以用问卷测评,因为完全基于被测评者的自我报告,人格问卷正在沦为自我概念陈述。主流心理学界推崇心理特质(trait),其理论优越于类型学,比较有代表性的是卡特尔16因素、大五人格、普德(PDI)开发的全球人格问卷(GPI)、SHL开发的OPQ,完全可以用于个人发展和用人参考。
 
  拿相关当因果,造成了人格问卷的滥用。相关不等于因果,比如外向性格与销售和管理类岗位业绩的正相关,也只是相关而不是因果。所以,做人格问卷的机构切勿以“典型或优秀的员工性格特征图是这样的,而你是那样的”而把人才拒之门外。
 
  很多企业用个体测评的统计学汇总作为团队和组织能力的测评,这样并不能准确展示集体的属性。例如, Patrick Lencioni认为团队的五个功能失常是:缺乏信任、惧怕冲突、不认真、逃避责任以及不关注结果。这是团队属性,不是个人属性的简单相加、平均或组合。测评团队,必须以团队属性为测评标准,组织能力的测评就更加难,不等于个体能力的相加或平均。
 
  面试是目前人才评鉴的主打方法,但是,单凭面试依然无法判断工作能力。历史上最著名的面试是隆中对,就是面试中夹带着案例分析。诸葛亮做了个SWOT分析,然后制定了三分天下的战略。刘备很认可,“与亮情好日密”。但这个面试,用现在的术语说,一没有用人标准,二没有打分标准。陈寿《三国志》这样评价诸葛亮:“连年动众,未能成功,盖应变将略,非其所长欤!”如此看来,刘备并没通过面试找到擅长应变将略的人才。而诸葛亮的上行管理和鞠躬尽瘁倒是有目共睹。
 
  测评师之误  面试的成败,取决于面试的结构和面试官的造诣,然而面试毕竟测不准实际管理能力。应对面试的书,远远多于实施面试的书,真是道高一尺,魔高一丈。
 
  “始吾于人也,听其言而信其行。今吾于人也,听其言而观其行。”孔子所谓“听其言而信其行”,是问卷和面试。“听其言而观其行”,则是行为观察。来自军事领域的评鉴中心(Assessment Center,也译为评价中心),综合使用各类测评工具,其中必须包括情景模拟,让被测评者在测评师的观察之下,在规定的时间、地点做规定的管理事项。
 
  评鉴中心的效度研究结果很纠结。乔治桑顿三世在《评鉴中心在人力资源管理中的应用》书中指出,效度在0.37上下波动幅度很大,低至0.15,高至0.65。效度两极化,也许能从测评师素质上找到答案。测评就像战争,武器先进很重要,但也必须由训练有素的人来使用。
 
  一个优秀的测评师,必须符合三个条件:首先是尊重人才到了敬畏的程度,做测评的时候诚惶诚恐;其次是有见识,智力高,常识好,这是判断力的基础;第三,必须懂科学心理学和商业管理,既受过系统训练,又经历过实战,不只是“略懂”。
 
  评鉴中心是公认的高成本高效度方法,每测评一人,直接付给测评机构的费用,少则几千,多则几万。加上间接人财物的投入,可谓不菲。天价测评令一般中国企业望而生畏,万科、华润只是极少数领跑者。

  纵观各种测评方法论,其效度和适用范围不可同日而语,我做了一个如图1所示的排序,在业界流传,不无争议。比较新近的研究(根据Pilbeam和Corbridge 在2006年对众多研究的总结)基本上支持图中的排序(表1):

  评鉴中心作为效度最高的综合方法论,也有其固有的缺陷。首先,人际关系的历史很难模拟,其次,企业很难用之于资历高的人,尤其是在企业有求于人才之时。面试更让人感到尊重,而模拟则容易让人感觉像在演戏甚至耍猴。第三个缺陷评鉴中心无法逾越“品德测不准”这道鸿沟,而品德却是公认最值得测的指标。巴菲特选股,除了看企业现金流量表,就是看领导班子。他认为选人看三点:诚信,智力,活力。没有诚信,智力加活力会是灾难。
 
  正如财务资本必须审计一样,人才必须评鉴。信心来自最佳实践,著名猎头公司亿康先达(Egon Zehnder)为找到合适的猎头顾问,制定了明确的标准,并不惜二三十轮面试。“测不准原理”不是要我们放弃人才评鉴,而是要我们怀有诚惶诚恐的心态。人才评鉴做得好,是消灭怀才不遇和怀财不遇,做得不好,就是草菅人命。影响人才命运的相关从业者,请慎重为之。(A05)

分享到:


相关新闻