相互評価の誤差

ちと古い話ですが、[id:lethevert:20051213:p3]で取り上げた相互評価の話。
直感的な話で申し訳ないですが、全社員が自分に仕事上関係する人の評価を相互につけて、その結果を集計して個々人の評価を決定するというようなシステムの場合、
1.人数が少ない場合に、標本の少なさから、真の値と測定値の誤差が大きくなる可能性
2.人数が多い場合に、クラスタ化が進むことで、クラスタ間の評価尺度に違いが生まれる可能性
の2つの懸念があるように思うのですが、このような問題を分析した先行研究ってあるんでしょうか?