パフォーマンス評価制度の構築

2026.03.02
パフォーマンス評価制度の構築

パフォーマンス評価制度の構築

SESの評価は「配属に左右されない」から設計する

常駐エンジニアの評価は、配属先の文化や工程、裁量の違いでアウトプットの見え方が大きく変わります。ゆえに「成果物の豪華さ」や「顧客の機嫌」だけで測ると不公平が生まれ、昇給やアサインが歪みます。まずは役割定義と等級基準を言語化し、評価は「役割期待に対する実行度」で見る前提を固めます。

おすすめは、等級ごとに行動と判断の範囲を明文化することです。例としてL1〜L5で以下の粒度をそろえます。

  • L1: 指示下でのタスク完遂、日次報連相の正確さ
  • L2: 小さな仕様の自走、レビュー指摘の減少傾向
  • L3: 工程横断の調整、顧客折衝の一部主導
  • L4: スコープ定義・見積の主担当、リスク先回り
  • L5: 顧客課題からの提案創出、チーム育成の仕組み化

この「期待の物差し」を先に合意してから、案件や顧客が違っても比較可能な評価指標に落とします。さらに、案件ごとの制約に応じて「案件難度係数(0.8〜1.3)」を設け、裁量が低い環境やレガシー制約下でも不利になりすぎない調整を行います。

評価指標の設計:クライアント価値×プロジェクト貢献×成長×コンプライアンス

1. クライアント価値(重み40%)

  • 受入評価スコア(定義済みの設問で四半期ごとに回収)
  • 期限遵守率・手戻り率(レビュー差戻し件数/総チケット数)
  • 障害再発ゼロ継続月数、依頼からの応答SLA遵守
  • 追加発注・延長への貢献(提案数、顧客側の指名率)

自由記述はバイアスが強いので、5段階x具体行動のルーブリックを用います。例:「仕様不明点を自ら論点化し、選択肢を提示して決裁に導いた」なら4点以上、など。

2. プロジェクト貢献(重み30%)

  • ナレッジ共有(社内記事、手順書、再利用可能なテンプレ)
  • レビュアー実績(件数と指摘の有効率)
  • 見積・要件定義・検証環境整備など、工程外の支援
  • 採用・育成への寄与(面接同席、メンタリング)

客先の外でも価値を生む行動を評価対象に含めると、短期のタスク消化だけに偏りません。ベンチ期はここを中心に配点します。

3. 成長(重み20%)

  • スキルマップ達成度(技術/工程/ビジネスの3領域で到達レベルを自己/上長で二重確認)
  • 資格・学習の実践移転(取得だけでなく案件での適用事例があること)
  • 生成AIの活用品質(設計レビューやテスト観点の質向上にどう効いたか)

レビュー文面のドラフトや振り返り集約にはChatGPTやClaude、Copilot、Geminiを補助的に使うと、記述のばらつきを減らせます。機微情報は匿名化し、出力は必ず人が校正します。

4. コンプライアンス(重み10%)

  • 勤怠・セキュリティ順守、ログ/持ち出し/撮影等の約定遵守
  • レポーティングの正確性(日報・工数の整合)

最終スコアは「各指標の実績×重み×案件難度係数」の合計で計算します。加えて、短期的な偶然に引きずられないよう、直近3四半期の移動平均で昇給判定に用いると安定します。

運用プロセス:四半期サイクルとキャリブレーションの設計

  • 月次:現場1on1(15分でも実施)。目標の進捗、阻害要因、顧客の温度感を事実ベースで記録。
  • 四半期初:SMARTな目標設定(例:レビュー指摘密度を3→1/PRに、仕様不明点の「論点メモ」提出を週2本など)。
  • 四半期末:360度の軽量回収(顧客担当/社内PM/ペア)。設問は最大10問、行動記述2問まで。
  • キャリブレーション会議:職能横断で評価分布を揃える。事例と証跡を持ち寄り、極端値はルーブリックに照らして再判定。
  • データの自動化:チケット、PR、工数、ナレッジ投稿を定期収集しダッシュボード化。AIで要約のみ支援し、最終判断は人。

顧客への依頼テンプレを用意し、負荷を上げない工夫が肝要です。例:「5分で回答可・選択式中心・自由記述2つまで」。また、短期の炎上で評価が崩れないよう、原因が外因の場合はメモに残し、次期での回復余地を示します。

活用例:都市圏で50名規模のSES専業、評価が不公平と離職に繋がったケース

背景:中堅の常駐中心。評価は顧客の5段階アンケートが主で、配点の大半を占めていました。結果として、裁量の大きい新規開発にいる人ほど高得点、運用保守では伸びにくく、昇給が頭打ち。ベンチ期は評価対象外で、社内貢献をしても点がつかず、半年で離職が増加しました。

改善:前述の4軸に再設計し、重みは「40/30/20/10」に。運用保守や制約の強い環境には案件難度係数1.2を適用。ベンチ期は「プロジェクト貢献」を最大配点にし、社内ドキュメント整備やプリセールス支援、技術検証を正式に評価対象へ。四半期の360設問は10問に統一し、自由記述はAIで要約(ChatGPT/Claude)してキャリブレーションに持ち込みました。レビュー指摘の質はCopilotの提案採否やPR記述の改善で可視化、目標の文面整備はGeminiで草案を作成し短縮しました。

結果:半年で評価の納得度が社内サーベイで30%改善、離職率は前期比で緩やかに低下。顧客満足の変動も小さくなり、延長率は上向きに。何より、運用保守チームからも「どう頑張れば昇給できるか」が見えるようになり、ナレッジ共有が活発化しました。

よくある落とし穴と最終チェック

  • 顧客スコア偏重:質問票に行動指標を入れ、自由記述はルーブリックで解釈する。
  • 資格の過大評価:取得だけで満点にしない。案件適用の事例提出を必須に。
  • 短期の事故で評価が決まる:3期移動平均と「外因メモ」で平準化する。
  • 書類運用の重さ:指標は10個以内、入力は15分以内。AIは草案のみ、人の最終判断を徹底。
  • アサインの不公平:難度係数と配属ローテの可視化で中長期の均衡を取る。

常駐エンジニアの価値は、顧客の現場で静かに積み上がる「再現可能な行動」に宿ります。配属の偶然に左右されない評価制度を用意することは、単なる人事の仕組みづくりではなく、アサイン戦略、単価、延長率、育成の循環を良くするための土台そのものです。SESという事業区分の特性を踏まえ、データとルーブリックで現場の努力を正しく拾い上げる設計にしていきましょう。