誰も求めなかった新しいパフォーマンス評価指標
企業パフォーマンス管理のどこかで、誰かがこんなアイデアを思いついた:AIトークンにお金を払っているなら、誰がそれを最も使っているかを測定できるはずだ。そうして新しい職場指標が誕生した——AIトークン消費を生産性と関与のプロキシとして使用すること。
テック企業の一部が、AI プラットフォーム投資を正当化し、早期採用者を特定したいと考えて、従業員が大規模言語モデルトークンをどれだけ速く消費するかを監視していると報告されている。消費されるトークンが多いほど、労働者がAIに関与しているはずだ——というのが理屈である。これは一見合理的に思える管理的論理だが、約30秒間検討すると問題が明白になる。
トークン数が悪い生産性指標である理由
トークン消費はAI使用状況を測定するもので、仕事の成果ではない。コーディングの問題に対する5つの代替アプローチをClaudeまたはCopilotで生成してから最適なものを選ぶ開発者は、初回で自力でクリーンなコードを書く開発者よりもはるかに多くのトークンを消費する。トークン消費指標の下では、最初の開発者の方が高いスコアを獲得する——2番目の開発者がより良い仕事をしていたとしても。
この指標は他の方法でもインセンティブ構造を逆転させる。AIの制限を理解し、慎重に使用する従業員は、より良い出力を期待して繰り返しプロンプトを出す従業員よりも、自然により少ないトークンを使用する。この指標は量より判断力に報いを与えない。
また、明らかなゲーム化の問題もある。従業員がトークン使用量で評価されることを知ると、彼らはプロンプトを生成する。大量のプロンプト。必要に応じて無意味なプロンプト。企業の歴史は、ゲーム化しやすく、すぐに測定されるべき主要な成果になってしまった指標の例に満ちている。
より深い問題:AIの採用を間違った方法で測定すること
これらの指標の背景にあるインセンティブは完全には間違っていない。AI プラットフォームに大量投資した組織は、その投資がリターンを生み出しているかを知りたい。利用可能なツールを使用していない従業員を特定し、その理由を理解することは、正当な経営上の懸念である。
しかし、トークン消費は最高でも先行指標であり、最悪の場合は誤解を招くものである。重要なのは、AIが仕事の成果を変えているかどうかである:タスク完了時間の短縮、品質の向上、以前は実現不可能だった仕事の実現、または高付加価値活動のための認知能力の解放。これらのいずれもAPI呼び出しのカウント方法では捉えられない。
報告によると、このアプローチを使用している企業は、本質的には投入量を測定しているが、これは成果をより困難に定義し測定するためである。移行期間ではこれは理解できるが、プロキシ指標を現実として扱うことは、テクノロジー業界に長い歴史を持つ経営的失敗である。
AIの統合について明らかになること
トークン消費指標の出現は、テク企業における幅広い不安を反映している:AIが経営フレームワークが適応できるよりも速く仕事を変えているという感覚だ。AIが重要であることは理解しているが、その組織的影響を測定するための明確なフレームワークをまだ持たないリーダーは、利用可能な数字を求めている。
この段階は予測可能であり、おそらく一時的である。同じパターンは、クラウド採用指標、アジャイルベロシティポイント、そして数え切れないほかのテクノロジー転換で起こった。組織は最終的に、初期のハイプサイクルがより深い思考を強制した後、影響を測定するより洗練された方法を開発する。
AI時代の経営上の課題
より厳しい真実は、AIが仕事の成果の帰属を根本的に複雑化させることである。開発者がコードを生成するとき、自分に対してAIが起草したコードにどれだけのクレジットが与えられるべきか。デザイナーが概念を提供するとき、AIで生成されたオプションに適用された人間の創造的判断をどのように評価するか。ライターが記事を公開するとき、研究支援はどこで終わり、創造的貢献はどこで始まるか。
これらの質問には明確な答えがないため、組織はトークン消費のようなより単純なプロキシを求めているのである。しかし、AI利用を単に測定するのではなく、AI強化された仕事を正確に測定する方法を理解する企業は、人材配分、インセンティブ構造化、およびAIを効果的に使用するチームの構築に大きなアドバンテージを持つだろう。
それまでの間、より疑わしい指標、より多くの従業員の混乱、およびトークンを数えることが良い仕事を数えることと同じではない理由を説明するより多くの記事を期待しよう。
この記事はGizmodoの報道に基づいています。元の記事を読む。
Originally published on gizmodo.com



