Class LLMJudge

LLM-based judge for semantic evaluation

Index

Constructors

Methods

judge createScorer compare batchJudge

Constructors

constructor

new LLMJudge(config): LLMJudge
Parameters
- config: LLMJudgeConfig
Returns LLMJudge
- Defined in core/evaluation/LLMJudge.ts:134

Methods

judge

judge(input, actualOutput, expectedOutput?, criteria?): Promise<JudgmentResult>
Judge an AI output against criteria
Parameters
- input: string
- actualOutput: string
- Optional expectedOutput: string
- Optional criteria: JudgeCriteria[]
Returns Promise<JudgmentResult>
- Defined in core/evaluation/LLMJudge.ts:145

createScorer

createScorer(criteria?): ScorerFunction
Create a scorer function for use with Evaluator
Parameters
- Optional criteria: JudgeCriteria[]
Returns ScorerFunction
- Defined in core/evaluation/LLMJudge.ts:218

compare

compare(input, outputA, outputB, criteria?): Promise<{
    winner: "A" | "B" | "tie";
    scoreA: number;
    scoreB: number;
    reasoning: string;
}>
Compare two outputs and determine which is better
Parameters
- input: string
- outputA: string
- outputB: string
- Optional criteria: JudgeCriteria[]
Returns Promise<{
    winner: "A" | "B" | "tie";
    scoreA: number;
    scoreB: number;
    reasoning: string;
}>
- Defined in core/evaluation/LLMJudge.ts:229

batchJudge

batchJudge(evaluations, criteria?, concurrency?): Promise<JudgmentResult[]>
Batch evaluate multiple outputs
Parameters
- evaluations: {
      input: string;
      actualOutput: string;
      expectedOutput?: string;
  }[]
- Optional criteria: JudgeCriteria[]
- concurrency: number = 3
Returns Promise<JudgmentResult[]>
- Defined in core/evaluation/LLMJudge.ts:263