Direct installation guides

Pick an agent and jump straight to its setup steps.

Claude CodeAnthropic

OpenCodeOpenCode

CursorCursor MCPModel Context Protocol

ClineCline ContinueContinue

View all installation concepts

Submit Sign in

Built by Xpress Developer

Browse agent skills

Search by intent: design systems, testing, deployment, security, documentation, Azure, Supabase, React, or any workflow you want an agent to perform better.

80,937

matching skills

Search skills

Filters

Shareable URL state

Agents

Claude CodeOpenCodeCursorMCPGitHub CopilotWindsurfCodexGemini CLIClineContinue

Categories

Showing 30,241–30,270 of 80,937 skills

Page 1,009 of 2,698 · loading 30 at a time

AI & Automation

How to evaluate a summarization task | OpenAI Cookbook

Awesome Gen AI Tools: How to evaluate a summarization task | OpenAI Cookbook

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

LLM Evaluation at Scale – Airtrain

no-code batch compute platform for LLM evaluation and tuning workloads

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Testing & Review

LLM Comparison/Test

39 models tested (7B-70B + ChatGPT/GPT-4)

Claude Code Codex Cursor

#skillful#testing-review#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Testing & Review

Sharing LangSmith Benchmarks

Awesome Gen AI Tools: Sharing LangSmith Benchmarks

Claude Code Codex Cursor

#skillful#testing-review#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Testing & Review

Amazon will offer human benchmarking teams to test AI models - The Verge

Awesome Gen AI Tools: Amazon will offer human benchmarking teams to test AI models - The Verge

Claude Code Codex Cursor

#skillful#testing-review#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

OpenAI Cookbook: Evaluating RAG systems | by Ravi Theja | Nov, 2023 | LlamaIndex Blog

Awesome Gen AI Tools: OpenAI Cookbook: Evaluating RAG systems | by Ravi Theja | Nov, 2023 | LlamaIndex Blog

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Frontend

LLM Testing Guide

Comprehensive Strategies for Testing and Behavior Analysis by Kolena

Claude Code Codex Cursor

#skillful#frontend#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

TruLens for LLMs

Evaluate and Track LLM Applications

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

A Survey on Evaluation of Large Language Models | ACM Transactions on Intelligent Systems and Technology

Awesome Gen AI Tools: A Survey on Evaluation of Large Language Models | ACM Transactions on Intelligent Systems and Technology

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

The Crucial Role of Model Evaluation in LLM and AI Integrations

Awesome Gen AI Tools: The Crucial Role of Model Evaluation in LLM and AI Integrations

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Evaluation of LLMs - Part 2

Awesome Gen AI Tools: Evaluation of LLMs - Part 2

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Evaluation of LLMs - Part 1

Awesome Gen AI Tools: Evaluation of LLMs - Part 1

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Criteria Evaluation | 🦜️🔗 LangChain

Awesome Gen AI Tools: Criteria Evaluation | 🦜️🔗 LangChain

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

LLM Evaluation Metrics: Everything You Need for LLM Evaluation - Confident AI

Awesome Gen AI Tools: LLM Evaluation Metrics: Everything You Need for LLM Evaluation - Confident AI

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Large Language Model Evaluation in 2024: 5 Methods

Awesome Gen AI Tools: Large Language Model Evaluation in 2024: 5 Methods

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Frontend

The Ultimate Guide to LLM Evaluation | Deci

Awesome Gen AI Tools: The Ultimate Guide to LLM Evaluation | Deci

Claude Code Codex Cursor

#skillful#frontend#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

How to Evaluate Large Language Model Outputs: Current Best Practices | FinetuneDB

Awesome Gen AI Tools: How to Evaluate Large Language Model Outputs: Current Best Practices | FinetuneDB

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

AI Evaluation Metrics | Microsoft Learn

Awesome Gen AI Tools: AI Evaluation Metrics | Microsoft Learn

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Frontend

How to Evaluate LLM Applications: The Complete Guide - Confident AI

Awesome Gen AI Tools: How to Evaluate LLM Applications: The Complete Guide - Confident AI

Claude Code Codex Cursor

#skillful#frontend#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Frontend

LLM Evaluation | Clarifai Guide

Awesome Gen AI Tools: LLM Evaluation | Clarifai Guide

Claude Code Codex Cursor

#skillful#frontend#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

How to Evaluate, Compare, and Optimize LLM Systems

Awesome Gen AI Tools: How to Evaluate, Compare, and Optimize LLM Systems

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Frontend

The Ultimate Guide to LLM Product Evaluation

Awesome Gen AI Tools: The Ultimate Guide to LLM Product Evaluation

Claude Code Codex Cursor

#skillful#frontend#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Testing & Review

LLM Evaluation: Everything You Need To Run, Benchmark Evals

Awesome Gen AI Tools: LLM Evaluation: Everything You Need To Run, Benchmark Evals

Claude Code Codex Cursor

#skillful#testing-review#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Prometheus-2 Cookbook - LlamaIndex

"An Open Source Language Model Specialized in Evaluating Other Language Models."

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Evaluating Large Language Models

Methods, Best Practices & Tools | Lakera – Protecting AI teams that disrupt the world

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Reward Bench Leaderboard - a Hugging Face Space by allenai

Awesome Gen AI Tools: Reward Bench Leaderboard - a Hugging Face Space by allenai

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

LLM Leaderboards

Awesome Gen AI Tools: LLM Leaderboards

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

Testing & Review

LLM Benchmarks: MMLU, HellaSwag, BBH, and Beyond - Confident AI

Awesome Gen AI Tools: LLM Benchmarks: MMLU, HellaSwag, BBH, and Beyond - Confident AI

Claude Code Codex Cursor

#skillful#testing-review#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

Cleanlab Trustworthy Language Model: Score the trustworthiness of any LLM response

Awesome Gen AI Tools: Cleanlab Trustworthy Language Model: Score the trustworthiness of any LLM response

Claude Code Codex Cursor

#skillful#ai-automation#llm-evaluation#awesome-list#awesome-gen-ai-tools

0 saves

AI & Automation

BrainSoup

multi-agent & multi-LLM client with RAG, multi-modality, automation, code interpreter, and sandboxed file system

Claude Code Codex Cursor

#skillful#ai-automation#autonomous-llm-agents#awesome-list#awesome-gen-ai-tools

0 saves

Previous 1…1007 1008 1009 1010 1011…2698 Next