Metodo di valutazione dell'usabilità che permette più delle altre una rilevazione quantitativa e comparativa delle caratteristiche di usabilità; inoltre è il metodo più indicato per valutare prototipi funzionanti o prodotti finiti prima del loro rilascio sul mercato. Prevede il coinvolgimento diretto degli utenti finali che sono chiamati a usare il prodotto all'interno dei laboratori di usabilità o nel loro contesto di utilizzo originario. Prima dell'inizio dei test vengono definiti gli obiettivi tipici di utilizzo del prodotto e, in funzione di questi, dei compiti (task) tipici da far eseguire nella sperimentazione: viene descritto il loro svolgimento corretto e vengono ordinati per importanza, frequenza e criticità. Se possibile, vengono fissati degli indici, dei benchmark di riferimento e dei limiti di accettabilità. Infine si selezionano gli utenti partecipanti alle sperimentazioni. Durante l'effettuazione dei compiti, test monitor e osservatori misureranno le prestazioni e rileveranno/analizzeranno gli errori di utilizzo. In sede di analisi si confronteranno i risultati sia dal punto di vista qualitativo che statistico-quantitativo. Nel caso dell'analisi dei task, il numero di utenti utilizzati è in relazione alle risorse disponibili: per ottenere dati qualitativi dai 3 ai 5 utenti per categoria; per ottenere risultati quantitativi per comparazioni e indici, almeno 20 utenti.