Questa metodologia permette più delle altre una rilevazione quantitativa e comparativa delle caratteristiche di usabilità; inoltre è il metodo più indicato per valutare prototipi funzionanti o prodotti finiti prima del loro rilascio sul mercato.
Prevede il coinvolgimento diretto degli utenti finali che sono chiamati a usare il prodotto all'interno dei laboratori di usabilità o nel loro contesto di utilizzo originario. Generalmente i laboratori di usabilità prevedono la postazione utente e il posto del ricercatore (test monitor) e degli osservatori, a volte posizionati in una stanza gemella con specchi unidirezionali che permettono l'osservazione dell'utente a lavoro. Il rischio è però quello di creare delle condizioni di utilizzo non fedeli e di caricare l'utente di un'ansia da prestazione che renderebbe il suo comportamento non naturale.
Prima dell'inizio dei test vengono definiti gli obiettivi tipici di utilizzo del prodotto e, in funzione di questi, dei task tipici da far eseguire nella sperimentazione: viene descritto il loro svolgimento corretto e vengono ordinati per importanza, frequenza e criticità.
Se possibile, vengono fissati degli indici, dei benchmark di riferimento e dei limiti di accettabilità.
Infine si selezionano gli utenti partecipanti alle sperimentazioni. Durante l'effettuazione dei compiti, test monitor e osservatori misureranno le prestazioni e rileveranno/analizzeranno gli errori di utilizzo.
In sede di analisi si confronteranno i risultati sia dal punto di vista qualitativo che statistico-quantitativo. Anche nel caso dell'analisi dei task, il numero di utenti utilizzati è in relazione alle risorse disponibili: per ottenere dati qualitativi dai 3 ai 5 utenti per categoria; per ottenere risultati quantitativi per comparazioni e indici, almeno 20 utenti.