Come primo esempio per valutare la complessità computazionale prenderemo in considerazione il calcolo di un grafico di idropatia.
Uno dei metodi più utilizzati per valutare le regioni polari o idrofobiche di una sequenza proteica, è quello di utilizzare una "scala", chimico-fisica o statistica. Questa scala assegna a ciascun residuo amminoacidico un valore, che rappresenta la propensione di tale residuo per una fase polare o apolare. Siccome il collasso idrofobico è ritenuto la causa principale del folding di una proteina, ci si può aspettare che un grafico, che assegni valori di idropatia ai vari residui lungo la catena possa essere particolarmente informativo. Per esempio possiamo aspettarci che regioni
Se comunque si graficano direttamente i valori di una scala lungo la sequenza proteica non si ottiene di solito un grafico molto comprensibile. Ciò è dovuto al fatto che vi sono alte variabilità da posizione a posizione, e che inoltre il valore di ciascun residuo è indipendente da dove esso è locato all'interno della sequenza. Un modo molto pratico e utilizzato ampiamente in tutti i tipi di analisi di sequenze primarie, è quello di associare a ciascun residuo la media dei valori di tutti i primi vicini, definiti da una finestra (di solito simmetrica) centrata sul residuo da calcolare.
Supponendo quindi di avere una scala di idropatia (ad esempio quella definita in figura ), i cui valori positivi indichino propensione ad una fase apolare, mentre valori negativi siano associati ad una tendenza a favorire ambienti polari, vogliamo valutare la media su una finestra mobile dell'intorno di ciascun residuo. Più formalmente, se rappresenta il valore associato al residuo di tipo , quello che vogliamo calcolare per ogni posizione della nostra sequenza è
Dove con finestra si intende il valore , e è il valore della scala associato al tipo di residuo in posizione -ma.
È da notare che quando siamo agli estremi (per esempio con , o ), l'equazione , non può essere calcolata, per cui la media agli estremi deve essere valutata in modo differente. La figura , riporta una possibile soluzione.
La domanda adesso diviene: qual'è la complessità computazionale asintotica nello spazio e nel tempo della funzione in figura (o la corrispondente equazione )?
Per quanto riguarda l'occupazione spaziale massima, si ha che:
Considerando come si è detto in precedenza che ciascuna operazione elementare abbia lo stesso costo (costo = 1), allora la complessità nel tempo sarà:
Da cui si ricava che il tempo richiesto per il calcolo diviene