Ipotesi di lavoro
- Introduzione
- Il modello di riferimento
- Ipotesi di lavoro
- Dimensionamento del collegamento
Al fine di utilizzare il modello precedentemente descritto in termini di formule derivate per il dimensionamento del link di aggregazione di N sorgenti note è opportuno mettere in risalto quelle che sono le ipotesi di lavoro che garantiscono l'applicabilità del modello.
La prima e fondamentale caratteristica è relativa al traffico generato dalle sorgenti, nel nostro caso identificate con le sedi periferiche. Il traffico in oggetto deve essere “elastico”, vale a dire deve essere in grado di adattarsi a variazioni dei tempi di interarrivo dei pacchetti trasmessi e non generare nelle applicazioni utilizzate degradazioni effettive della qualità del servizio.
Inoltre la connessione deve essere in grado di coprire dei picchi di banda in relazione alle esigenze istantanee dell'applicazione, come ad esempio nel caso di scarico contemporaneo di più files da parte di un comune browser Web. Tale caratteristica è tipica del traffico TCP/IP nel caso di utilizzo di applicazioni Internet classiche quali il World Wide Web, l'e-mail, il file transfer (FTP).
Un'altra ipotesi è relativa al meccanismo di controllo della trasmissione, in questo caso quello intrinseco al TCP/IP, che si suppone sia in condizioni di funzionamento normale, vale a dire non ci sono connessioni in situazioni di “time-out”, ovvero in condizioni di “slow-start”.
Ulteriore ipotesi di lavoro è quella relativa all'esistenza di un'unico link di uscita del traffico ed un numero costante di sorgenti, che assumeremo essere pari al numero massimo di utenze per tipologia di profilo di accesso. Nel nostro caso ciò è strettamente consistente con l'implementazione proposta, in cui tale collegamento è quello con la SSC, mentre le sorgenti sono le sedi periferiche.
E' opportuno precisare che in tale modello gli oggetti associati alle code stocastiche sono files in corso di trasferimento e non pacchetti, poiché ai fini del dimensionamento, dipendendo le grandezze statistiche oggetto di tale modellizzazione dalla media, non ha alcun interesse pratico distinguere se istantaneamente tutte le componenti del singolo file sono già state trasferite o meno.
Con le ipotesi illustrate si può considerare il modello a code chiuse (Closed Queue Network) per rappresentare in termini probabilistici le sedi utilizzanti la connessione della SSC ed analizzare i parametri caratteristici del modello.
Parametri caratterizzanti il modello CQN
Il modello a code chiuse (Closed Queue Network) rappresenta statisticamente nelle ipotesi enunciate i flussi di dati tra le sedi perferiche e il link di uscita, permettendone il dimensionamento. I parametri descrittivi delle grandezze basilari del modello sono i seguenti:
- numero di sorgenti, considerato costante nel tempo e pari al massimo numero di sedi presenti
- tempo di servizio medio nella code del “servente”, (indicato con μ-1) rappresenta il tempo medio di attesa di un processo di trasferimento nella coda del router di aggregazione
- tempo medio di attesa alla “sorgente”, indicato con λ-1, rappresenta il tempo di attesa per l'inizio di un trasferimento per una sorgente che non è in alcun modo bloccata da altre attività nella coda di uscita
- dimensione media del file trasferito, indicata con f, rappresenta la quantità media di dati trasferita per atto trasmissivo
- banda complessiva della connessione di uscita, che è la grandezza che si vuole ottimizzare.
Il modello delle code chiuse funziona bene nella descrizione di tale problematica qualora sia in condizioni di “stato stazionario”, ovvero il numero dei processi di trasmissione è costante nel tempo, ipotesi plausibile se si considerano tutte le sedi connesse, ovvero il caso peggiore in termini di carico sull'infrastruttura.
In tal caso esistono formule chiuse, dipendenti esclusivamente dal prodotto ( λf ), che permettono di terminare il numero di processi serventi, noti quelli iniziali.
Criteri per la definizione delle prestazioni
Nell'ipotesi di funzionamento in stato stazionario, ovvero con un numero costante di utenze connesse, possono essere definiti gli opportuni criteri prestazionali che, nel caso di traffico di tipo “elastico”, coincidono con la banda complessiva del link (B) suddivisa per il numero di processi serventi. Quest'ultimo può essere espresso in termini di funzioni probabilistiche note.
Su queste si possono imporre le condizioni di performance che riportano alla sorgente la banda “vista” in condizioni di operatività in cui tutte le sorgenti operano contemporaneamente e permettono di legare quest'ultima alla banda complessiva del collegamento in uscita.
Le condizioni indicate si traducono in una diseguaglianza in cui la probabilità che la banda riportata alla sorgente sia minore del valore di qualità imposto per l'utenza sia un valore noto, costituente il numero di casi percentuale limite in cui tale situazione si verifica.
Approssimazioni matematiche e formule chiuse
Sebbene con le formule probabilistiche si possa ottenere una soluzione numerica al problema, utilizzando tecniche di calcolo numerico è opportuno dedurre delle formule chiuse semplificate, utili nei casi di dimensionamento progettuale, in cui la precisione di calcolo può essere sacrificata alla semplicità ed immediatezza.
Tali formule sono ottenute mediante semplificazioni asintotiche delle formule probabilistiche. In tali semplificazioni distinguiamo due filoni in base a parametri di rendimento identificati sul “processo servente”. Trascurando la trascrizione dei dettagli, il parametro del rendimento del processo servente determina due casistiche di evoluzione delle formule chiuse, rispettivamente:
- caso di carico del processo servente (ρ) minore di 1, in cui sostanzialmente il punto di concentrazione del traffico è scarico ed il comportamento delle equazioni è approssimabile a quello delle serie di Poisson;
- caso del carico del processo servente (ρ) superiore all'unità, equivalente alla saturazione del link.
Nel caso della prima ipotesi si ricade nella formula detta del “criterio della media”, desumibile anche dallo studio del modello di Engset utilizzato nel caso della telefonia, adattata ai flussi TCP/IP in studi condotti su problematiche similari.
L' ultimo caso risulta quello più interessante in quanto si giunge, mediante semplificazioni matematiche, ad una formula chiusa più complessa, ma in grado di fornire risultati di ottimizzazione della banda del link da dimensionare più spinti.
Le formule in esame assumono, in ultima analisi, la forma relativa al primo caso:
B = N*h
dove h risulta essere un fattore definito “banda efficace”, che risulta essere la banda equivalente che l'utenza periferica consuma sul link centrale, nel momento in cui sperimenta dei ritardi a seguito dell'interazione con l’intero sistema di trasmissione ed erogazione dei servizi, nonché per l’effettiva richiesta di banda inoltrata dall’utente, a causa dei suoi tempi morti. Tale aspetto del problema è di fondamentale importanza per individuare intuitivamente il significato della banda efficace, e lo chiameremo guadagno statistico. La formula per il calcolo di h è la seguente:
![]()
Le grandezze b, λ ed f sono rispettivamente:
b = banda garantita sull'utenza periferica
λ = velocità media di connessione dell'utenza periferica, che determina il guadagno statistico
f = dimensione media del file trasferito
Dall'analisi di tali espressioni risulta che la banda della connessione aggregante risulta pari alla media tra la massima velocità di connessione e la minima riscontrata a seguito dei ritardi introdotti dall'interazione con l’intero sistema informativo, come precedentemente accennato.
Nel secondo caso la formula risulta essere :
![]()
dove γ è calcolabile con la seguente espressione:
![]()
Il significato dei parametri presenti in tale espressione è il medesimo di quello del caso precedente. E' presente un parametro in più, qα che rappresenta la quantità (1-α) di una variabile statistica normale con media nulla e varianza pari ad uno. Come più volte enunciato tali formule risultano utili per dimensionare facilmente la banda del link in uscita, noto il numero di utenze e la banda che si vuole garantire ad ognuna di esse.
Validità e limiti delle formule
L'articolo in esame non si limita alla esposizione delle motivazioni teoriche del modello ma fornisce i dati incrociati di un insieme di comparazioni dei risultati ottenuti su casi di studio realistici utilizzando i vari metodi approssimati.
Specificatamente viene esaminata la precisione delle formule aprossimate rispetto a quelle complete, comparando varie metodologie di approssimazione. In particolare viene considerata la formula per il calcodo desunta dal criterio della media, la funzione Q0 di Poisson e l'approssimazione asintotica ottenuta per ρ > 1.
Senza entrare nei dettagli, il risultato di tali comparazioni risulta essere una generale validità dell'approssimazione, meno efficace nella rappresentazione delle funzioni di probabilità, ma con discrepanze piuttosto ridotte nella valutazione della banda della connessione anche per numeri di utenze di poche centinaia, per in cui si nota una generale convergenza dei metodi di calcolo nella valutazione della banda del link di aggregazione.
In termini riduttivi si può asserire che il metodo approssimato per via asintotica finisce per dimostrare la generale validità della formula semplificata ottenuta con il criterio della media quando le utenze superano qualche centinaio e la convergenza che si ottiene nella valutazione della banda copre il 99% dei casi.