Tema 2 eficiencia y complejidad

Análisis y Diseño de Software

Departamento de Ingeniería de Sistemas Telemáticoshttp://moodle.dit.upm.es

Tema 2a. Eficiencia y Complejidad

Carlos A. Iglesias <[email protected]>

Eficiencia y Complejidad 2

Teoría

Ejercicio práctico en el ordenador / Problema

Ampliación de conocimientos

Lectura / Vídeo / Podcast

Práctica libre / Experimentación

Leyenda


Bibliografía

● Eficiencia algorítmica– http://en.wikipedia.org/wiki/Algorithmic_efficien

cy – http://en.wikipedia.org/wiki/Analysis_of_algorith

ms#Shortcomings_of_empirical_metrics● http://jungla.dit.upm.es/~pepe/doc/adsw/Complejidad.pdf


Temario

● Complejidad: el problema

● Espacio de problemas

● Notación O (Big O)

● Evaluar la complejidad de un algoritmo

● Análisis y conclusiones


Objetivos

● Entender cómo se pueden comparar algoritmos

● Entender qué es una medida de complejidad

● Conocer la notación O● Conocer la notación O para algoritmos

básicos de ordenación y búsqueda● Saber razonar con la notación O


El problema

● ¿En qué nos basamos para seleccionar un algoritmo cuando hay tantos disponibles (y tan parecidos)?


● “En casi todos los cálculos, es posible una gran variedad en la forma de de llevar a cabo los procesos de computación. […] Es esencial seleccionar la forma que reduzca al mínimo el tiempo para completar un cálculo”

Ada Lovelace

¿Qué elegir?


¿Qué elegir?

● El algoritmo más eficiente

● Eficiencia: inversamente proporcional a los recursos (memoria, tiempo, …) consumidos por un algoritmo


Formas de seleccionar

● De forma 'empírica':– Medimos su recursos consumidos de los

algoritmos (tiempo, memoria, uso de comunicaciones, disco, consumo energético, …, caso mejor, peor, medio, …)

● De forma 'analítica' / teórica:– Calculamos un 'límite' de estos recursos,

analizando el algoritmo y su implementación


Medidas empíricas

● Medimos (p.ej. Tiempo).

// Creo el entornoAlgoritmo a = new Algoritmo();Datos d = new Datos(); // relleno

// Midolong t1 = System.nanoTime();a.run(d);long t2 = System.nanoTime();long duracion = t2 – t1;


Medidas empíricas● Como los algoritmos son genéricos, las medidas empíricas pueden

verse afectadas por:– El lenguaje de programación– El entorno de ejecución / sistema operativo (p.ej. JVM GC, multinúcleo, …)– Los datos que usemos al medir

● Pueden ayudarnos a entender cómo funcionan, y tenemos que analizar bien el experimento cuando obtenemos resultados inesperados

● Si medimos, podemos intentar ajustar las gráficas, y ver qué distribución siguen (polinómico, lineal, etc.). Si estás interesado, mira los apuntes.


Medidas teóricas: notación O (Big O Notation)

● Nos ayuda a clasificar algoritmos según cómo crezca su respuesta (tiempo de ejecución, memoria, etc.) con el número de datos de entrada

● Algoritmos con la misma “respuesta”, tendrán la misma notación O

● Representa la cota del valor peor que pueden tomar, el límite superior


Orden de complejidad

● f(n) = O(g(n)) significa que C*g(n) es un límite superior de f(n) para un n

o y C

positivos

∣ f (n)∣≤C∣g (n)∣,∀ n>n0Ej.3n2−100n+6=O (n2) , porque3n2>3n2−100n+6cuando n>0Ej.3n2−100n+6=O (n3) , porque n3>3n2−100n+6 cuando n>3Ej.3n2−100n+6≠O (n) , porque paratodo c que escojo cn<3n2

cuando n>c


Orden de complejidad

●Realmente cuando decimos n2=O(n3) lo que estamos diciendo es que – O(n3) es un conjunto de funciones– f(n) = n2 es una de las funciones que pertenecen a

esta clase de funciones de complejidad O(n3)

●Otra forma de verlo es decir que f(n) = O(g(n)) se lee como 'g domina a f':

● Nos basta una función de referencia por clase

g≫n


Funciones de Referencia

Función Nombre

g(n) = 1 Constante

g(n) = log(n) Logarítmico

g(n) = n Lineal

g(n) = n *log(n) Lineal logarítmico

g(n) = n2 Cuadrático

g(n) = nc Potencial

g(n) = cn, n >1 Exponencial

g(n) = n! Factorial

n!≫cn≫n2≫nc≫nlogn≫n≫logn≫1


Propiedades O(n)

●Adición

– Ej. n3+n2+n+1 = O(n3), importa el término mayor si n → ∞

● Factor multiplicador

– Puedo multiplicar por 1/c al hacer el análisis

O(g (n))+O( f (n))→O (max ( f (n) , g (n)))

O(cf (n))→O ( f (n))


Definición alternativa

● Otra forma de definir que g>>n

●El conjunto incluye las funciones f(n) que son menos complejas que g(n) y las que son igual de complejas que g(n)

∣ f (n)∣≤C∣g (n)∣,∀ n>n0

f (n)=O(g (n))={ f (n) , limn→∞

f (n)g (n)

<∞}


Comparando funciones

limn→∞

f (n)g (n)

=0 si f (n)es menos compleja que g (n)

limn→∞

f (n)g (n)

=∞ si f (n)es más compleja que g (n)

limn→∞

f (n)g (n)

=k si f (n)tienemisma complejidad que g (n)


Órdenes de funciones comunes

Notación Nombre Comentario

O(1) Constante Ideal

O(log n) Logarítmico Muy bueno

O(n) Lineal normal

O(nlogn) Lineal logarítmico

razonable

O(n2) Cuadrático tratable

O(nc) Potencial “tratable”

O(cn), n >1 Exponencial No es práctico

O(n!) Factorial inviable


Orden


O(1): complejidad constante

● Complejidad constante, independiente del tamaño de la entrada

boolean isElementoNulo(Object [] array, int indice) { if (a[indice] == null) {

return true; } return false;}

boolean isElementoNulo(Object [] array, int indice) { return (a[indice] == null);}


O(logn) - Logarítmico

● logb(Y): Número de veces que Y se puede dividir

por b hasta que vale 1. Inverso de la exponencial.● Ej. 24 = 2 * 2 * 2 * 2 = 16

● log2(16) : 16/2=8; 8/2=4;

4/2=2; 2/2=1--> 4 veces--> log2(16)= 4

● Como log(nc) = c * log(n) ambos tienen la misma notación O, no nos importa el exponente de n.

●Lo mismo con la base, como logc(b) =

logc(a)*log

a(b), no importa la base


O(logn)

●Ej. búsqueda binaria. Buscamos un número en el listín telefónico ordenado alfabéticamente. Dividimos entre dos el listín y vamos a la mitad donde está si no está, dividimos otra vez.

● El caso peor es el número de veces que dividimos n por 2 → log

2(n) → O(logn)


O(n): lineal

● Consumo de recursos directamente proporcional a la entrada

● Ej. búsqueda lineal. Caso peor: buscamos el último elemento, recorremos n → O(n)


O(nc): polinómico

●Ahora el orden sí es importante●Normalmente se da si hacemos un cálculo

con un elemento y con el resto de elementos

● Ej. Ordenar método de laburbuja O(n2).

●Comparaciones:(N – 1) + (N – 2) + … + 1 = N * (N-1)/2 → O(N2)


O(cn): exponencial

●También es relevante el exponente


¿Cómo calculamos la complejidad? (I)

●Analizamos el código● En sentencias condicionales (if/else-switch),

cogemos la rama 'peor'●Bucles:

– Si el bucle no depende de n, simplemente es una cte O(1), que quitamos

– Si el bucle depende de n, tendremos O(n)– Si tenemos bucles anidados, que dependen de n, si

son dos, tenemos O(n2) (nos sale 1 + 2 + .. = n(n-1)/2)


¿Complejidad?


¿Cómo calculamos la complejidad? (II)

●Si el bucle es multiplicativo, es decir, no es lineal con n:

int c = 1;while (c < n) {

sentencias O(1);c *= 2;

}

Para n = 10:c= 1, c = 2, c = 4, c= 8En general, vale 2k <= n→ k = log

2(n) → log(n)

int c = n;while (c > 1) {

sentencias O(1);c /= 2;

}

Para n = 10:c= 10, c = 5, c = 2, c= 1 → log(n)


¿Cómo calculamos la complejidad? (II)

●Si combinamos, nos sale O(nlogn):for (int i = 0; i < n; i++) { int c = i; while (c > 0) {

sentencias O(1);c /= 2;

}}


Ejemplo. Calcular complejidad (I)


Ejemplo (II)

Se ejecuta n (= coef.length) veces (0 a n - 1)


Ejemplo (III)

Para cada i, se ejecuta i – 1 vecesEs decir, 0 + 1 + 2 + … + n – 2 = (n – 2 + 1) / 2 = (n – 1) / 2


Ejemplo (IV)

En total, se ejecuta n * (n – 1) / 2 → O(n2)


Optimizamos


Complejidad potencia (I)

●Si siempre tomara la rama impar, se ejecutaría y -1, y – 2, … 0 → O(n)

● Si siempre fuera la impar, y2/4, y4/16, …yk/2k→ O(logn)


Complejidad potencia (II)

● Como vamos restando uno, una vez irá a una rama y otra vez a la otra rama

● Ej. x^31: 31, 30, 15, 14, 7, 6, 3, 2, 1

● Caso peor: que empiece con un impar

● Como vamos dividiendo por 2 en la parte impar, tendremos log

2(y) términos y otro

tanto de términos impares. En total: 2*log2(y)

● → Potencia tiene complejidad O(logn)


Complejidad evaluaPolinomio2

● Tenemos un bucle que sucede n veces, donde se llama a potencia → O(nlogn)



● Almacenamos las potencias

● Ahora el bucle se ejecuta n veces → O(n)



●Misma complejidad que antes, O(n)

● Sin embargo, sólo ejecuta N sumas y multiplicaciones (el anterior 2N multiplicaciones y N sumas, tarda el doble pero misma complejidad)


Medimos tiempos

● Para N: 10, 100, 500, 1000

● Calculamos coeficientes aleatorios y ejecutamos 10.000 veces


Medimos tiempos

N EvaluaPolinomio1 EvaluaPolinomio2 EvaluaPolinomio3 EvaluaPolinomio4

10 18 24 13 17

50 68 82 28 28

100 231 240 42 45

500 3901 1375 68 72

1000 18546 3981 107 108


Fibonacci1 – recursivo

● fib(n) es función de fib(n-1)+fib(n-2)● Muy difícil calcular la complejidad


Fibonacci1 - Truco

● Sea T(n) el tiempo de ejecución

● Si suponemos que T(n) es exponencial:

T (n)=T (n−1)+T (n−2)T (n)=an

an=an−1+an−2

a2=a+1

a=1+ √52

≃1.618

fib(n)≃1.6n

O ( fib (n))∈O(1.6n)


Fibonacci1

● Si E(n) es el Espacio en Memoria ocupado, ¿cuál es su complejidad?

fib(n)

fib(n-1) fib(n-2)

fib(n-2) fib(n-3)

fib(0)

...

...

...

E (n)∈O (n)( pila de llamadas)


Comprobamos

● Se cumple el límite limn→∞

f (n)g (n)

=k


Fibonacci-2 iterativo

● Tenemos un bucle que se ejecuta n-3 veces, con que...

T (n)∈O(n)E (n)∈O (1)


Fibonacci-3 con memoria

● ¿Complejidad? Si nos fijamos, cómo vamos guardando valores, sólo calculamos 1 vez cada valor, con que es O(n)

T (n)∈O(n)E (n)∈O (n)(datos)


Fibonacci3 recursivo con memoria

fib(n)

fib(n-1) fib(n-2)

fib(n-2) fib(n-3)

fib(2)

...

fib(1) fib(0)

T (n)∈O(n)E (n)∈O (n)(datos)


Memoria vs tiempo

● En este caso 'gastamos más memoria': E(n) → O(n) datos memorizados para ahorrar tiempo (y no recalcular valores)

● Es una técnica habitual para optimizar (caché)


Variante: Recursivo con memoria limitada

●Limitamos el buffer a los n más usados (de 0 a n - 1

Complejidad Tiempo de ejecución difícil de calcular, depende de cómo de grande sea n


Fibonacci4 – fórmula de Binet

● No depende de n → T(n), E(n) → O(1)

Binet (1786- 1856)


Tiempos


Tipos de problemas

● Hay muchos problemas que no sabemos un algoritmo para resolverlos.

● Entre los que sabemos resolver, los tipos más importantes son:– Problemas P: Problemas con complejidad

polinómica (O(n), O(n2), etc.)– Problemas NP: Problemas que no pueden

resolverse en un tiempo polinómico, e intentamos buscar otro algoritmo.


Comprobación empírica

● Una vez que tomamos las medidas, podemos intentar ver se ajustan a una complejidad conocida

●Hacemos un cambio de variable en el eje X y vemos si nos sale una recta


Ejemplo


Cambio x=n2


Cambio x=nlog(n)


Resumen

● Para elegir un algoritmo, podemos– Seguir un enfoque analítico y corroborar

empíricamente– Seguir un enfoque empírico

● La notación O nos facilita razonar sobre la eficiencia de un algoritmo


Notación O


Preguntas● Si pruebo dos algoritmos en mi ordenador, y uno tarda

10 segundos y otro 20 segundos, ¿cuál es más eficiente?

● Si sé que un algoritmo tiene una respuesta 9n3 + 2n2 + 4n +2, ¿cuál sería su notación O?

● ¿Qué significa que O es el límite asintótico?

● Si tienes unos algoritmos A, B, C con complejidad O(n), O(nlogn) y O(n2), ¿en qué orden los escogerías?

● Para cualquier valor de n, será siempre más rápido un algoritmo O(n)) que uno con O(n2)

Tema 2 eficiencia y complejidad

Technology

Transcript of Tema 2 eficiencia y complejidad