Paralela4

Programación y Computación paralela (4)

Integración, Monte Carlo,Metropolis

Glen D. Rodríguez R.

Basado en material de J. Demmel

• Capítulo 4 del libro de Pacheco

• Ver http://www.old-npac.org/users/gcf/slitex/CPS615NI95/index.html

• Ver http://www.old-npac.org/projects/cps615spring00/presentations-html/cps615nic95/

• Ver http://www.old-npac.org/projects/cpsedu/summer98summary/examples/mpi-c/mpi-c.html

Integración

• Se puede integrar en n dimensiones, pero por ahora discutiremos sólo en una dimensión.• Para n mayor de 2, el método Monte Carlo y similares tiene

muchas ventajas

• Se desea calcular la integral de la función f(x) de x=ahasta x=b

• Implícitamente se asume que f(x) es relativamente suave, se determina un conjunto de puntos de “interpolación” o de malla xi en la región a ≤ x ≤ b y se calcula la integral en término de los valores de f(x) y los puntos de la malla.

∫I = f(x) dx

Regla trapezoidal

• Se asume que f)x= es “o constante o lineal” en un intervalo entre dos puntos

• I = 0.5*(b-a)*(f(a)+f(b)), o si no (menos preciso)• I = (b-a)*f((a+b)/2)

x0 xX=a X=b

Regla de Simpson

• Se asume que f(x) es una función cuadrática

• I = (b-a)*(f(a)+ 4f(xc)+f(b))/6

xX=a X=b

f(a) f(b)

xc = (a+ b)/2

Reglas iterativas

• Hay ciertas reglas (Newton-Cotes y Gaussiana) que hacer aproximaciones de mayor orden de f(x)• Son difíciles de programar y no muy “robustas” (funcionan mal

si f(x) varía muy rápido de forma no polinomial)

• En la práctica se usa Simpson o Trapezoidal iterativo –Uar un número impar de puntos para aplicar simpson de forma iterativa

ej.: Aplicar Simpson sobre cada uno de los 18 sub intervalos indiados por

Las flechas abajo. Trapezoidal iterativo involucraría 36 integrales

x0 x4 x8 x12 x16 x20 x24 x28 x32 x36

Método Monte Carlo

• El Monte Carlo más sencillo escoje puntos al azar• La Integral es la suma de los valores de la función f(xRandom-i) en

los valores escogidos al azar xRandom-i multiplicados por el intervalo de integración (b-a) y dividido por el número depuntos generados.

• Esta da un método robusto (y sin preferencias) que es fácil de usar en integrales de n-dimensiones o integrales de funciones problemáticas

• Se puede adaptar en límites complicados• Se integra sobre regiones más grandes de lo necesario• Se define f(x) =0 fuera del intervalo [a b]

Hallar pi por integración con Monte Carlo

Otra forma de Monte Carlo: g(x,y) es un punto aleatorio en R2.Ambas son equivalentes

Integral ≈ A(n / N)

N= total de puntos(cruces y equis)n= puntos dentrode la integral (cruces)A= área de la simulación(área amarilla) = 1

yx2 + y2 =1

Puntos al azar (x,y), donde x e y tienen distribución uniforme

Errores

• Para una integral con N puntos

• Monte Carlo tiene un error del orden de 1/N0.5

• Trapezoidal iterativo : 1/N2

• Simpson iterativo: 1/N4

• Pero en d dimensiones, todos menos el Monte Carlodeben usar una malla de N1/d puntos por lado; no funciona bien para N>3• Monte Carlo aún tiene error 1/N0.5

• Error de Simpson es 1/N4/d

• Cuando usar Montecarlo? Cuando error de Montecarloes menor que error de Simpson para los mismos N puntos? 1/N0.5 < 1/N4/d � 0.5>4/d , o sea d>8

Trapezoidal Iterativo y Simpson iterativo

• Trapezoidal: Si tenemos N puntos N xi con

I= (b-a) (f(x0)+2f(x1)+2f(x2)+ ……+2f(x(N-2))+f(x(N-1))/(2(N-1))

• O con Simpson:

I= (b-a) (f(x0)+4f(x1)+2f(x2)+ ……+4f(x(N-2))+f(x(N-1))/(3(N-1))

• Se suman los f(xi) con diferentes pesos• Note que ambos aproximan su cálculo en una región

tamaño (b-a)/(N-1) (el doble de eso para Simpson) que tiende a cero si N es grande, así que la aprox. Es mejor si N se agranda.

Las funciones de peso

• Se suman varios wi f(xi) y las diferentes reglas sólo con

diferentes wi

• Trapezoidal: para índices = 0, 1, 2, 3, ..., N-1Se usa el patrón

wi ∝ 1, 2, 2, … 2, 2, 1

• Para los mismos índices, Simpson con N impar tieneelpatrón

wi ∝ 1, 2, 4, 2, 4, … 2, 4, 2, 4, 1

Computación paralela

• Diferentes procesadores calculan independientemente diferentes puntos en la integral y luego se suman los resultados de cada procesador

• Lo más natural es el escenario de la figura de arriba, con cada procesador calculando una integral sobre una subregión

• x0 al x8 en proc. 0 … x24 to x32 en proc. 3 etc.

• La integral total es la suma de las sub-integrales calculadas en cada procesador

• Pero podría asignarse PUNTOS y no REGIONES a los procesadores• x0 x4 x8 .. x32 al proc. 0

• x3 x7 x11 .. x31 al proc. 3

x0 x4 x8 x12 x16 x20 x24 x28 x32

10 2 3

Integración con reglas y Paralelismo

• Es un ejemplo clásico de “master worker” donde los procesadores individuales calculan arte de la integral.

• Se necesita usar “MPI rank” para determinar quien se encarga de cada rango de la integración

• Luego se suma la contribución de cada procesador• Suma global acumulativa (uno tras otro), por árbol o por

reducción al “master”.

Ejemplo 2: Monte Carlo con dist.uniforme#include <stdio.h>#include <stdlib.h>#include <time.h>#include <math.h>#include "mpi.h"

int main(int argc, char *argv[]){

int nprocs, myproc;int i, n, acum, sum_acum;double pi_25= 3.141592653589793238462643;double pi, w, x, y, error;double t0, t1;

/* MPI initialization */MPI_Init( &argc, &argv );MPI_Comm_size( MPI_COMM_WORLD, &nprocs );MPI_Comm_rank( MPI_COMM_WORLD, &myproc );

/* Determine the number of divisions to use */if( argc == 2 ) { /* Take n from the command line argument */

sscanf( argv[1], "%d", &n );} else {

if (myproc == 0){printf("Enter the number of random points: (0 quits) ");fflush(stdout);scanf("%d",&n);}

Sigue….if( myproc == 0 ) printf("Calculating pi using %d points\n", n);

MPI_Bcast( &n, 1, MPI_INT, 0, MPI_COMM_WORLD); /* ??? Is this needed ??? *//* Start the timer after a barrier command */

MPI_Barrier( MPI_COMM_WORLD );t0 = MPI_Wtime();

pi = 0.0;sum_acum=0;acum=0;srand( (unsigned)time( NULL )+myproc );w = 1.0 / n; for( i=myproc; i<n; i+=nprocs ) {

x = (double) rand()/RAND_MAX;y = (double) rand()/RAND_MAX;if (((x*x)+(y*y)) <= 1.0) {acum=acum+1;}

MPI_Allreduce( &acum, &sum_acum, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD );pi= ((double) sum_acum)/(double) n;pi = pi*4;error = fabs( pi - pi_25 );

t1 = MPI_Wtime();if( myproc == 0 ) {

printf("The calculated pi = %f (error = %f)\n", pi, error);printf("The calculation took %f seconds on %d nodes\n", t1-t0, nprocs);

}MPI_Finalize();

Cómo mejorar la precisión de Monte Carlo

• Error absoluto de regla rectangular (peor que

trapezoidal), usando 10000 intervalos = 0.000199

• Error absoluto de regla trapezoidal usando 10000 intervalos = 0.000001

• Error absoluto promedio de Monte Carlo usando 10000 puntos y 10 simulaciones = 0.013521

• Como mejorar: no usar distribución uniforme. Se

necesita una "guía" al muestreo aleatorio que enfatiza el muestreo donde la función es grande o varia

rápidamente.

• Ver ejemplo

• En ese caso, el error absoluto promedio de Monte Carlo

usando 10000 puntos y 10 simulaciones = 0.006479

Integral ≈ ????

N= total de puntos(cruces y equis)n= puntos dentrode la integral (cruces)A= área de la simulación(área amarilla)= 0.857

yx2 + y2 =1

Puntos al azar (x,y), donde x, y no tienen dist. uniforme

Muestreo por importancia

• Quiero integrar en 1-D

• Se mete la función peso w

• Que debe satisfacer

• Cambiando la variable, con dy = w(x) dx, y(0) = 0, and y(1) = 1.

Muestreo por importancia

• Eso nos da

• La función w se escoge de tal forma que f/w sea cercana a una constante. El muestreo uniforme en y se modifica (vuelve no uniforme) al ser afectado por w. O dicho de otra forma, la integral anterior es equivalente a la inicial, pero transformada por el cambio de variable en una función con menos variaciones.

Programa Ejemplo 3

#include <stdio.h>#include <stdlib.h>#include <time.h>#include <math.h>#include "mpi.h"

int main(int argc, char *argv[]){

int nprocs, myproc;int i, n;double pi_25= 3.141592653589793238462643;double pi, w, x, y, error, acum, sum_acum;double t0, t1;

/* MPI initialization */MPI_Init( &argc, &argv );MPI_Comm_size( MPI_COMM_WORLD, &nprocs );MPI_Comm_rank( MPI_COMM_WORLD, &myproc );

/* Determine the number of divisions to use */if( argc == 2 ) { /* Take n from the command line argument */

sscanf( argv[1], "%d", &n );} else {

if (myproc == 0){printf("Enter the number of random points: (0 quits) ");fflush(stdout);scanf("%d",&n);}

Sigue…

if( myproc == 0 ) printf("Calculating pi using %d points\n", n);

/* Broadcast the number of divisions to all nodes */

MPI_Bcast( &n, 1, MPI_INT, 0, MPI_COMM_WORLD); /* ??? Is this

needed ??? */

/* Start the timer after a barrier command */

MPI_Barrier( MPI_COMM_WORLD );

t0 = MPI_Wtime();

pi = 0.0;

sum_acum=0.0;

acum=0.0;

srand( (unsigned)time( NULL )+myproc );

w = 1.0 / n;

/* Each processor starts at a different value and computes its

* own contributions to pi. */

Sigue…

for( i=myproc; i<n; i+=nprocs ) {x = (double) rand()/RAND_MAX;y = (double) rand()/RAND_MAX;if ((x>0.5) && (x<=0.8) && (y<=1.5-x) && (((x*x)+(y*y)) <= 1.0)) acum=acum+0.857;if ((x>0.5) && (x<=0.8) && (y>1.5-x)) i=i-nprocs;if ((x>0.8) && (y<=1.77-1.4*x) && (((x*x)+(y*y)) <= 1.0)) acum=acum+0.857;if ((x>0.8) && (y>1.77-1.4*x)) i=i-nprocs;if ( (x<=0.5) && (((x*x)+(y*y)) <= 1.0) ) acum=acum+0.857;

MPI_Allreduce( &acum, &sum_acum, 1, MPI_DOUBLE, MPI_SUM,

MPI_COMM_WORLD );

pi= ((double) sum_acum)/(double) n;pi = pi*4;error = fabs( pi - pi_25 );

t1 = MPI_Wtime();if( myproc == 0 ) {

printf("The calculated pi = %f (error = %f)\n", pi, error);printf("The calculation took %f seconds on %d nodes\n", t1-t0,

nprocs);}MPI_Finalize();

Paradigmas de Monte Carlo paralelo

• Master-worker: se genera los números

aleatorios en el nodo 0 y se pasan a los demás.

Todos los nodos computan.

• Cliente-servidor: es un servidor de números

aleatorios, no procesa, sólo crea y envía los

randoms

• Full workers: cada nodo genera sus propios

números aleatorios. El nodo 0 sólo cuida que

se siembren diferentes semillas o que se use la

misma semilla pero diferentes rangos.

Resolviendo Ec. de Poisson con Montecarlo

• Sea la ecuación de Poisson:

• Con fuente sinusoidal : -2π2 sen(π x) sen(π y)

• Y cero en todas las fronteras

• En diferencias finitas:

Solución con “random walks”

• De un punto (i,j) comenzar el “random walk”.La

probabilidad de moverse a cualquiera de los 4

puntos vecinos es ¼.

• Generar un número aleatorio para escoger el

vecino.

• Añadir g(x,y) en la nueva posición

• Repetir hasta llegar a una frontera

• Esto fue solo UNA “random walk”

• Después de N “random walks” el estimado de

u(i,j) es:

Paralelización de esta solución

• Hacer el siguiente proceso para todos los puntos

• Comenzar en una frontera• De afuera hacia adentro

• Fila por fila

• Actualizar (intercambiar) data en el límite entre procesadores

• Actualizar el walk dentro de los puntos de un procesador

• Si el walk sale de un procesador, informarle al otro procesador

Metrópolis

• Se usa para integrales con funciones de peso.

• Genera un random walk pero guiado por una función

de peso w(x). Ejemplo en 2-D comenzando de un punto (xi,yi):

1. Escoger δ, el step size

2. Generar dos aleatorios R1, R2 uniformes en el rango [-1,1]

3. El nuevo punto será1. xT

i+1 = xi + δR1

2. yTi+1 = yi + δR2

4. Evaluar el ratio de w en el punto actual vs. el punto anterior1. r= w(xT

i+1 ,yTi+1) / w(xi,yi)

Metrópolis

5. Si r>1 aceptar el nuevo punto y regresar a (2)1. xi+1 = xT

i+1 ; yi+1 = yTi+1

6. Si r<1 aceptar el nuevo punto con probabilidad r. O sea, generar un aleatorio uniforme η en [0, 1] y

aceptar el punto solo si r>η (hacer lo mismo que en el paso 5)

7. Caso contrario, rechazar el nuevo punto y volver a (2)

El step size no debe ser ni muy chico ni muy grande.

Los puntos obtenidos se usan luego para integrar, como

en MonteCarlo (Algo*n/N).

La paralelización es similar a la discutida para las otras

integrales con Montecarlo

Paralela4

Education

Transcript of Paralela4

Postgrado en Branded Content y Transmedia Storytelling (INESDI) EDICIÓN BARCELONA

Pcc 0910 Definitiu[1]

Catalogo De Ida y Vuelta

PresentacióN2

Presentació d'un Marc per al plurilingüisme integrat i integrador a Catalunya (ST-CEB)

THE ENGLISH VILLAGE 6 - STUDENT'S BOOK

Cicle de conferències..

Esquerda el Decret de Plantilles en 6 passos

Aprender los colores

Presentació tic sagrado corazón

La familia real española

Projecte PILE de l’escola Els Planells d’Artesa de Segre.

Manual de Twitter (junio 2014)

8 guia cte junio 2014 prim

Rpc 50 Low

Boletín 23 mayo junio 2014

Presentaci_Orientacio 2014

Presentació Erasmus+ als Serveis Territorials

Agenda junio 2014 final

10 errores que no puedes cometer en tu comunicación no verbal