Paper

20
ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO MAESTRÍA EN SISTEMAS DE TELECOMUNICACIONES TÉCNICAS DE EXTRACCIÓN DE CARACTERISTICAS DE ROSTROS PARA EL RECONOCIMIENTO FACIAL

description

Paper de PDS

Transcript of Paper

ESCUELA SUPERIOR

POLITÉCNICA DE CHIMBORAZO

MAESTRÍA EN SISTEMAS DE TELECOMUNICACIONES

TÉCNICAS DE EXTRACCIÓN DE CARACTERISTICAS DE

ROSTROS PARA EL RECONOCIMIENTO FACIAL

INTRODUCCIÓNLa distinción de un usuario es la forma más eficiente de mantener la seguridad de acceso

tanto a sistemas informáticos, como en el campo gubernamental, económico, social, etc.

En la actualidad el uso de la biometría ha alcanzado grandes campos de estudio entre los

cuales está: Reconocimiento del iris del ojo, palma de la mano, huellas dactilares,

reconocimiento de voz y audio, reconocimiento facial.

En el presente trabajo se va a tratar acerca de las técnicas de extracción de características

del rostro para el reconocimiento facial.

Gracias a los altos niveles de seguridad y confiabilidad que se encuentra al hacer la

identificación de las personas por medio del patron facial, hoy en día es utilizado en

muchas empresas, terminales de transporte, aeropuertos, entidades bancarias, locales

comerciales y en varios lugares donde sea necesario.

LA BIOMETRÍA• SE DERIVA DE LAS PALABRAS GRIEGAS “BIOS” DE VIDA Y “METRON” DE

MEDIDA. ES UN SISTEMA DE RECONOCIMIENTO HUMANO BASADO EN CARACTERÍSTICAS FÍSICAS Y DE COMPORTAMIENTO CUYA FUNCIONALIDAD TIENE EL ÚNICO PROPÓSITO LA AUTENTICACIÓN DE LOS INDIVIDUOS.

PATRONES FACIALES• EL ROSTRO DE UNA PERSONA TIENE PARTES CARACTERÍSTICAS

DISTINGUIBLES COMO SON: LA BOCA, NARIZ, CEJAS, OJOS, OREJAS, CONTORNO, PÓMULOS, COLOR Y TEXTURA DE LA PIEL. POR TAL MOTIVO DISTINGUIR A UNA PERSONA ES UNA MANERA SUMAMENTE COMPLEJA YA QUE CADA ROSTRO DIFIERE DE OTRO YA SEA POR LA POSICIÓN DE CADA UNO DE ESTOS ELEMENTOS TAMAÑO O POR LA FORMA EN LA QUE SE PRESENTAN.

SISTEMAS BIOMÉTRICOS• SE COMPONEN DE UN HARDWARE Y UN SOFTWARE; EL PRIMERO CAPTURA

LA CARACTERÍSTICA CONCRETA DEL INDIVIDUO Y EL SEGUNDO INTERPRETA LA INFORMACIÓN Y DETERMINA LA ACEPTABILIDAD O RECHAZO, EN FUNCIÓN DE LOS DATOS QUE HAN SIDO ALMACENADOS EN UNA BASE DE DATOS.

DETECCIÓN DE CARAS

• EL RECONOCIMIENTO DE CARAS HUMANAS ES UNA TAREA UN POCO PROBLEMÁTICA POR TAL MOTIVO SE LE DIVIDE EN SUBTAREAS O FASES LAS CUALES SON:

• LA PRIMERA FASE ES LA DETECCIÓN DE CARAS, ES DECIR, DADA UNA IMAGEN DESCUBRIR SI EN ELLA APARECEN SUBIMÁGENES QUE REPRESENTEN CARAS HUMANAS Y LOCALIZARLAS PARA TRATARLAS POSTERIORMENTE, UNA VEZ LOCALIZADA HAY QUE HACER

• EL RECONOCIMIENTO DE LAS MISMAS

MÉTODOS DE CARACTERIZACIÓN.• MÉTODOS HOLÍSTICOS: UTILIZA TODA LA IMAGEN DE LA CARA COMO

ENTRADA AL SISTEMA DE RECONOCIMIENTO, SIENDO LA UNIDAD BÁSICA DE PROCESAMIENTO.

• MÉTODOS BASADOS EN CARACTERÍSTICAS LOCALES: SE EXTRAEN CIERTAS CARACTERÍSTICAS COMO OJOS, NARIZ, BOCA, ETC. SUS POSICIONES Y ESTADÍSTICAS LOCALES CONSTITUYEN LA ENTRADA AL SISTEMA DE RECONCIMIENTO.

• MÉTODOS HÍBRIDOS QUE ES LA COMBINACIÓN DE LAS DOS ANTES MENCIONADAS.

MÉTODOS GLOBALES DE CARACTERIZACIÓN• DENTRO DE LOS MÉTODOS QUE APROXIMAN MOVIMIENTOS EL MÁS

ESTUDIADO HA SIDO EL FLUJO ÓPTICO, YA QUE REFLEJA CAMBIOS DE LA IMAGEN EN UN INTERVALO DE TIEMPO.

• LA ESTIMACIÓN DEL FLUJO OPTICO SE ABORDA DE DOS FORMAS: CALCULANDO GRADIENTES O REALIZANDO SEGMENTACIÓN, LA MÁS UTILIZADA ES LA PRIMERA.

• LOS ALGORITMOS QUE DETERMINAN EL FLUJO A PARTIR DEL GRADIENTE SE BASAN EN TRABAJOS DE HORN AND SHUNCK QUIENES FUERON LOS PRIMEROS EN PROPONER UNA FORMA DE APROXIMACIÓN DE MOVIMIENTOS CON IMÁGENES, PARTIENDO QUE LA INTENSIDAD DE UN PIXEL PARTICULAR ES CONSTANTE Y NO CAMBIA CON EL TIEMPO

• EL MÉTODO DE SINGH HA SIDO UTILIZADO CUANDO HAY MOVIMIENTOS SUTÍLES, EL MÉTODO CONSTA DE DOS PASOS:

• EL PRIMERO CALCULA EL SSD (SUMATORIA DE DIFERENCIAS AL CUADRADO), PARA OBTENER UNA MEDIDA DE SIMILARIDAD ENTRE EL PIXEL CON SU VECINDAD,

• EN EL SEGUNDO PASO SE PROPAGAN LAS VELOCIDADES DE CADA PUNTO A SU VECINDAD ASUMIENDO QUE ESTAS CORRESPONDEN A LA VELOCIDAD DEL PUNTO CENTRAL. DE LOS PASOS ANTERIORES SE CALCULA LA CORRESPONDIENTE MATRIZ DE COVARIANZA.

MÉTODO BASADO EN LAS IMÁGENES 3D• LAS PRINCIPALS MOTIVACIONES DE ESTE TIPO DE INVESTIGACIONES ES QUE

UNA VEZ QUE SE TIENE EL MODELO 3D SE PUEDE REALIZAR LAS COMPARACIONES QUE SON MENOS SENSIBLES TALES COMO LA POSE, LA ILUMINACIÓN Y LOS GESTOS DE LAS PERSONAS, LA DESVENTAJA ES QUE CON IMÁGENES 3D LA EFICIENCIA ES MENOR A LAS QUE SON EN IMÁGENES FIJAS POR OTRO LADO ESTUDIOS REALIZADOS SEÑALAN QUE ESTA METODOLOGÍA YA TIENE IGUALES Y SUPERIORES RESULTADOS A DIFERENCIA DE OTRAS TÉCNICAS

MÉTODO BASADO EN VIDEO• EXISTEN ESTUDIOS REALIZADOS POR VARIOS AUTORES QUIENES UTILIZAN

VIDEO PARA LA DETECCIÓN DE ROSTROS, EN DICHOS ESTUDIOS MUESTRAN QUE LOS VIDEOS QUE SE ANALIZAN SON DE BAJA RESOLUCIÓN YA QUE PROVIENEN DE CAMARAS DE SEGURIDAD, TELEVISIÓN, VIDEO CONFERENCIA ETC.

• EN GORODNICHY PROPONE UN ESQUEMA BASADO EN LA FORMA DE ASOCIACIÓN DEL CEREBRO HUMANO PARA DESARROLLAR UNA ESTRATEGIA DE RECONOCIMIENTO A TRAVÉS DE VIDEO, YA QUE DICHOS SISTEMAS DEBEN SER CAPACES DE RECONOCER UN ROSTRO HUMANO DENTRO DE UNA ESCENA QUE TENGA POR LO MENOS 12 PIXELES DE SEPARACIÓN ENTRE LOS OJOS CADA UNO DE LOS INDIVIDUOS.

REVISIÓN DE LAS TÉCNICAS

• A CONTINUACIÓN SE PRESENTA UN RESUMEN DE CUATRO TÉCNICAS UTILIZADAS EN EL RECONOCIMIENTO DE LAS CARACTERÍSTICAS DE ROSTROS DENTRO DEL RECONOCIMIENTO FACIAL

PRIMERA TÉCNICA.• EL FILTRO DE GABOR ES UNA HERRAMIENTA DE PROCESAMIENTO DE IMÁGENES Y QUE ES

APLICADO A LA EXTRACCIÓN DE CARACTERISTICAS, ALMACENA LA INFORMACIÓN DE LAS IMÁGENES DIGITALES. ESTA TÉCNICA UTILIZA UN ALGORITMO DE UNA RED NEURONAL.

• EL NUEVO ENFOQUE DE ESTA TÉCNICA UTILIZA UN ESCALAMIENTO RMS Y UN FILTRO DIFUSO (FUZZILY). INICIALMENTE LAS IMÁGENES ORIGINALES SE CONVIERTEN EN LAS IMÁGENES EN ESCALA DE GRISES Y RECORTADAS A UN TAMAÑO DE 100 X 100 PIXELES. A CONTINUACIÓN SE DETERMINA EL CENTRO DE LOS DOS OJOS DE LA CARA, ENTONCES LAS IMÁGENES DE LA CARA SE GIRAN Y CONTINUA CON EL PROCESO. LA FASE DE PRE-PROCESAMIENTO DE ESTA TÉCNICA CONSTA DE TRES PASOS: CONTRASTE, ILUMINACIÓN, ECUALIZACIÓN DE HISTOGRAMA Y FILTRADO.

SEGUNDA TÉCNICA.• ÉSTA TÉCNICA INTRODUCE UN NUEVO MÉTODO BASADO EN UN FILTRO GABOR PERO EN 2D PARA EXTRAER EL VECTOR DE CARACTERÍSTICAS 3D. INICIALMENTE TODAS LAS IMÁGENES DEBEN TENER LA MISMA ILUMINACIÓN Y EL MISMO CONTRASTE. POR LO TANTO EL FUNCIONAMIENTO DE LA ECCUALIZACIÓN DE HISTOGRAA SE REALIZA EN LAS IMÁGENES, COMO RESULTADO SE PROPORCIONA UN CONSTRASTE SATISFACTORIO, LA TÉCNICA UTILIZA (10 FILTROS PARA LA FRECUENCIA Y 5 PARA LA ORIENTACIÓN).

TERCERA TÉCNICA.• ÉSTA TÉCNICA ES UNA FORMA EXTENDIDA DEL

MÉTODO EBGM (EXTENDED BUNCH GRAPH).

• EBGM ES UNA TÉCNICA QUE UTILIZA LOS FILTROS DE GABOR PARA EXTRAER LA INFORMACIÓN LOCAL DE LAS IMÁGENES. EN EL RECONOCIMIENTO DE LOS PATRONES SE UTILIZA UN DESCRIPTOR PARA REPRESENTAR LAS CARACTERÍSTICAS DE LA IMAGEN. ÉSTE MÉTODO PRESENTA UNA NUEVA TÉCNICA QUE UTILIZA DESCRIPTORES LOCALES PARA LA EXTRACCIÓN DE LAS CARACTERÍSTICAS. UN DIAGRAMA DE BLOQUES DEL ALGORITMO SE PRESENTA EN LA FIGURA.

CUARTA TÉCNICA• ÉSTA TÉCNICA PRESENTA UN NUEVO ALGORITMO DE EXTRACCIÓN DE CARACTERÍSTICAS EN BASE

A UN OPERADOR LBP (PATRÓN BINARIO LOCAL). UTILIZANDO EL OPERADOR LBP SE EXTRAEN LAS CARACTERÍSTICIAS DE LA IMAGEN DE UNA MANERA QUE LA IMAGEN DE LA CARA SE DIVIDE EN PEQUEÑAS REGIONES O BLOQUES Y A CONTINUACIÓN, SE EXTRAE LOS HISTOGRAMAS CON CADA PIXEL UN CÓDIGO BINARIO. “T OJALA” PRESENTA EL OPERADOR ORIGINAL LBP QUE SE CONSIDERA COMO UNA FUERTE HERRAMIENTA PARA DESCUBRIR LA TEXTURA DE LA IMAGEN MEDIANTE LA SELECCIÓN DE UNA REGION DE 3X3 CON UN VALOR CENTRAL, DESPUÉS SE UTILIZA HISTOGRAMAS COMO DESCRIPTOR DE LA IMAGEN EN EL RECONOCIMIENTO DE LA CARA.

• SIGUIENDO CON EL MÉTODO LBP SE EXTIENDE PARA FUNCIONAR EN LAS REGIONES CIRCULARES CON LA NOTACIÓN (P, R)

OTRA TÉCNICA

• ACTUALMENTE EN RECONOCIMIENTO DE ROSTROS HUMANOS FRONTALES EN IMÁGENES A ESCALA DE GRISES SE UTILIZA LA TÉCNICA DE LA DISTANCIA ENTRE LA TRANSFORMADA DISCRETA DEL COSENO (DCT) DE LA CARA QUE SE ESTÁ EVALUANDO Y TODAS LAS DCT DE LAS CARAS QUE SE ENCUENTRAN EN LA BASE DE DATOS. LAS CARAS QUE TIENEN DISTANCIAS MÁS CORTAS, PROBABLEMENTE SON DE LA MISMA PERSONA, POR LO TANTO POR MEDIO DE ESTA TÉCCNICA SE ATRIBUYE A ESTA PERSONA.

OTRA TÉCNICA• LA DISTANCIA SE CALCULA COMO LA SUMA DE LAS DIFERENCIAS ENTRE LOS

MÓDULOS DE LOS COEFICIENTES DCT. LAS PRUEBAS EXPERIMENTALES SOBRE LA BASE DE DATOS ORL ALCANZA UN RECONOCIMIENTO DEL 99.75% CON UN BAJO COSTE COMPUTACIONAL Y SIN PASO DE PRE-PROCESAMIENTO. ADEMÁS, EL MÉTODO LOGRA UN 100% DE PRECISIÓN DE RECONOCIMIENTO AL APLICAR UNA NORMALIZACIÓN ZOOM SOBRE LA BASE DE DATOS ORL EN ESTE CAMPO NO SE VA A PROFUNDIZAR AMPLIAMENTE YA QUE EL MOTIVO DEL PRESENTE TRABAJO ES DAR A CONOCER TODOS LOS ESTUDIOS QUE SE ESTÁN REALIZANDO EN BASE A ESTE TEMA EN LA ACTUALIDAD.

CONCLUSIONES• LA SEGURIDAD E INTEGRIDAD DE LOS DATOS EN LA ACTUALIDAD ES LO MÁS IMPORTANTE Y

DELICADO QUE SE TIENE QUE ANALIZAR DESDE DIFERENTES PUNTOS DE VISTA PARA ASI PODER OFRECER A LA SOCIEDAD UN PRODUCT DE CALIDAD, HOY EN DÍA PARA ESTO SE ESTÁ UTILIZANDO LA BIOMETRÍA EN TODAS SUS ÁREAS, PERO COMO SE HA PODIDO EXPLICAR EN ESTE TRABAJO EL RECONOCIMIENTO FACIAL ES UNO DE LOS MÁS FUERTES Y UTILIZADOS HASTA EL MOMENTO, YA QUE POR MEDIO DEL PROCESAMIENTO DIGITAL DE SEÑALES SE OBTIENEN BUENOS RESULTADOS A BAJOS COSTOS COMPUTACIONALES Y BAJOS COSTOS EN HARDWARE.

• LA DETECCIÓN DE ROSTROS ES UNA TAREA MUY COMPLICADA PERO QUE SI SE LA REALIZA CON TÉCNICAS PROBADAS ES MUY FÁCIL SU IMPLEMENTACIÓN.

CONCLUSIONES• EXISTEN VARIAS TÉCNICAS DE EXTRACCIÓN DE CARACTERÍSTICAS DE

ROSTROS QUE YA SE ENCUENTRAN ESTUDIADAS TANTO A NIVEL DE IMÁGENES ESTÁTICAS, EN 3D, EN VIDEOS, EN ESCALA DE GRISES ENTRE LAS MÁS IMPORTANTE, EN CADA UNO DE DICHOS ESTUDIOS YA SE HAN OBTENIDO RESULTADOS QUE PARA FUTURAS INVESTIGACIONES SON LA BASE.

• COMO ESTE TEMA ES DE MUCHO INTERES YA EXISTEN EN FORMA ONLINE MUCHAS BASES DE DATOS COMO LAS QUE SE MENCIONAN EN EL PRESENTE DOCUMENT, POR TAL MOTIVO EN NINGUNO DE LOS CASOS SE DEBE COMENZAR DESDE CERO UN TRABAJO DE ESTE TIPO