Editorial - ...3 Especial Aniversario 40 años DCC En 1975 un grupo de jóvenes y entusiastas...

66

Transcript of Editorial - ...3 Especial Aniversario 40 años DCC En 1975 un grupo de jóvenes y entusiastas...

  • 1

    Editorial

    Alejandro Hevia entrevista a nuestro exa-lumno Roberto Opazo sobre cómo fue suexperiencia en nuestro Departamento y losorígenes de su capacidad de innovaciónen diferentes empresas.Finalmente, nuestro exalumno de Doctora-do Alcides Quispe nos presenta un Surveysobre buenas prácticas de desarrollo desoftware para pequeñas empresas.

    Esperamos que disfruten la Revista. Como siem-pre quedamos a disposición de sus consultasy comentarios a través de nuestro [email protected]

    PABLOBARCELÓEditor GeneralRevista Bits de Ciencia

    Esta vez tenemos una gran razón para celebrar:nuestro Departamento - el Departamento deCiencias de la Computación de la Universidadde Chile - ha cumplido 40 años. Lo que comenzóen 1975 como la apuesta liderada por un grupode jóvenes para instalar a la Computación comouna nueva área de la Ciencia y la Ingeniería, hadado paso hoy en día a un Departamento depunta a nivel latinoamericano en docencia, trans-ferencia e investigación. Orgullosos como esta-mos de esta historia, comenzamos esta nuevaedición de la "Bits de Ciencia" con textos y fotosextraídas de la celebración de estos 40 años, laque se realizó en diciembre de 2015 con presen-cia de autoridades, académicos, funcionarios, yexalumnos, entre otros.

    Por otro lado, el tema principal de la Bits en estaocasión es la industria del software y TIC en Chile.Hemos congregado a varios expertos de la aca-demia y la industria para que hablen del tema,en algunos casos aportándonos con su visiónsobre ésta y en otros relatándonos el trabajoque han realizado para que esta industria crezcay aumente aún más en calidad. Parece ser untema común a todos estos artículos el hechoque la industria chilena de software y TIC tieneun buen nivel y potencial para desarrollarse, enparticular producto de la calidad de sus profe-sionales. Por otra parte, el tamaño de tal industriaes pequeño, y parece necesario desarrollar polí-ticas de gran escala que la impulsen a convertirseen real motor de desarrollo para Chile.

    La sección dedicada a la industria nacional delsoftware y TIC incluye lo siguiente:

    Un artículo de José Miguel Piquer que res-ponde a las preguntas de si esta industriarealmente existe y por qué no se ha desa-rrollado plenamente.Una radiografía a la industria del softwarenacional y sus desafíos, realizada por MaríaEugenia Riquelme de GECHS.Un artículo de varios académicos y alumnosde postgrado de nuestro Departamento(proyecto GEMS) analizando los desafíos yoportunidades que esta industria tienepara generar impacto país.Un artículo de Pablo García, de TelefónicaI+D, contándonos los esfuerzos que estánrealizando para desarrollar transferencia através de la combinación TIC/data science.Una reseña de Erika Madariaga sobre SPIN-Chile, la red nacional de mejoramiento delproceso de software.Por último, una breve descripción de algu-nos postítulos en el área que se impartenen nuestro país.

    Tenemos además nuestras secciones tradiciona-les:

    En Investigación Destacada, el académicoGonzalo Navarro nos habla sobre su inves-tigación en Big Data y repetitividad.En Computación y Sociedad seguimos conla saga del Profesor Juan Álvarez sobre laHistoria de la Computación en Chile. Eneste caso su artículo trata de los primerosaños de ECOM, la Empresa Nacional deComputación fundada en 1970.En la sección Conversaciones, el académico

  • 2

    Especial Aniversario40 años DCC

    En una emotiva ceremonia que congregó a egresados, estudiantes,académicos y funcionarios, el Departamento de Ciencias de laComputación (DCC) de la FCFM celebró cuarenta años de historia.

  • 3

    Especial Aniversario40 años DCC

    En 1975 un grupo de jóvenes y entusiastas inge-nieros creó el Departamento de Ciencias de laComputación (DCC), como una iniciativa quebuscaba explorar esta nueva área del conoci-miento y abrir oportunidades para el uso detecnologías digitales en el país. Cuarenta añoshan transcurrido desde entonces, en los que elDCC ha recorrido un largo camino que fue recor-dado el 11 de diciembre de 2015 en una ceremo-nia que contó con la presencia de los fundadoresdel DCC: Fernando Silva, Alfredo Piquer, JoséPino y Patricio Poblete, así como de las autorida-des de la FCFM, académicos, funcionarios, alum-nos y egresados del Departamento.

    Previo a esta ceremonia, y como parte de la ce-lebración, se realizaron diversas actividades. Laprimera actividad fue un “Puertas Abiertas” quebuscó mostrar la carrera de Ingeniería Civil enComputación. Allí los profesores José MiguelPiquer y Nancy Hitschfeld realizaron charlas sobrelas tecnologías que revolucionan la humanidad,y sobre cómo la Computación puede ser un cam-po laboral atractivo para mujeres. Luego el Pro-fesor Ricardo Baeza Yates, académico DCC y ChiefResearch Scientist Yahoo! Labs, dictó la charla“Big Data en la Web”. También se realizaron visitasguiadas a las instalaciones del Departamentodonde, entre otras actividades, los asistentespudieron ver el trabajo que se realiza en el áreade robótica y conocer el Museo DCC.

    Durante la ceremonia oficial de aniversario, elDirector del DCC, Prof. Sergio Ochoa resaltó di-ferentes hitos del Departamento, como la crea-ción de programas de pre y postgrado, el envíodel primer mail, la primera conexión a Internetdel país y la creación de NIC Chile. Asimismo,destacó la participación en iniciativas guberna-mentales y otras de impacto país, el trabajo deinvestigación de punta que se ha realizado enlas últimas dos décadas, que le han dado visibili-dad internacional al DCC y el hecho que en 2015,el ranking QS posicionó al Departamento en eltercer lugar, entre los departamentos de Compu-tación de Latinoamérica, detrás de las universi-dades de Sao Paulo y Campinas de Brasil.

    “Hoy tenemos un DCC un poco distinto a aquelque creó aquel grupo de ingeniosos ingenierospor allá por 1975 y que hoy le rendimos home-naje. Aquellos que tomamos la posta seguimoscompartiendo los mismos valores y poniéndole

    el mismo empeño para que nuestra casa sea cadadía mejor, más inclusiva, solidaria y preocupadade los problemas de Chile y de su gente”, señalóel Prof. Ochoa.

    También tomó la palabra el fundador y primerDirector del DCC Fernando Silva, quien ademásde recordar los inicios del Departamento, expresósu orgullo por la evolución del DCC: “Trabajé enla Facultad por 16 años. Tuve el privilegio detrabajar con jóvenes con gran capacidad y verlosimpartir sus conocimientos con una generosidadsin límites. Al cumplir 40 años el Departamento,nos llena de orgullo ver que ha llegado a ser unode los más reconocidos de Latinoamérica”.

    A continuación, los profesores José Miguel Piquery Patricio Poblete, pioneros del desarrollo deInternet en Chile, recordaron los años inicialesdel DCC. El profesor Piquer afirmó que “de esteDepartamento ha salido una enorme cantidadde generaciones y de gente que hoy está hacien-do la Computación de este país. Comparto conustedes la nostalgia y emoción de reencon-trarnos”.

    Por su parte, la egresada Marcela Calderón afirmóque ser ingeniera del DCC “es una marca. Másallá del conocimiento y habilidades técnicas des-taca el genuino interés por saber más por resol-verlo todo y por aprender”. Agregó que hoy “elDCC enfrenta grandes desafíos y oportunidades.El primero es el de mantener esta marca. Perotambién sería positivo contar con más mujeresen este campo. Atraer más mujeres es una tareaposible y demostrar que ésta es no sólo unacarrera para hombres”.

    Tras estas intervenciones, se realizó un reconoci-miento a los fundadores del Departamento: Fer-nando Silva, Alfredo Piquer, José Pino y PatricioPoblete; a los profesores José Miguel Piquer,Ricardo Baeza Yates, Jorge Olivos y a quien fuerapor largo tiempo jefa administrativa, MargaritaSerei, todos como artífices del desarrollo del DCC.También se reconoció al primer egresado de cadaprograma: Ronald Corovic (Ingeniería Civil enComputación), José Benguria (Magíster en Cien-cias mención Computación), José Miguel Rodrigo(Magíster en TI), Gonzalo Navarro (Doctorado enCiencias mención Computación) y RigobertoMolina (Ingeniería en Ejecución en Procesamientode la Información).

  • 4

    5

    1 2 3

    4

    6 7

    98

    1. El Director del DCC, Prof. Sergio Ochoa. 2. Fernando Silva, fundador y primer Director del DCC. 3. El Decano de la FCFM, Prof. Patricio Aceituno. 4. Los profesores José Miguel Piquer y Patricio Poblete, recordaron los años iniciales del DCC. 5. Marcela Calderón, profesora y egresada del DCC. 6. Margarita Serei, Jefa Administrativa del DCC hasta 2011, recibió el reconocimiento “Artífices del Desarrollo del DCC”, de manos del Director delDCC, Prof. Sergio Ochoa. 7. De izquierda a derecha, los profesores José Miguel Piquer y Ricardo Baeza-Yates, recibieron el reconocimiento “Artíficesdel Desarrollo del DCC”, de manos del Director del DCC, Prof. Sergio Ochoa. 8. Los fundadores del DCC. De izquierda a derecha: Fernando Silva, JoséPino, Alfredo Piquer y Patricio Poblete. 9. Entrega de reconocimiento a los primeros graduados de nuestros programas de estudio. De izquierda aderecha: Ronald Corovic (Ingeniería Civil en Computación), el Director del DCC, Prof. Sergio Ochoa, José Benguria (Magíster en Ciencias menciónComputación), José Miguel Rodrigo (Magíster en TI) y Gonzalo Navarro (Doctorado en Ciencias mención Computación).

    Especial Aniversario40 años DCC

    Cerró la ceremonia el Decano de la FCFM, Prof.Patricio Aceituno, quien reconoció la innovaciónque hubo de parte de los fundadores del DCC,al vislumbrar la Computación como un área adesarrollar. “Cuando miro 40 años atrás y el re-

    nacer del DCC, qué era eso sino innovación. Ypara hacerla requiere: dedicación, pasión y mu-cho esfuerzo. La Universidad de Chile y la Facul-tad deben reconocer que si este país tiene lacapacidad que tiene en Computación e Infor-

    mática es por esa pasión, dedicación y esfuerzoque puso un grupo de pioneros que llevó ladisciplina al nivel que está en Chile”, concluyó lamáxima autoridad.

  • 5

    EN UN EMOTIVO ENCUENTRO GENERACIONAL, EL ANIVERSARIO DELDCC REUNIÓ A SUS ACADÉMICOS, ALUMNOS, EGRESADOS Y FUN-CIONARIOS.

    Especial Aniversario40 años DCC

  • 6

    Especial Aniversario40 años DCC

  • 7

    Especial Aniversario40 años DCC

  • 8*Financiado por el Proyecto Fondecyt 1-140796

    Uno de los aspectos que mejor caracteriza nuestro desarrollo tecno-lógico en las últimas décadas es el rápido crecimiento de los datosdisponibles digitalmente. En pocos años, hemos pasado de es tarpreocupados por la cantidad de cómputo que debíamos realizar apreocuparnos más bien por el volumen de datos que debemosprocesar, incluso cuando los cálculos son relativamente simples .

  • 9

    GONZALONAVARROProfesor Titular Departamento de Ciencias de laComputación, Universidad de Chile. Doctor en Cienciasmención Computación y Magíster en Ciencias menciónComputación, Universidad de Chile; Licenciatura enInformática, Universidad Nacional de La Plata y ESLAI,Argentina. Líneas de investigación: Diseño y Análisis deAlgoritmos, Bases de Datos Textuales, Búsqueda porSimilitud, Compresió[email protected]

    EL DILUVIO DE DATOSTenemos por un lado los datos que podríamosllamar “científicos”: los datos astronómicos, don-de Chile es una fuente generadora predilecta;datos de clima obtenidos por sensores de todotipo, que en varios casos deben ser usados entiempo real para ser útiles; datos geográficos,incorporados a la vida diaria gracias a los satélitese intermediarios como Google Maps; secuenciasbiológicas, cada vez más baratas de obtener ypor ello más abundantes; etc.

    Tenemos también datos que podríamos llamar“contenidos”: grabaciones de voz, imágenes,fotos, música, vídeos, libros, revistas, páginasweb, emails, blogs, tweets, y un largo etcétera,todos ellos incorporando la necesidad de encon-trar el contenido deseado en formatos no siem-pre amigables para el procesamiento automáti-co.

    En una tercera categoría, que podríamos llamar“comportamiento”, tenemos evolución de mer-cados, de compras online, tráfico en redes, clicksde usuarios, patrones de navegación en la Web,búsquedas en la Web, “likes” en Facebook, diná-mica de redes sociales, etc. Estos datos se anali-zan permanentemente para predecir el compor-tamiento económico, mejorar máquinas debúsqueda, ofrecer mejores interfaces, estudiarcomportamientos sociales, etc.

    Tal cantidad de datos genera inmensas posibili-dades de mejorar muchos aspectos de nuestravida, y ya lo han hecho en gran medida. Dudoque quienes nacieron en la era de los buscadorespuedan siquiera imaginar cómo era vivir cuandoesa fuente instantánea e inagotable de informa-ción no estaba disponible. Mucho más está porvenir también. Por ejemplo, la posibilidad dedescubrir efectos de medicamentos no porquealgún científico se ilumine y lo pruebe sino por-que surja automáticamente del análisis y corre-lación de miles de historias clínicas, la posibilidadde que el automóvil se conduzca solo a travésde una ciudad desconocida mediante interactuarcon dispositivos inteligentes de la ciudad quelo guíen con información extraída automática-mente de la Web, y muchos otros ejemplos quehace una década eran ciencia ficción hoy estána la vuelta de la esquina.

    Con las grandes posibilidades vienen los grandesdesafíos. En cada una de las áreas mencionadas,hemos aprendido que es mucho más fácil gene-rar datos que darles un uso útil. La humanidadgenera unos cuantos zettabytes de datos al año,de acuerdo a un estudio de 2011 de la Interna-tional Data Corporation (un zettabyte son 2 70

    bytes, aproximadamente 10 21), y el volumencrece a más del doble por año, más rápido quela Ley de Moore, que gobierna (en el mejor delos casos) el crecimiento de las capacidades dehardware. El libro “Algorithms and Data Structu-

  • 10

    res for External Memory” de Jeff Vitter comienzacon una sentencia que resume la situación: Theworld is drowning in data! El término data deluge,o la inundación en datos, se ha puesto de modapara indicar que tenemos muchos más datos delos que podemos manejar.

    Por lo pronto, no parece que nuestras capacida-des de mero almacenamiento de datos esténaún comprometidas. Pero como decía, el proble-ma no es realmente almacenar los datos sinodarles algún uso. Incluso transmitirlos puede serun problema: la compañía BGI, que secuenciadatos en China, les envía a sus clientes las secuen-cias en una cinta por correo normal, ya que Inter-net no tiene el ancho de banda necesario paratransmitirlas más rápidamente. ¿Qué esperarentonces de nuestras capacidades de procesarestos datos para obtener información útil? Rea-lizar minería de textos o de datos en general paraencontrar patrones relevantes, recorrer grafospara detectar comunidades de interés, buscarsimilitudes en secuencias genómicas, etc. sonprocesos que requieren ejecutar sofisticadosalgoritmos que recorran los datos, una o variasveces, con patrones de recorrido impredecibles.¿Podemos realizar este procesamiento sobredatos almacenados en memoria secundaria (dis-cos, SSDs) o terciaria (cintas)?

    Lamentablemente, no todos los componentesdel hardware mejoran según la Ley de Moore(que establece que la capacidad y/o la velocidadse duplica cada dos años aproximadamente). Lohace la capacidad de la memoria externa (secun-daria y terciaria), pero no su velocidad. Desdehace unos años, ya no lo hace la velocidad de losprocesadores, aunque a cambio lo ha empezadoa hacer la cantidad de procesadores en la CPU.La memoria interna (RAM) crece en capacidad,pero no mucho en velocidad, aunque aparecencada vez más y mayores memorias caché rápidasentre la CPU y la memoria RAM. La diferenciaentre procesar datos en memoria interna o ex-terna es cada vez mayor, lo que ha hecho atrac-tivo usar clusters de computadores para simularuna gran memoria RAM.

    LA REPETITIVIDAD:NUESTRA TABLA DESALVACIÓNMuchas de las secuencias, fotos, series de tiem-po, etc. de las fuentes más prolíficas de datosson altamente repetitivas. Esto significa que esposible obtener cada nuevo elemento mediantecombinar unas pocas partes de elementos vistospreviamente. La repetitividad parece llamada aser nuestra tabla de salvación frente al diluviode datos. Un buen ejemplo son las coleccionesde genomas. Existen muchas especies distintas,pero tampoco tantas. Las grandes coleccionesde genomas se forman secuenciando muchosindividuos de la misma especie. Dos genomasde individuos de la misma especie difieren enun porcentaje muy bajo, cercano al 0.1%. Otroejemplo son los sistemas de versiones (de soft-ware, de documentos, etc.), con el casopúblicamente disponible de Wikipedia y la Inter-net Wayback Machine (que almacena copias depáginas web a través del tiempo). Otra son laspublicaciones de series de tiempo, financieras,climatológicas, etc., que en muchos casos tienenperiodicidad con pocas variaciones. Los datosastronómicos suelen incluir “fotos” de la mismazona del cielo en distintos momentos

    Se conocen buenas técnicas para tratar condatos muy repetitivos. Los sistemas que manejanversionamiento en edición colaborativa, comoCVS, Subversion, y otros, almacenan solamentelas diferencias de versiones menores con respec-to a la versión anterior. Compresores genéricoscomo la familia Lempel-Ziv buscan, en el textoya visto, copias del nuevo texto que deben com-primir. Elementos de esta familia como p7zipfuncionan muy bien en colecciones altamenterepetitivas, donde los compresores clásicos fallanen aprovechar la repetitividad.

    Pero nuevamente estamos hablando de alma-cenar los datos eficientemente, permitiendo a

    lo sumo recrear una versión específica. Si quere-mos tratar estas grandes colecciones repetitivasen forma eficiente, debemos ser capaces de ope-rar sobre los datos directamente en forma compri-mida, sin necesidad de descomprimirlos previa-mente.

    ESTRUCTURAS DEDATOS COMPACTASAquí entran en juego las estructuras de datoscompactas, que combinan compresión y teoríade la información con estructuras de datos, demodo de representar los datos usando espaciocercano a lo que usaría un compresor, pero aúnpermitiendo navegar, operar y buscar en losdatos sin descomprimirlos. En este aspecto vanmás allá de la compresión, que busca solamenterepresentar los datos en menos espacio de modode poder recuperarlos, y generalmente requieredescomprimirlos del todo antes de poder usarlos.

    Las estructuras de datos compactas se han veni-do desarrollando cada vez con más fuerza desdefines de los ochenta, y hoy permiten representaruna amplia gama de estructuras en espacio re-ducido: árboles, grafos, textos, grillas de puntos,etc. Pueden llegar a usar, en la práctica, treintaveces menos espacio que la estructura clásicacorrespondiente, y si eso permite que los datosque normalmente se almacenarían en memoriaexterna quepan en RAM, entonces la gananciaen tiempo de procesamiento es de órdenes demagnitud, incluso cuando manejar las estructu-ras compactas requiera bastantes más operacio-nes que las clásicas. En el caso de una memoriaRAM distribuida en clusters, las estructuras com-pactas permiten reducir el número de computa-dores necesarios, su tiempo de comunicación, ysu costo de hardware y de energía.

    El desarrollo de estructuras de datos compactasespecíficas para explotar la repetitividad de losdatos es bastante más reciente, y tiene todavíamucho terreno por explorar. Para ejemplificar el

  • InvestigaciónDestacada

    11

    FIGURA 2.ÁRBOL DE SUFIJOS PARA UNA COLECCIÓN DE VARIOS STRINGS SIMILARES.

    FIGURA 1.ÁRBOL DE SUFIJOS PARA UN SOLO STRING. COMO LOSSTRINGS QUE LLEGAN A LAS HOJAS SON MUY LARGOS,ALMACENAMOS SÓLO SU PRIMERA LETRA.

    tipo de problemas que enfrentamos al explotarla repetitividad, describiré el desarrollo de índicespara colecciones de texto repetitivas, uno de lostemas que se abordan en mi actual proyectoFondecyt. Lo haré maximizando la intuición através de ejemplos, evitando demostraciones oargumentos complejos.

    COLECCIONESREPETITIVAS DETEXTOPara permitir búsquedas de diversa complejidaden colecciones de secuencias (por ejemplosecuencias de ADN), los índices favoritos son losárboles de sufijos, inventados en 1973 por PeterWeiner. Considere una colección formada portextos T1, T2, …, Td, sobre un alfabeto .Usaremos un símbolo extra, $, para terminar lostextos y los concatenaremos en un único textoT[1,n] = T1 $ T2 $ … Td $. Los árboles de sufijos seconstruyen sobre este texto concatenado T. Unsufijo de T es cualquier substring de T quetermina en un $. El trie de sufijos de T se obtieneinsertando todos sus sufijos en un árbol digital,de modo que cualquier sufijo T[i...] se puede leerrecorriendo el árbol desde la raíz hasta la hojaasociada al sufijo que empieza en la posición “i”y concatenando las letras que rotulan las aristas.

    El árbol de sufijos se obtiene compactando loscaminos “unarios” (es decir, donde cada nodotiene un único hijo) en el trie de sufijos. Ahora

    cada arista está rotulada con un string y losstrings que rotulan las aristas de cada nodo asus hijos difieren en su primera letra. Como tienen hojas y todo nodo interno tiene al menos doshijos, el árbol de sufijos tiene menos de 2n nodos.También se puede construir en tiempo lineal,O(n). La Figura 1 muestra un árbol de sufijospara un solo string.

    Podríamos dedicar muchas páginas a mostrarlas virtudes y potencialidades del árbol de sufijos,pero nos contentaremos con un ejemplo simplee ilustrativo. Considere un problema de análisisde textos (para determinar autoría o plagio entextos de lenguaje natural, para buscar secuen-cias repetidas de ADN, etc.): encuentre el subs-tring más largo de T que aparece dos veces. Enun árbol de sufijos, esto corresponde simple-mente a recorrer los nodos y encontrar el nodointerno que representa el string más largo, locual puede hacerse fácilmente en tiempo lineal(en nuestro ejemplo, el resultado es “ATA”). Su-mado a que este árbol se puede construir entiempo lineal, tenemos que este problema sepuede resolver en tiempo O(n). Pues bien, antesde que existieran los árboles de sufijos, inclusoel legendario Donald Knuth creía que tal cosano era posible. Esto ilustra la facilidad con la queel árbol de sufijos permite resolver problemasmuy complejos.

    Asimismo, podemos usar el árbol de sufijos parabuscar las ocurrencias de un nuevo patrón,P[1,m], en T. Simplemente hay que bajar por lasletras de P hasta que (1) no se pueda continuar,en cuyo caso P no aparece en T; (2) lleguemos

    a una hoja, en cuyo caso hay que comparar elresto de P con esa posición del texto, para versi P aparece allí o no aparece; o (3) se nos acabenlas letras de P, en cuyo caso el nodo en queestamos, o donde nos lleva la arista en queestamos, corresponde a todas las ocurrenciasde P en T, una por hoja (y las posiciones dondeocurre P son los valores asociados a las hojas).En nuestro ejemplo, tenemos búsquedas detipo (1), (2) o (3) cuando buscamos “TT”, “CGA”,o “AT”, respectivamente. El árbol de sufijos rea-liza esta búsqueda en tiempo O(m), indepen-dientemente del largo del texto, lo que es nota-ble.

    Esta poderosa herramienta tiene, sin embargo,un serio problema: ocupa mucho espacio. Enuna implementación típica, el árbol de sufijospuede ocupar 20n bytes. Si tenemos un genomahumano (unos 3 mil millones de bases), el árbolde sufijos requiere unos 60GB de memoria. Ade-más los recorridos en el árbol siguen caminosimpredecibles (no todos los problemas se re-suelven con recorridos top-down, por lo que elárbol debe mantenerse en memoria para quelos recorridos funcionen eficientemente). Si 60GB de RAM parece una exigencia considerable,piense en la razonable aspiración de manejaruna colección de 1000 genomas: ¡requeriría 60terabytes de RAM!

    Sin embargo, la repetitividad es un poderosoaliado para reducir el espacio de los árboles desufijos de colecciones repetitivas. La Figura 2muestra una colección de varios stringssimilares.

  • InvestigaciónDestacada

    12

    FIGURA 3.ARREGLO DE SUFIJOS PARA NUESTRA COLECCION.

    FIGURA 4.ARREGLO LCP PARA NUESTRA COLECCION.

    Hemos mostrado, en celeste y amarillo, dos zo-nas del árbol que son topológicamente idénticas.La repetitividad en los textos induce zonas topoló-gicamente idénticas en el árbol de sufijos. Veremosluego cómo explotar esa repetitividad. Veamos,por lo pronto, lo que ocurre con las posicionesasociadas a las hojas del árbol, como se muestraen la Figura 3.

    Las áreas del mismo color son iguales, exceptoque sus valores difieren en una unidad (estasáreas se traslapan, como puede verse). Nueva-mente, veremos luego cómo explotar este he-cho: La repetitividad en los textos induce largasáreas en las posiciones del árbol de sufijos cuyosvalores difieren en una unidad.

    La primera representación compacta de árbolesde sufijos fue propuesta por Kunihiko Sadakaneen 2007. Consta de tres partes: la topología com-primida, la secuencia de posiciones (que se llamaarreglo de sufijos) y otro arreglo de prefijos co-munes más largos ( LCP, por longest commonprefix). Este arreglo indica el largo del prefijocomún que comparten dos hojas consecutivasdel árbol. Estos tres componentes son suficientespara simular todas las operaciones en un árbolde sufijos. Ni siquiera se necesita el texto. Inclusose puede extraer de la estructura cualquier subs-tring del texto que se desee, ¡por lo que el textopuede borrarse!

    La Figura 4 muestra el arreglo LCP de nuestracolección. Como puede verse, persiste el mismotipo de repetitividad que en el arreglo de sufijos,a veces con excepción del primer elemento delas áreas. La repetitividad en los textos inducelargas áreas en el arreglo LCP cuyos valores difierenen una unidad.

    El árbol de sufijos compacto de Sadakane obtie-ne un espacio cercano a unos 10 n bits para elcaso de ADN. Esto es 1,25 bytes por símbolo,muy inferior a los 20 de las implementacionesclásicas. Un genoma humano cabe en menos de4GB, que es muy razonable para una memoriaprincipal. Sin embargo, para nuestro razonableobjetivo de 1000 genomas, una memoria princi-pal de 4TB es todavía de muy alta gama. Mostra-remos cómo se ha logrado reducir este espacioa unos 2n bits para el caso de las coleccionesrepetitivas, con lo cual los 1000 genomas huma-nos cabrían en menos de 700GB.

    ÁRBOLES DE SUFIJOSPARA COLECCIONESREPETITIVASMostraremos cómo aprovechamos la repetitivi-dad para obtener un árbol de sufijos tan pe-

    queño. La idea es compactar cada uno de loscomponentes utilizando distintas herramientas.Una idea genérica que es útil es la compresiónbasada en gramáticas libres del contexto . Estasrepresentan una secuencia de símbolos comouna serie de reglas, donde un símbolo no terminalse reescribe como una secuencia de símbolosterminales (los de la secuencia) y otros no termi-nales. Los no terminales, a su vez, se reescribenusando las reglas, hasta que la secuencia contie-ne sólo símbolos terminales. Las secuencias re-petitivas pueden así representarse como la ca-dena que se deriva de un cierto símbolo noterminal, que se llama símbolo inicial, y la gramá-tica puede ser mucho menor que la secuencia.

    Para ilustrar esta idea, apliquémosla a la versióndiferencial de nuestro arreglo de sufijos. En laversión diferencial, cada elemento se escribecomo la diferencia con el anterior. Esto hace quelas zonas largas que se repetían en otra partecon una diferencia de una unidad, ahora se con-vierten en zonas idénticas.

    Nuestro arreglo de sufijos diferencial se ve asítal como se muestra en la Figura 5.

    Como se puede ver, las repeticiones se han con-servado (excepto por los primeros símbolos).Gracias a estas repeticiones, el arreglo se puederepresentar con una gramática bastante más

  • FIGURA 6.REPRESENTACIÓN CON PARÉNTESIS DE LA TOPOLOGÍA DE NUESTRO ÁRBOL DE SUFIJOS.

    FIGURA 5.ARREGLO DE SUFIJOS DIFERENCIAL PARA NUESTRA COLECCIÓN.

    InvestigaciónDestacada

    713

    tro árbol de sufijos sobre la colección repetitivaes lo que se muestra en la Figura 6.

    Como puede verse, los subárboles idénticos setraducen en substringsidénticos en la secuenciade paréntesis. Podemosentonces representarlausando una gramática, yasociar la información so-bre excesos a los no ter-minales de la gramática.

    Esto produce una representación mucho menorque los 2N bits cuando la secuencia es repetitiva(nótese que nuestro árbol de sufijos tiene hastaN=2n nodos, por lo que puede ocupar hasta 4nbits). Con una representación de gramáticas, elespacio para colecciones repetitivas ocupa unosn bits. Una gramática para generar nuestra se-cuencia de paréntesis podría ser como sigue:

    Existen incluso representaciones de árboles desufijos que no utilizan en absoluto los paréntesis,

    sino que los deducen de los otros componentes,especialmente del arreglo LCP, el que se alma-cena en forma de gramática para agilizar lasoperaciones. Para secuencias muy repetitivas,pueden llegar a necesitar sólo 1.5n bits en total,pudiendo almacenar 1000 genomas en casi500GB. Sin embargo, son también varios órde-nes de magnitud más lentos.

    Exploramos la vía de eliminar del todo la topo-logía del árbol con mi exalumno memorista An-drés Abeliuk en 2012, obteniendo el menor árbolde sufijos hasta el momento. Con mi alumno deDoctorado Alberto Ordóñez, de la Universidadeda Coruña, exploramos la variante de usar gra-máticas para comprimir la topología en 2014,resultando en una estructura algo mayor, perohasta mil veces más rápida que la que prescindecompletamente del árbol.

    ARREGLO DE SUFIJOS: es posible obtener unarepresentación compacta del arreglo de sufijosusando gramáticas, como vimos en el ejemplo.Probamos esta idea en 2007 con mi alumno deDoctorado Rodrigo González. Si bien el accesoal arreglo de sufijos es muy rápido, la compresiónque se alcanza no es competitiva con otras téc-nicas. Una que funciona mucho mejor, propuestapor Sadakane en 2000, es reemplazar el arreglode sufijos A[1,n] por otro que se llama [1,n],que contiene en [i] la posición j donde

    corta, de 33 símbolos (contando los largos delos lados derechos de las reglas, que es cercanoal costo real de almacenarla) en vez de 40, dondeS es el símbolo inicial:

    La diferencia sería más impresionante en unejemplo más largo, claro. Veremos ahora cómorepresentar cada componente del árbol de sufijoscompacto.

    TOPOLOGÍA DEL ÁRBOL: la representacióncompacta clásica de un árbol de N nodos usa 2Nbits: se recorre el árbol en preorden abriendo unparéntesis al llegar a un nodo y cerrándolo aldejarlo definitivamente. Esta secuencia se parteen bloques, y se construye una jerarquía sobrelos bloques. Para cada nodo de esta jerarquía sealmacenan datos como el exceso total (suma deparéntesis que abren menos paréntesis que cie-rran), el mínimo y máximo exceso al recorrer elárea de izquierda a derecha, etc. Esta jerarquíaes suficiente para permitir navegar los paréntesiseficientemente, como si tuviéramos el árbol. Lasecuencia de paréntesis correspondiente a nues-

  • FIGURA 8.ARREGLO PLCP Y SU REPRESENTACIÓN COMO BITS PARA NUESTRA COLECCIÓN.

    FIGURA 7.ARREGLO Ψ DE NUESTRA COLECCION.

    InvestigaciónDestacada

    14

    A[j]=A[i]+1 (excepto si A[i]=n, en cuyo caso con-tiene la posición j donde A[j]=1). Requeriría mu-cho espacio explicar cómo este nuevo arreglopuede reemplazar al arreglo de sufijos. En cam-bio, nos centraremos en sus propiedades.La Figura 7 , muestra el arreglo de nuestroejemplo.

    Hay dos cosas importantes que resaltar: primero,el arreglo es creciente en la zona de los sufijosque empiezan con cada letra (las letras inicialesse indican abajo). Con un poco de cuidado esopuede valer para la zona de los $ también. Estovale para cualquier tipo de texto y permite codi-ficar el arreglo en un espacio cercano al textocomprimido con un compresor simple, tipo Hu-ffman. Esto representa mucho menos espacioque el arreglo de sufijos original.

    El segundo hecho es relevante para las coleccio-nes repetitivas: las zonas coloreadas se convier-ten en áreas de donde el arreglo crece de auna unidad, y por lo tanto es muy fácil de codi-ficar en muy poco espacio. Esto ocurre en todaslas zonas de cada color excepto en una, dondelos números son mayores. Nuevamente, no te-nemos suficiente espacio para explicar las razo-nes por las que esto ocurre. Con Veli Mäkinen ysus alumnos, de la University of Helsinki, publi-

    camos en 2008 el Run-Length Compressed SuffixArray, que usa esta idea y se ha convertido en laprincipal estructura para utilizar en esta situación.En colecciones repetitivas, esta estructura usaunos 0.7n bits.

    ARREGLO LCP: como mencionamos, el arregloLCP se puede comprimir usando una gramáticay eso es buena idea cuando no se representa latopología del árbol, pues se necesita accederlomuy frecuentemente. Cuando se tiene la topo-logía, los accesos a LCP son mucho más esporádi-cos y se puede utilizar una representación máscompacta. Sadakane propuso en 2007 utilizar acambio el arreglo PLCP (Permuted LCP), dondePLCP[i] = LCP[A[i]], es decir, almacena los mismosvalores pero en orden de texto. Esto es conve-niente porque, en ese orden, vale quePLCP[i+1] >= PLCP[i]-1. Esto permite marcar losvalores PLCP[i]+2i (que es una secuencia estric-tamente creciente) como 1s en un vector de 2nbits, y recuperar eficientemente la posición deli-ésimo 1 del vector para encontrar el valor dePLCP[i]. Además de esta notable reducción deespacio, se puede ganar aún más en las colec-ciones repetitivas. El arreglo PLCP y el vector debits para nuestro ejemplo se muestran en laFigura 8.

    Obsérvese cómo aparecen largas zonas decre-cientes en una unidad en PLCP, que se traducenen largas zonas de 1s (y por lo tanto de 0s, yaque hay n de cada uno) en el vector de bits. Estapropiedad, que demostramos con Veli Mäkineny Johannes Fischer, del KIT Alemania, en 2008,hace al vector de bits mucho menor que 2n bitsen colecciones repetitivas, como confirmamoscon mi exalumno Andrés Abeliuk: ¡se llega a usarunos 0.2n bits!

    Sumando los n bits de los paréntesis, los 0.7 nbits del arreglo de sufijos, y los 0.2n bits del LCP,tenemos los 2n bits mencionados. Sacando losparéntesis y agregando una compresión de gra-máticas para LCP, obtenemos los 1,5 n bits yamencionados también. Cuando se incluye latopología del árbol, la estructura realiza las ope-raciones en microsegundos, mientras que cuan-do no, se llega a los milisegundos. Para ponerestos resultados en contexto, la representaciónque usa 2n bits es aún diez veces más lenta queel árbol de sufijos compacto de Sadakane (perotambién ocupa cinco veces menos espacio, y vaocupando menos a medida que la repetitividadaumenta). Un árbol de sufijos clásico ¡ocupa 320veces más espacio que la representación usandoparéntesis comprimidos con gramáticas!

  • InvestigaciónDestacada

    15

    CONCLUSIONESEXPLOTAR LA REPETITIVIDAD DE LOS DATOS PUEDE SER LA CLAVE PARA AFRONTAR EL DILUVIO DE DATOS QUE SE AVECINA RÁPIDAMENTE.EL ENTENDER CÓMO LA REPETITIVIDAD EN LOS DATOS SE MANIFIESTA EN LAS DISTINTAS ESTRUCTURAS DE DATOS QUE USAMOS PARAACCEDER EFICIENTEMENTE A ELLOS PERMITE DISEÑAR VARIANTES DE ESTA S ESTRUCTURAS QUE REDUCEN SU ESPACIO EN ÓRDENES DEMAGNITUD. MOSTRAMOS CON CIERTO DETALLE EL CASO DE LOS ÁRBOLES DE SUFIJOS, UNA HERRAMIENTA MUY IMPORTANTE PARA ELANÁLISIS DE SECUENCIAS. EL SEGUIR EL MISMO CAMINO CON OTRAS ESTR UCTURAS Y OTROS TIPOS DE DATOS REQUIERE UN TRABAJOALGORÍTMICO MUY ESTIMULANTE EN UN ÁREA QUE SE CONSTRUYE SOBRE UN A LARGA TRADICIÓN DE INVESTIGACIÓN EN ALGORITMOS YESTRUCTURAS DE DATOS Y TEORÍA DE LA INFORMACIÓN, PERO QUE A LA VEZ ESTÁ CASI INEXPLORADA, ESPERANDO LA CONTRIBUCIÓN DENUEVOS INVESTIGADORES.

  • 16

    “Empresa Nacional de Computación e Informática” (ECOM) fue elnombre que recibió en diciembre de 1970 la “Empresa de Servicio deComputación” (EMCO) creada anteriormente en septiembre de 1968como filial de CORFO, Endesa y Entel. En el período 1971-1973 ECOMamplió su cobertura más allá de los servicios y la capacitación, desa-rrollando investigación aplicada que permitió transitar desde el desa-rrollo de proyectos “a la medida” hacia la construcción de paqu etesde software genéricos y la participación en la realización de proyectosde gran envergadura e impacto nacional (Censo, RUN, Synco).

    Computacióny Sociedad

  • 17

    JUANÁLVAREZAcadémico Departamento de Ciencias de la Computación,Universidad de Chile. Master of Mathematics (ComputerScience), University of Waterloo. Ingeniero de Ejecución enProcesamiento de la Información, Universidad de Chile.Junto a su labor como docente, trabaja en reconstruir laHistoria de la Computación en [email protected]

    Computacióny Sociedad

    INTRODUCCIÓNLa Empresa de Servicio de Computación (EMCO),fue creada en septiembre de 1968 con el propó-sito de: 1) proporcionar servicios de procesa-miento de datos a entidades del Estado; 2) di-fundir el uso de sistemas de procesamiento dedatos y de equipos electrónicos; y 3) prepararpersonal técnico en análisis y programación desistemas para los Servicios del Estado [1]. En abrilde 1970, un balance de la operación [2] mostrabaque EMCO:

    Cubre el servicio del 30% de la demanda consólo un 17% del gasto total del país.Ofrece el 81% del servicio de la demanda delsector público, con una inversión del 55% deltotal del sector.Atiende a 41 instituciones del Estado que seproyectan a 50 para fines de 1970.De 40 funcionarios en diciembre de 1968, pasóa 120 en diciembre de 1969 y se proyecta con-tar con 230 en 1970.Cuenta con 3 computadores propios conUS$84.500 de gasto mensual.

    Considerando que las actividades proyectadaspara la empresa superarían las de un servicio decomputación, el 24 de diciembre de 1970 EMCOcambió su nombre a “Empresa Nacional deComputación e Informática” (ECOM). En otraspalabras se eliminó la palabra “servicio” y seincorporó “nacional” en consistencia con supretensión de operar en todo el país. “Informá-tica”, término nuevo en la época, se agregó paraenmarcar el tipo de actividades de la empresa:“La informática se dedica a la investigación

    de las propiedades, el comportamiento y lasleyes que gobiernan los procesos de transferen-cia y la tecnología para el procesamiento de lainformación con el objeto de optimizar su accesoy uso” [3].

    A continuación, se presentan los principalesrecursos y proyectos realizados por ECOM en elcorto e intenso período comprendido entrediciembre de 1970 y septiembre de 1973.

    ESTRUCTURAY PERSONALEn 1970, una vez que el Dr. Salvador Allendeasumió la presidencia del país, se designó a losejecutivos de ECOM: Raimundo Beca, economis-ta de la Universidad Católica, como gerentegeneral y como Presidente del Directorio; HéctorHugo Segovia, ingeniero industrial de la Univer-sidad de Chile, como gerente de Ingeniería; Gon-zalo Vargas, ingeniero industrial de la Universi-dad de Chile, como gerente de operaciones. Losdepartamentos de la Gerencia de Ingenieríacontinuaron a cargo de René Barros (Análisis),Jorge Gutiérrez (Programación), Germán Munita(Investigación y Desarrollo) y Mario Pardo (Ca-pacitación). Posteriormente, se creó la Gerenciade Planificación y Desarrollo a cargo de HéctorHugo Segovia y en el Departamento de Investi-gación y Desarrollo asumió Isaquino Benadof.

    Respecto del personal, a fines de 1971 se contabacon 253 personas (que se proyectaban a 373para 1972), distribuidos en 12 directivos (15 para

  • 18

    Computacióny Sociedad

    FIGURA 1.COMPUTADOR BURROUGHS 3500 DE ECOM.

    FIGURA 2.COMPUTADOR IRIS-80 DE CII QUE LLEGARÍA A ECOM A FINES DE 1973.

    1972), 67 profesionales/técnicos (98), 41 admi-nistrativos (50), 109 calificados (178) y 24 nocalificados (32) [4].

    COMPUTADORESEn 1971 ECOM disponía de tres computadoresIBM/360 [1] y las estadísticas de uso, en compa-ración con el año 1970, fueron las siguientes [5]:

    El IBM/360 modelo 40 con 256K de memoriase usó 6036 horas (6360 en 1970).El IBM/360-50 con 384K de memoria se utilizó5429 horas (3988 en 1970).El IBM/360-40 con 128K (instalado en Endesa)se usó 4308 horas (3213 en 1970).

    En 1972 ECOM adquirió un computador Bu-rroughs 3500 (Figura 1) orientado al procesa-miento de datos de tipo administrativo del sectorfinanciero del Gobierno. El total del monto dela inversión fue de E°8.200.000 y fue pagado porCORFO. La configuración, similar a la del com-putador Burroughs 3500 de la Universidad Ca-tólica con quien se estableció un convenio derespaldo mutuo, era la siguiente [6]:

    Procesador central B3501 con 120 Kilobytesde memoria.Consola (SPO) B9340.Unidad electrónica de 20.000KD.Unidad electrónica de 40.000KD.Impresora B9243.2 unidades de cinta B9381 para densidadde grabación de 800 bytes por pulgada.4 unidades de cinta B9393 para 1600 bytespor pulgada.Unidad lectora de tarjetas B9112.

    Por otra parte, a fines de 1973 iniciaría su opera-ción el sistema IRIS-80 adquirido por ECOM a lacompañía francesa CII (Compagnie Internatio-nale pour l’Informatique) en US$3.100.000 (Fi-gura 2). El computador “será instalado en unedificio que está construyendo la empresa a lospies del cerro Manquehue” y “pasaría a ser en elmediano plazo el núcleo de una red nacional de

  • 19

    Computacióny Sociedad

    FIGURA 3.PORTADA DE MATERIAL DE CURSO DE CAPACITACIÓN.

    UNIDAD VELOCIDAD IRIS-80 IRIS-60

    Unidad Central de Proceso 1.200.00 instrucciones por segundo 2 1

    Memoria Ciclo de 650 nanosegundos 768K 192K

    Procesador multiplexor de E/S 42000 kilobytes por segundo 2 1

    Unidad de Cinta de 1600bpi 120 kilobytes por segundo 10 4

    Unidad de Cinta de 800bpi 60 kilobytes por segundo 2 1

    Disco magnético Tiempo acceso: 17-50 mili segundos 600M bytes 150M bytes

    Impresora 1200 líneas por minuto 4 2

    Lectora de tarjetas 1000 tarjetas por minuto 2 1

    Perforadora de tarjetas 200 tarjetas por minuto 1 1

    Terminal teletipo 10 caracteres por segundo 16

    TABLA 1.CONFIGURACIONES DE LOS COMPUTADORES IRIS-80 E IRIS-60.

    CURSO 1969 1970 1971 1972

    Programación 30 57 38 75

    Análisis 23 73 53 75

    Interlocución 75 155 120

    Total 53 205 246 270

    TABLA 2.ESTADÍSTICAS DE CURSOS DE CAPACITACIÓN.

    computadores” [7]. Además se adquirió un com-putador IRIS-60 en US$1.240.000 destinado a laZona de Concepción (Tabla 1).

    Adicionalmente se contaría con minicomputado-res MITRA-15 de CII: dos en Santiago y uno enConcepción. Estarían equipados con lectora detarjetas (de 300 tarjetas por minuto) e impresora(de 200 líneas por minuto) y serían utilizadoscomo procesadores independientes y como ter-minales inteligentes. En el caso de Concepciónse conectaría también como terminal al sistemaIRIS-80 de Santiago.

    Con la llegada del nuevo computador, uno de losya existentes en Santiago sería trasladado a Val-paraíso principalmente para las aplicaciones dela Superintendencia de Aduanas, Emporchi y Sud-americana de Vapores. Por otra parte, se adquiriríaun computador IBM/370-145 que sería propiedadde la Universidad Técnica del Estado (UTE, hoyUSACH) y ECOM cancelaría como arriendo aproxi-madamente un 77% del valor del equipo (aproxi-madamente 1,1 millones de dólares). La UTE en-tregaría a ECOM la administración ycomercialización del tiempo de computador y laUniversidad tendría derecho a uso liberado hastapor un 23% de su capacidad horaria [4].

    CAPACITACIÓNY SERVICIOSEn consistencia con sus propósitos fundacionales,ECOM continuó ofreciendo servicios decapacitación y procesamiento de datos adiferentes instituciones del Estado. En el área decapacitación, y en comparación con añosanteriores ( Tabla 2 ), creció notoriamente laformación de interlocutores, concebidos comoejecutivos medios que pueden intermediar entrelos usuarios y los técnicos especialistas[5][4].

  • 20

    Computacióny Sociedad

    FIGURA 4.RESULTADOS GENERALES DEL CENSO 1970 PROCESADO POR ECOM.

    El curso básico de análisis de sistemas ( Figura3) duraba cinco meses a tiempo completo y de-dicación exclusiva. El plan estaba basado en uncurso del National Computing Centre de GranBretaña y comprendía las siguientes unidades:Fundamentos de Computación (cinco semanas),Introducción al Sistema 360 (dos semanas), Básicode Programación Cobol (cuatro semanas), Orien-tación administrativa (tres semanas) y Básico deAnálisis de Sistemas (siete semanas). Los postu-lantes debían tener 25 o más años, ser egresadosde la universidad y al menos dos años de trabajoen cargos de responsabilidad administrati-va/financiera y/o en procesamiento electrónicode datos. Adicionalmente debían aprobar el sis-tema de selección de ECOM en base a entrevistasy un test de aptitudes [8].

    Por otra parte, ECOM prestó servicios de tiempode computador (en modalidad “Service” y “BlockTime”), de perfo-verificación, y de asesoría enanálisis de sistemas. El servicio de procesamientode datos se extendió a más instituciones delEstado, siendo los principales usuarios Enap, ElTeniente, Instituto Nacional de Estadísticas, Cen-tral de Informaciones del Ministerio de Vivienda,Endesa, Caja de Previsión de Empleados Particu-lares, Sector Financiero del Gobierno, Ministeriode Justicia, Ministerio de Educación, Ferrocarrilesdel Estado, Servicio Médico Nacional de Emplea-dos, Servicio de Seguro Social, Caja de EmpleadosPúblicos, Registro Electoral, Oficina de Planifica-ción Agrícola, Municipalidad de Providencia,Fondo de Extensión y Educación Sindical, Com-pañías del Cobre y usuarios de Valparaíso y Con-cepción [9].

    CENSO Y PROYECTORUN-RNPEn el período 1971-1973 ECOM participó en pro-yectos nacionales de gran envergadura. Al res-pecto, el martes 21 de abril de 1970 se realizó elXIV Censo de Población y el III de Vivienda. Eldiario La Nación tituló en su portada “El censo alas computadoras – Alimentado con 10 millonesde tarjetas, cerebro electrónico analizará datos

    del Censo 1970” informando que, gracias a quepor primera vez se utilizaría un computador, eldetalle se conocería en un plazo de dos a tresaños [10]. Posteriormente, al presentar los resul-tados (Figura 4) el Instituto Nacional de Estadís-ticas expresó [11]:

    Deseamos dejar constancia que el procedimien-to computacional de los datos estuvo a cargode la Empresa Nacional de Computación(ECOM). Una de las etapas más importantes deeste proceso fue la confección de un programade validación y asignación automática de datos(ASIG), el que permite la presentación de la in-formación sin errores de consistencia estadísti-ca. Este programa fue el producto del trabajoconjunto de ambas instituciones y se elaborósobre la base de criterios estadísticos, que ase-guran la plena validez cuantitativa de la infor-mación que se presenta.

    Por otra parte, ECOM participó activamente enel “Proyecto Rol Único Nacional y Registro Nacio-nal de Población” realizado en conjunto con laSubsecretaría de Justicia, la Dirección de Presu-puesto, el Registro Civil e Identificación y el Ser-vicio de Impuestos Internos. La Comisión Técnicadel Proyecto “fue creada a mediados de 1971, ytuvo como principal objetivo el formular las po-líticas y programas de trabajo para iniciar durante1972 la creación de un Registro Nacional de Po-blación (RNP) y la implantación de un númeroúnico de identificación para todos los habitantesdel país (RUN)” [12].

    Para alcanzar el normal funcionamiento de lossistemas computacionales y administrativos seestimó un período de aproximadamente cuatroaños. ECOM participó con dos de los seis inte-grantes en la Comisión Técnica (Hugo Segovia yRené Barros) y destinó un equipo de nueve per-sonas para construir un proyecto piloto y diseñare implementar los sistemas computacionalesdefinitivos. Adicionalmente se contó con la ase-soría de Pinchas Stern, experto de Naciones Uni-das en Sistemas de Información.

    Cabe señalar que el proyecto RUN-RNP necesitóinvestigación acerca del diseño de números deidentificación con dígitos verificadores y respectodel procesamiento de consultas y de la recupe-ración de información utilizando y adaptandocódigos SOUNDEX. El trabajo de investigación ylos desarrollos realizados permitieron la publica-ción de artículos, reportes técnicos y presenta-ciones en seminarios nacionales [13] y congresosinternacionales [14].

    SYNCOEn noviembre de 1971 el Presidente Allende,después de una reunión con el cibernético inglésStafford Beer propiciada por el subgerente téc-nico de CORFO Fernando Flores, aprobó iniciarel proyecto Synco (inicialmente llamado Cyber-syn) cuyo objetivo era desarrollar “Sistemas deInformación y Control” de la producción de las

  • empresas del área social [15]. El proyecto fueconcebido en la Dirección Industrial de CORFO,involucró también al Instituto Tecnológico (INTEC)y a ECOM y contempló cuatro componentes [16]:

    Establecimiento de una Red de Comunicacio-nes (Cybernet) entre las principales empresasdel Área Social y CORFO a través de un SistemaTélex.

    El desarrollo de un Sistema Computacionalpara el control de la gestión operativa del ÁreaSocial en tiempo real (Cyberstride).

    La simulación dinámica de sistemas, con elobjetivo de apoyar las actividades de desarrolloy planificación del aparato industrial (CHECO).

    La construcción de una Sala de Operaciones(Opsroom) con el objetivo de facilitar la tomade decisiones, a través de crear condicionesfavorables para la trasmisión y uso de la infor-mación que generan los sistemas anteriores.

    En un trabajo colaborativo con un grupo de in-vestigadores en Inglaterra, ECOM desarrolló Cy-berstride y destinó algunos investigadores aCHECO. Cyberstride se implementó inicialmenteen el computador IBM/360-50, pero debido aexigencias de alta disponibilidad fue portado,en muy poco tiempo y no sin dificultades, porIsaquino Benadof y su equipo al computadorBurroughs 3500 donde finalmente estuvo dispo-nible en los últimos meses de 1972, realizándoseuna demostración para el presidente Allende eldía 30 de diciembre [17].

    El propósito de Cyberstride se difundió a losusuarios de las industrias y de CORFO a travésde un dibujo (Figura 5) y una descripción sencilla:“Lo que hará el computador es recolectar cadadía la información e informar a los interesadoscuando esté ocurriendo alguna anormalidad,anormalidad que es preestablecida antes deenviar la información al computador” [18]. Lasventajas se resumían precisando que la utilizacióndel sistema:

    Elimina los informes, cuadros con excesivosdatos que nadie es capaz de asimilar ni recor-

    21

    Computacióny Sociedad

    2 .

    3 .

    4 .

    FIGURA 5.DIFUSIÓN DEL COMPONENTE CYBERSTRIDE DEL PROYECTO SYNCO.

    dar por mucho tiempo. El sistema informa so-bre lo que hay que preocuparse, es decir, sobrelos problemas y anormalidades actuales.

    Elimina papeles y datos que no tenganninguna actualidad.

    Los problemas serán solucionados en loslugares mismos en que estos se produzcan.

    Los informes son fácilmente comprensiblespuesto que en ningún caso representan mu-chas cifras.

    El funcionamiento inicial del proyecto Synco tuvoimplicancias importantes. Por una parte, y conel propósito de lograr “una dirección eficaz delsector industrial que requiere del respaldo per-manente de una corriente apropiada deinformación”, el 30 de abril de 1973 se creó laDirección de Informática en la CORFO y se desig-nó a su cargo al gerente general de ECOM Rai-mundo Beca [19].

    Por otra parte, se concluyó que era necesarioimplementar una red de teleprocesamiento [15].Para este efecto, en junio de 1973 se establecióun convenio entre ECOM y ENTEL para planificare implementar un servicio de trasmisión y tele-procesamiento de datos [20]. Así, “un computa-dor distante puede tener acceso a un archivo dedatos centralizados, así como también hay laposibilidad de una comunicación de alta veloci-

    dad entre computadores. En este último casopuede señalarse, a modo de ejemplo, que uncomputador instalado en Concepción podríadialogar con otro de mayor capacidad ubicadoen la capital”.

    DESARROLLO DEPAQUETESEn el período 1971-1973 ECOM transitó desdeel desarrollo de proyectos “a la medida” hacia laconstrucción de paquetes de software genéricos.Por ejemplo, debido a la gran cantidad de siste-mas de pagos de sueldos, cuentas corrientes ycontabilidad; y la necesidad de ahorrar esfuerzosde programación, análisis y diseño; ECOM deci-dió desarrollar sistemas genéricos entonces lla-mados paquetes: “Sistema Generalizado de Pagode Sueldos”, “Sistema Normalizado de CuentasCorrientes Bancarias”, “Sistema Contable”.

    La primera versión del “Sistema Generalizadode Pago de Sueldos” estuvo disponible en sep-tiembre de 1971 y una segunda versión optimi-zada se liberó en junio de 1973. El modelo básicodistinguió como elementos fundamentales loshaberes (pagos), los descuentos legales o impo-sitivos y los descuentos varios (compromisos delfuncionario). El sistema contempló los archivosMaestro y de Movimiento y los subsistemas deconfección y actualización correspondientes

    1.

    2.

    3.

    4.

    1.

  • 22

    Computacióny Sociedad

    FIGURA 6.ESTRUCTURA DEL SISTEMA CONTABLE.

    (ACTAM y ACTAMOV). Un tercer subsistema(PROSUELDO) procesaba los archivos y producíael Archivo de Liquidación con los sueldos de losfuncionarios. La construcción modular y el usode tablas permitían adaptar la estructura centralcon subsistemas optativos para casos particulares[21].

    El “Sistema Normalizado de Cuentas CorrientesBancarias” se desarrolló por iniciativa de la Co-misión Bancaria de Procesamiento de Datos, através de un convenio entre el Banco del Estadoy ECOM y la participación de la Superintendenciade Bancos. La motivación era normalizar parafacilitar el proceso de fusiones, estandarizar enla banca estatizada y actualizar algunos bancoscon déficit y mal estado de las máquinas espe-cializadas de “registro directo”. Las funciones delsistema eran: control de cuentas corrientes, ac-tualización diaria, control de retenciones, liqui-dación a fines de ejercicio, emisión de estadosde cuentas y de informes relativos a balances,estadísticas, etc. Respecto del Sistema, ECOMprestaba los siguientes servicios: preparación dedatos, operación, análisis y programación, man-tención y capacitación para funcionarios de losusuarios [22].

    El “Sistema Contable” abordó el problema quedeben enfrentar los ejecutivos para la toma dedecisiones. La aplicación fue diseñada de maneraque la CORFO y sus filiales uniformaran los pro-cedimientos contables. En una primera etapa sedesarrolló un Sistema Contable Básico con algu-nos agregados: presupuesto de caja, cuadros decosto, y algunos indicadores económicos finan-cieros [23]. La segunda etapa, Contabilidad deGestión, permitiría comparar la producción consu costo detectando los puntos débiles y permi-tiendo corregir a tiempo. El Sistema se estructurócon los subsistemas de Validación y Cuadraturade documentos contables, Maestro de Cuentas,Diario-Mayor y Balance, Análisis de Cuentas, Ló-gica y Nombre de Análisis [24] (Figura 6).

    Otra línea de desarrollo fue la ProgramaciónAutomática, es decir, la construcción de softwareque generaba programas de aplicación de usohabitual. Los generadores de programas tradu-cían una especificación en un “lenguaje orienta-

    do a problema” a instrucciones en un lenguajede programación tradicional. Al respecto sedesarrollaron generadores de programas devalidación (GENEVAL) [25], de edición de infor-mes y de analizadores sintácticos. Su generali-zación se logró automatizando la producciónde los programas generadores [26].

    DEPARTAMENTO DEINVESTIGACIÓN YDESARROLLO

    Muchos de los proyectos más importantes deECOM fueron desarrollados o contaron con elapoyo del Departamento de Investigación yDesarrollo (INDE) de la Gerencia de Ingeniería.El Departamento fue fundamental en la investi-gación aplicada que se necesitó para desarrollarlos proyectos y para su divulgación a través dereportes técnicos, boletines y cursos.

    Los reportes técnicos se publicaron desde el año1970 y en ellos se encuentran los fundamentosy los avances del desarrollo de los diferentesproyectos (Tabla 3). Los documentos permitenapreciar el trabajo de los investigadores e inge-nieros en los distintos proyectos: sueldos, pro-cesamiento de encuestas, bibliotecas, controlde proyectos, RUN, recuperación de información,generación automática de programas, telepro-cesamiento, etc.

    El Boletín del INDE comenzó a publicarse enjunio de 1972 con un propósito de divulgaciónmás extensa que los reportes técnicos. Por esamisma razón la extensión de los artículos es másbreve y sus contenidos son más generales. Losíndices de los primeros seis boletines (Tabla 4),permiten apreciar prácticamente a los mismosautores y los mismos temas de los reportes téc-nicos pero dirigidos a un público más amplio,incluso fuera de ECOM. De hecho, en noviembrede 1972 el boletín alcanzó un tiraje de 900 ejem-plares convirtiéndose en un importante mediode información de la comunidad informática

  • 23

    Computacióny Sociedad

    TABLA 3.REPORTES TÉCNICOS DEPARTAMENTO DE INVESTIGACIÓN Y DESARROLLO.

    AUTOR TÍTULO FECHAAvilés, H. Norma de presentación de informes 72/04Brokering, E. Procesamiento de encuestas mediante computador 70/12Munita, G.Brokering, E. Alternativas de Teleprocesamiento. Proyecto Dirección Industrial CORFO 72/07Calderón, B. Documentación general del paquete de sueldos 72/03Brokering, E.Calderón, B. Estudio preliminar sobre programas generalizados de aplicación estadística 72/05Duffau, E. Recuperación de Información 71/05

    Programa graficador de cartas Gantt 72/05Gamboa, F. Reglas prácticas para el uso del generador de validación 72/05Letelier, G. Programa generador de programas de validación 72/06Gamboa, F.Munita, G. Documentación de Sistemas. VI: tablas de decisiones 70/06

    Norma sobre preparación de publicaciones 72/04Pinedo, J. Sistema generalizado para procesamiento de encuestas por computador, SISTAB 72/07Segal, S. PCS, un sistema integrado para el control de proyectos 70/09

    Los métodos de trayectoria crítica y su relación con el proceso administrativo 71/09Características de PROMIS y comparación con CPS 72/05Ejemplos de PCS 72/05Manual de PCS 72/05Ejemplo PROMIS 72/06Modelo de ubicación de satélites. Unesco. Descripción general del sistema computacional 72/07

    Stern, P. Comparación de datos de alumnos contra un archivo del Registro Civil 71/11Duffaut, E.Vázquez, R. Resolución de problemas de Bibliotecas por medio de computadores. Sistema BIB1 72/03

    Sistema BIB1 para el control de bibliotecas. Documentación para usuarios 72/03Aspectos básicos del control de inventario 72/05

    nacional, razón por la cual se abrió a la publica-ción de contribuciones provenientes desde fuerade ECOM.

    Por otra parte, durante 1971 y 1972 el Departa-mento realizó diversas charlas y cursos destina-dos a difundir el empleo de programas de usogeneral. Particularmente en 1972 se realizaroncursos sobre PCS, MPS, GPSS y GENEVAL, tantodentro como fuera de ECOM. En 1973 se realizóel programa “Capacitación IRIS-80” [27]. El pro-grama contempló un ciclo de difusión y un cicloregular de cursos. El ciclo de difusión se realizóa través de seminarios de diez horas orientadosfundamentalmente a ejecutivos. El ciclo regularestuvo dirigido a personas que deberían trabajardirectamente en los sistemas que serían proce-sados en el equipo IRIS-80. Al respecto, se ofreció

    un programa por tipo de especialistas: jefes deservicios (2.5 días), analista (20.5 días), progra-mador (33 días) y programador y analista avan-zado (63 días).

    RELACIÓN CONUNIVERSIDADESDurante el período 1971-1973 ECOM se relacionópermanentemente con las universidades. En elcaso de la Universidad de Chile esa relación semanifestó principalmente en docencia y en me-morias de título. Varios ingenieros e investiga-dores de ECOM fueron profesores de cursos deComputación en la Escuela de Ingeniería. En

    particular Hugo Segovia fue profesor de“Sistemas de Información”, Pablo Fritis de“Estructuras y Procesos de la Información”, RenéBarros y Víctor Canales de “Introducción a laComputación” y Alberto Ulriksen y Hernán Avilésde “Simulación”.

    ECOM fue también el lugar donde varios estu-diantes de la Universidad de Chile trabajaron yrealizaron sus memorias en el período 1971-1973 aunque sus titulaciones fueron posteriores(Tabla 5). Las memorias estuvieron asociadas alos proyectos Synco, Censo, Generación Automá-tica de Programas, Inventarios, etc. Y cubrierondistintas carreras de Ingeniería: Civil, Industrial,Matemática, y de Ejecución en Procesamientode la Información (la primera carrera de inge-niería en el área en Chile).

  • AÑO NOMBRE TÍTULO ESPECIALIDAD73 Avilés, Hernán Dinámica de sistemas una técnica de simulación Matemática73 Stern, Luis Estudio, prueba e implementación de un sistema de Industrial

    control de proyectos con nivelación de recursos74 Cárdenas, Hernán Evaluación de técnicas de organización de archivos Industrial74 Gamboa, Fernando Programación automática de generadores de Procesamiento

    programas y analizadores sintácticos Información74 Castro, Eduardo Algoritmos de corrección de errores aplicados Procesamiento

    Ibáñez, Pablo al procesamiento de personas del XIV Censo Información75 Brain, Hernán Un sistema computacional generalizado de control Industrial

    físico y valorizado de inventarios75 Letelier, Gabriel Diseño y construcción de un generador de programas Civil

    de validación

    Computacióny Sociedad

    16

    TABLA 4.ÍNDICES BOLETÍN DEL DEPARTAMENTO DE INVESTIGACIÓN Y DESARROLLO.

    TABLA 5.MEMORIAS REALIZADAS EN ECOM POR ESTUDIANTES DE LA UNIVERSIDAD DE CHILE.

    24

    N° FECHA AUTOR TÍTULO ARTÍCULO1 26/06/72 Calderón, Benjamín Sistema generalizado de pago de sueldos

    Letelier, Gabriel GENEVAL2 26/07/72 Munita, Germán Análisis histórico del rendimiento de equipos computacionales

    Letelier, Gabriel Estado actual de GENEVAL3 28/08/72 Avilés, Hernán Sistemas, modelos y simulación

    Duffau, Etienne Corrección de claves numéricas mediante el uso de dos dígitos verificadoresCabrera, Carlos Sistema normalizado de cuentas corrientesCalderón, Benjamín Programas relacionados al paquete de sueldosLetelier, Gabriel Datos estadísticos acerca de la utilización del generador de programasGamboa, Fernando de validaciónGuzmán, Felipe Proposición de sistema de información para mantención de equiposBenadof, Isaquino ¿Qué es la Cibernética?

    4 26/09/72 Avilés, Hernán Dinámica de sistemasDuffau, Etienne Versión preliminar de un soundex españolCalderón, Benjamín Sistema de identificación del paquete de sueldosLetelier, Gabriel Evaluación de un programa generado por GENEVAL mediante “PPE”Benadof, Isaquino Herramientas y cibernéticaCárdenas, Hernán Modelo de simulación de estructura de archivos

    5 26/10/72 Munita, Germán Las economías de escala y la ley de GroschBrain, Hernán Conceptos generales del control de inventariosStern, Luis PROMIS, un sistema de control de proyectosCalderón, Benjamín Sistema básico de codificación del paquete de sueldosLetelier, Gabriel Aplicabilidad de META-POL a la generación de programasBenadof, Isaquino ¿Qué es la ergonomía?

    6 24/11/72 Munita, Germán Los nuevos computadores de ECOMDuffau, Etienne Sistemas de Identificación ISegal, Sergio Formulación y solución computacional del problema de la dietaCabrera, Carlos Sistema normalizado de cuentas corrientesCalderón, Benjamín Registros de entrada al paquete de sueldosLetelier, Gabriel Características de una 3ra. Versión de GENEVAL

  • CONCLUSIONESLA REVISIÓN DE LA ESTRUCTURA, LOS RECURSOS Y LOS PROYECTOS DE LA EMPRESA NACIONAL DE COMPUTACIÓN E INFORMÁTICA (ECOM)DURANTE EL PERÍODO 1971-1973, PERMITE DISTINGUIR ELEMENTOS DE CONTINUIDAD Y CAMBIO CON RESPECTO AL PERÍODO INICIAL 1968-1970DE LA EMPRESA DE SERVICIO DE COMPUTACIÓN (EMCO).

    ECOM CONTINUÓ CUMPLIENDO LOS PROPÓSITOS FUNDACIONALES DE PROPORCIONAR SERVICIOS COMPUTACIONALES A LAS INSTITUCIONALESESTATALES Y CAPACITAR PERSONAL. EN ESTAS DOS DIMENSIONES ECOM RE PRESENTÓ UN SALTO CUANTITATIVO, AUMENTANDO, TANTO LACANTIDAD DE COMPUTADORES Y USUARIOS, COMO EL NÚMERO DE PERSONAS ENTRENADAS EN PROGRAMACIÓN, ANÁLISIS E INTERLOCUCIÓN.

    POR OTRA PARTE, EL QUEHACER DE ECOM SIGNIFICÓ UN SALTO CUALITATIVO RESPECTO DE LO REALIZADO POR EMCO. EN EFECTO, ENTRE LOSAÑOS 1971 Y 1973, ECOM TRANSITÓ DESDE LA CONSTRUCCIÓN DE SOFTWARE “A LA MEDIDA”, HACIA EL DESARROLLO DE SISTEMAS GENÉRICOS(SUELDOS, CUENTAS CORRIENTES, CONTABILIDAD, GENERADORES DE PROGRAMAS) Y DE PROYECTOS DE IMPACTO NACIONAL EN CONJUNTO CONOTRAS INSTITUCIONES ESTATALES, POR EJEMPLO EL CENSO CON EL INE, EL RUN-RNP CON EL REGISTRO CIVIL Y EL MINISTERIO DE JUSTICIA, ELEMBLEMÁTICO PROYECTO SYNCO CON LA CORFO E INTEC, Y LOS PROYECTOS CON LAS INDUSTRIAS DE LA REGIÓN DEL BIOBÍO.

    EL SALTO CUALITATIVO SE SUSTENTÓ EN EL TRABAJO DE LAS GERENCIAS DE INGENIERÍA Y DE PLANIFICACIÓN Y DESARROLLO Y DEL DEPARTAMENTODE INVESTIGACIÓN Y DESARROLLO. ALLÍ SE REALIZARON LOS ESTUDIOS, LA INVESTIGACIÓN APLICADA Y LAS PRUEBAS DE LOS PROTOTIPOS DELOS SISTEMAS DE SOFTWARE. SUS RESULTADOS FUERON DIFUNDIDOS EN EL MEDIO NACIONAL A TRAVÉS DE REPORTES TÉCNICOS, BOLETINES YCURSOS. ESTE QUEHACER SE RELACIONÓ TAMBIÉN CON LAS UNIVERSIDADES A TRAVÉS DE MEMORIAS, DOCENCIA Y COORDINACIÓN CON SUSCENTROS DE COMPUTACIÓN.

    EN SÍNTESIS, EL QUEHACER DE ECOM EN EL PERÍODO COMPRENDIDO ENTRE DICIEMBRE DE 1970 Y SEPTIEMBRE DE 1973 DEJÓ UN VALIOSO LEGADOAL MEDIO COMPUTACIONAL Y TECNOLÓGICO NACIONAL. LA MAYORÍA DE LOS PROYECTOS Y SISTEMAS CONTINUARON VIGENTES, OTROS QUEDARONPENDIENTES Y FUERON REALIZADOS POSTERIORMENTE (NUEVO EDIFICIO, C OMPUTADOR PARA LA UTE), Y UNOS POCOS FUERON CANCELADOS(LA COMPRA DE LOS COMPUTADORES FRANCESES, EL PROYECTO SYNCO). POR ÚLTIMO, Y QUIZÁS LO MÁS IMPORTANTE, ECOM LEGÓ AL PAÍS UNCONJUNTO DE PERSONAS DOTADAS DE UNA EXPERIENCIA, UNA MÍSTICA DE TRABAJO Y UN ESPÍRITU DE SERVICIO PÚBLICO QUE CONTRIBUYERONAL DESARROLLO Y PROGRESO DE LA DISCIPLINA INFORMÁTICA EN CHILE Y EN ALGUNOS PAÍSES DEL EXTRANJERO.

    25

    Computacióny Sociedad

    La relación con las universidades se produjotambién en el marco de la Asociación Chilenade Centros Universitarios de Computación(ACUC), creada en diciembre de 1970, dondeECOM participó como miembro invitado conderecho a voz. De hecho, en el primer boletínde la ACUC, de julio de 1973, Germán Munitaescribió un artículo respecto de los computado-res disponibles en ECOM y de los futuros com-putadores IRIS [6].

    SUBGERENCIA ENCONCEPCIÓNEn 1971 CORFO Biobío aprobó la idea de crearuna instalación informática regional para apoyar

    las empresas del Área Social, algunas de lascuales ya poseían computadores y personal ca-pacitado [28]. ECOM acogió la iniciativa y creóuna subgerencia que dependía del Gerente Ge-neral, y contó con el apoyo de la Gerencia deAdministración y Finanzas. Posteriormente, en1972, ECOM aprobó el proyecto “Centro de In-formática Lautaro” que albergaría un IRIS-60 yminicomputadores MITRA-15 para teleproceso.El proyecto contempló un edificio de mil metroscuadrados con empleo de acero, vidrio y cemen-to y con un mural de Julio Escámez en el hall deacceso.

    La subgerencia estuvo a cargo del ingenieroÓscar Sáez y se contrató una docena de funcio-narios, la mayoría ingenieros y técnicos (entreellos siete analistas y un programador) y fueron

    capacitados en las herramientas de los IRIS yMITRA. Dos de ellos fueron enviados a capacitar-se a Francia.

    La subgerencia realizó proyectos en el marco deconvenios con la siderúrgica CAP, la mineraENACAR y la textil Bellavista Tomé. En este últimocaso, en 1973 ECOM propuso un proyecto deinformatización integral de la fábrica textil quefue aprobado por la Asamblea de Trabajadoresde la empresa. El proyecto incluía tanto funcio-nes administrativas como de apoyo a la produc-ción.

  • 26

    Computacióny Sociedad

    El 11 en ECOM: La experiencia de uno de sus trabajadoresNN comenzó a trabajar en la Empresa Nacionalde Computación (ECOM) en el año 1971. Siendoaún estudiante de Ingeniería de la Universidadde Chile, su situación económica lo obligó a dejarsus estudios y aprovechó una oportunidad quese presentó para trabajar como operador de equi-pos periféricos del computador. Su primer día detrabajo consistió en vigilar el normal funciona-miento de una impresora 1403 de uno de loscomputadores IBM/360, evitando los atascos yalimentándola de papel que entonces se elabora-ba en hojas con prepicado y en formularios con-tinuos.

    Por su buen desempeño y dedicación al trabajoasumió prontamente responsabilidades mayoresen la operación de los computadores de la em-presa y le correspondió supervisar sistemas com-putacionales que apoyaban la administración delas empresas del Estado y que se procesaban enalguno de los tres computadores IBM (uno de loscuales residía en Endesa). Eran los años del go-bierno del Presidente Salvador Allende y NN con-tribuía con su trabajo a apoyar entusiastamentela construcción del socialismo en Chile.

    La empresa, tratando de diversificar la procedenciade sus equipos y evitar la dependencia de unúnico fabricante, adquirió un computador Bu-rroughs 3500 y encargó dos computadores fran-ceses CII (Iris-80 e Iris-60). La operación de losequipos de entonces era compleja y muy delicadapor lo que se requería actualización y entrena-miento permanente. El día 11 de septiembre de1973, NN, que vivía en la comuna de San Miguel,acudió muy temprano a un curso de capacitaciónque se realizaba en el edificio “Sol de Chile” en lacalle Huérfanos. Se extrañó que sus compañerosno llegaran, hasta que alguien le informó que seestaba produciendo un golpe de Estado.

    Estando muy cerca de La Moneda, instintivamentese dirigió hacia allá y observó que estaba siendorodeada de tanquetas. Desde una de ellas se

    disparó una ráfaga por lo que decidió regresaral edificio principal de ECOM. Las horas fueronmostrando la brutalidad del golpe y desde lasoficinas observó a militares sacando y apresandotrabajadores en los edificios cercanos, especial-mente en el Ministerio del Trabajo ubicado enla esquina de las calles Huérfanos y Morandé.

    NN, junto a una veintena de funcionarios, lamayoría (pero no todos) simpatizantes del go-bierno de Allende, decidió quedarse y tratar deproteger y defender las instalaciones. El toquede queda duró varios días y la permanencia sehizo peligrosa y difícil. Cerraron las ventanas ydurante la noche apagaban las luces para nodespertar la atención de las patrullas militares.Para alimentarse tuvieron que aprovisionarsede tallarines desde un casino que se encontrabaen el último piso del edificio y los prepararonen una cocinilla. En una ocasión fueron sorpre-sivamente interrumpidos por el sonido de unmensaje que llegó a un terminal de télex, exi-giéndoles que reportaran la cantidad y la listade personas que permanecían en la empresa.

    Decidieron no responder. La espera se hizo infruc-tuosa y se retiraron sigilosamente al levantarse eltoque de queda.

    El regreso al trabajo fue muy tenso. NN decidiópresentarse, a pesar de que eran conocidas sussimpatías por el Gobierno de Allende. Algunaspersonas no regresaron y otras fueron despedidas.Esperando lo peor, NN fue gratamente sorprendidopor el encargado del equipo Burroughs 3500 que,conociendo su experiencia técnica, le ofreció tra-bajar en la operación de ese computador. NN acep-tó la propuesta y durante un par de años tuvo undesempeño que fue destacado y reconocido. Dehecho, llegó a estar a cargo de dos computadores3500, de los más grandes y sofisticados de la época.

    Lamentablemente, esta historia no tuvo un finalfeliz. Uno de los computadores 3500 fue asignadoa una de las ramas de las fuerzas armadas, queexigió la expulsión de NN. En una reunión surrea-lista, el Gerente no encontraba la justificación paradespedir a un funcionario que tenía una impecabley muy destacada trayectoria laboral.

  • AGRADECIMIENTOS Y DEDICATORIAAl personal de las Bibliotecas de las Escuelas de Ingeniería y de Economía de la Universidad de Chile, de CORFO, del CongresoNacional y de la Biblioteca Nacional por facilitar el acceso a las fuentes escritas. Gracias también a Germán Munita y Óscar Sáez porla valiosa información acerca del Departamento de Investigación y Desarrollo y de la Subgerencia del Biobío. Finalmente, un especialreconocimiento a mi profesor Hugo Segovia (Q.E.P.D.) por su dise rtación en el año 2008 (en un acto de conmemoración de loscuarenta años de la creación de ECOM) y por una entrevista en 20 09. A su memoria dedicamos este artículo, personalizando enél, el gran aporte que realizó al país ECOM y sus trabajadores entre los años 1971 y 1973.

    Computacióny Sociedad

    [20] Diario El Mercurio. “Convenio ENTEL-ECOM:Planifica Servicio de Transmisión y Teleprocesa-miento de Datos”. 27 de junio de 1973.

    [21] ECOM. “Sistema generalizado de pago desueldos”. Actas Conferencia “Facilidades de pro-cesamiento electrónico de datos para empresasy organismo gubernamentales”. Junio 1973.

    [22] ECOM. “Sistema normalizado de cuentascorrientes bancarias”. Actas Conferencia“Facilidades de procesamiento electrónico dedatos para empresas y organismo guberna-mentales”. Junio 1973.

    [23] ECOM. “Sistema Contable Computacional”.12 de junio de 1972.

    [24] ECOM. “Sistema contable”. Actas Conferen-cia “Facilidades de procesamiento electrónicode datos para empresas y organismogubernamentales”. Junio 1973.

    [25] Letelier, Gabriel. “Diseño y Construcción deun Generador de Programas de Validación”. Me-moria para optar al título de Ingeniero Civil dela Universidad de Chile. 1975.

    [26] Gamboa, Fernando. “Programación Automá-tica de Generadores de Programas y Analizado-res Sintácticos”. Informe para optar al título deIngeniero de Ejecución en Procesamiento de laInformación de la Universidad de Chile. 1974.

    [27] ECOM. “Programa capacitación IRIS-80”.Actas Conferencia “Facilidades de procesamientoelectrónico de datos para empresas y organismogubernamentales”. Junio 1973.

    [28] Sáez, Óscar. Comunicación personal. Junio2015.

    [10] Diario La Nación. “El Censo, a las computa-doras”. 23 de abril de 1970.

    [11] Instituto Nacional de Estadísticas. “XIV CensoNacional de Población y II de Vivienda 1970”.http://www.ine.cl/canales/usuarios/cedoc_online/censos/pdf/censo_1970.pdf

    [12] OCOM; ECOM. “Proyecto Rol Único Nacionaly Registro Nacional de Población”. Agosto 1972.

    [13] OCOM; ECOM; Subsecretaría de Justicia.“Antecedentes para la creación de un registroautomatizado de población en Chile”. Actas Se-minario “Sistemas de Información Adminis-trativos”, U. de Chile. Julio 1971.

    [14] Stern, Pinchas; Duffau, Etienne. “Un proyectopiloto para la creación de un archivo depersonas”. Actas I Congreso Iberoamericano deInformática”. Buenos Aires, mayo – junio 1972.

    [15] CORFO. “Proyecto Synco. Conceptos y Prác-tica del Control; una experiencia concreta: laDirección Industrial en Chile”. Febrero 1973.

    [16] Presidencia de la República. “Mensaje delPresidente Allende ante el Congreso Pleno”.Páginas 412-415. 21 de mayo de 1973.

    [17] Medina, Eden. “Revolucionarios ciberné-ticos”. Editorial LOM. 2013.

    [18] ECOM. “Proyecto Synco – SistemaCyberstride”. Actas Conferencia “Facilidades deprocesamiento electrónico de datos para empre-sas y organismo gubernamentales”. Junio 1973.

    [19] Diario El Mercurio. “Cinco nuevas reparticio-nes creó Vuskovic en la CORFO”. 30 de abril de1973.

    REFERENCIAS[1] Álvarez, Juan. “Empresa Nacional deComputación: antecedentes, creación yprimeros años”. Revista Bits de Ciencia N° 9,Primer Semestre 2014.

    [2] Marfán, Álvaro; Friedmann, Efraín; Sáenz,Ricardo. “Experiencia en el sector público deChile sobre el procesamiento electrónico dedatos con computadores electrónicos”. ActasI Conferencia Latinoamericana de autoridadesgubernamentales de Informática”. BuenosAires, abril 1970.

    [3] Diario La Nación. “ECOM: nuevo nombrepara una empresa que surge”, 16 de enero de1971.

    [4] CORFO. “Información presupuestariaempresas e institutos filiales CORFO Año 1972”.Julio 1971.

    [5] Presidencia de la República. “Mensaje delPresidente Allende ante el Congreso Pleno”.21 de mayo de 1972.

    [6] ACUC. “Revista de la Asociación Chilena deCentros Universitarios de Computación”. N°1,julio 1973.

    [7] ECOM. “Características principales de lossistemas IRIS-80 e IRIS-60”. Actas Conferencia“Facilidades de procesamiento electrónico dedatos para empresas y organismogubernamentales”. Junio 1973.

    [8] EMCO. “EMCO Capacitación”. 1970.

    [9] Segovia, Hugo. “Gerencia de Ingeniería,Gerencia de Investigación y Desarrollo 1971-1973”. Presentación en acto “A 40 años de lacreación de la Empresa Nacional deComputación”. DCC, U. de Chile, diciembre2008.

    27

  • 28

    "No me parece mal ser maestro chasquilla, desatornillador en manoandar arreglando entuertos con mucha imaginación. De hecho esa esuna de mis formas de ganarme la vida. La pregunta es si podremosdesarrollar este país hacia el futuro, con competitividad internacional,en base a pura artesanía. Ojalá que cuando la tecnología nacional sehaga necesaria al borde de una catástrofe, podamos encontrarla e nalgún lado".

    José Miguel Piquer, Columna en Revista Informática, 1996.

    La Industria del Softwarey TIC en Chile

  • 29

    JOSÉ MIGUELPIQUERProfesor Asociado Departamento de Ciencias de laComputación, Universidad de Chile. Director Técnico deNIC Chile y socio fundador de la consultora IT-Talk Ltda. yde E-voting Chile SpA, dedicada a servicios de votaciónelectrónica. Entre 2011 y 2013, fue el encargado deldesarrollo de proyectos científicos de transferencia en INRIAChile, centro de excelencia internacional, donde se buscaestablecer un puente entre la investigación y el [email protected]

    Por más de veinte años he albergado la esperan-za que la industria TI chilena un día se transformeen motor del desarrollo y posicione a Chile enla lista de los países líderes en generación desoftware en el mundo. A comienzos de los no-venta, mi generación de profesores estaba reciénllegando de sus doctorados a instalarse en lanaciente democracia chilena, y soñamos quepodíamos cooperar con la industria para lograreste liderazgo [1]. Fue obviamente una ilusiónpasajera y un sueño muy inocente, pero siemprehe creído que, en el largo plazo, es posible: nues-tras universidades forman profesionales de nivelmundial, nuestros departamentos de computa-ción son de los mejores en América Latina yestán en una buena posición en el mundo. Ade-más, llevan haciendo esto ya por muchos años,creando varias generaciones de profesionales.Entre tanto, el país se ha desarrollado enorme-mente, y tenemos varias industrias que hoy com-piten por los primeros lugares en el mundo.

    Es decir, debiera estar todo lo necesario para eléxito: una oferta de profesionales y de investi-gación entregada por buenas universidades, yuna demanda de alto nivel y complejidad basadaen industrias líderes a nivel mundial. Es el planque estuvo en la base de la creación de los clusterpropuestos por el Consejo Nacional para la In-novación en 2005, y que buscaba impulsar lainnovación y el emprendimiento para cambiarel modelo de desarrollo del país, pasando de lasmaterias primas a productos con valor agregado.Aunque las TI nunca fueron un cluster, justamen-te porque nuestra industria no es una de las quecompite a nivel mundial, siempre estuvieron enla lista de lo que llamaron "tecnologías habilitan-tes", cuya demanda debía aumentar mucho aldesarrollar los verdaderos cluster.

    Al mirar el escenario actual, diez años de esfuer-zos en innovación en Chile no parecen haberdado los frutos esperados. Seguimos siendo elmismo país esclavo de los recursos naturales ysus precios, como lo demuestra la desaceleracióneconómica que sufrimos desde 2014, simple-mente debido a una baja sostenida en el valorinternacional de los commodities. Esto se reflejaigualmente en la industria TI chilena: nuestrosgrandes proveedores son muy buenos integra-dores de sistemas, que hoy funcionan comosocios estratégicos de las empresas al mantenersus sistemas operando, pero casi no existenejemplos de servicios o desarrollos de softwareinnovadores que compitan a nivel mundial. ¿Te-nemos alguna esperanza aún?

    Algunas luces quedan en el sistema, que parecenindicar que Chile no ha perdido todas sus opor-tunidades. Veamos las razones que nos dan es-peranzas:

    1) La exportación de servicios TI ha crecido enlos últimos años, posicionando a Chile comopunto de destino de inversiones interesantes[2], así también como un país plataforma denearshoring con varias transnacionales instalan-do sus centros de desarrollo TI e incluso algunoscentros de I+D en Chile. Aunque los númerostodavía son pequeños (100 millones de dólaresen 2010) parece una tendencia al alza importan-te. Esta tendencia, de producir software para elmundo, es muy positiva, dado que uno de losgrandes frenos a la industria local siempre hasido la falta de sofisticación de los clientes locales.No es posible desarrollar software de clase mun-dial para un cliente que quiere que le amarrecon alambritos un sistema a la rápida (y eso eslo que está dispuesto a pagar).

    La Industria del Softwarey TIC en Chile

  • La Industria del Softwarey TIC en Chile

    2) La demanda por aplicaciones móviles volvióa generar un mercado emergente, parecido a loque era la demanda por aplicaciones web en losnoventa. En esos mercados siempre nos hemosmovido bien, porque requieren productos rápi-dos y sucios, pero que funcionen bien. Esta vezno fue la excepción (y creo que Startup Chileayudó mucho a esto). El tema es que Chile apa-rece en las listas de países donde es bueno man-dar a hacer aplicaciones móviles, y hemos ganadocierta fama en ese nicho. Lo difícil es mantenerese empuje en el tiempo, y saber ir migrandohacia sistemas más maduros y estables, dondela improvisación y la suciedad ya no son acepta-bles.

    3) He visto a varios de nuestros exalumnos invo-lucrados en emprendimientos cada vez más so-fisticados, innovadores y riesgosos. En los viejostiempos fueron Tecnonautica (comprado porTelefónica), Mapcity, Acepta.com y Atentus. Hoyexisten muchos más como esos, en juegos paramóviles, medios de pago, y varios otros. De todoeste ecosistema de gente innovadora, algo muybueno terminará saliendo.

    Tal vez era necesario que pasara el tiempo, quelos grupos se consolidaran, que el país madurara.Pero estamos de vuelta en lo mismo: una tem-prana infancia de una industria emergente queno parece lograr consolidarse nunca. O tal vezuno de estos días…

    Ojalá que, de todos estos proyectos, salga eseejemplo de éxito que necesitamos, que demues-tre que se puede desarrollar tecnología de nivelmundial en este perdido lugar al fin del mundo(¡pero con buena conexión a Internet!).

    REFERENCIAS

    [1] Baeza-Yates, R. A., Fuller, D. A., Pino, J. A., Goodman, S. E. (1995). Computing in Chile: the jaguar of thePacific Rim?. Communications of the ACM, 38(9), 23-28.

    [2] R. A. Hernández, N. Mulder, K. Fernandez-Stark, P. Sauvé, D. L. Giral, F. M. Navia (Eds.), Latin America’semergence in global services (pp. 177–195). Santiago: UN, 2014.

    30

    En todo este sueño, el Departamento de Cienciasde la Computación (DCC) de la Universidad deChile hizo sus aportes: formamos muy temprana-mente profesionales en tecnologías innovadorase importantes, ayudamos en las conexiones aInternet del país y hemos difundido las tecnolo-gías relevantes cada vez que podemos. Sin em-bargo, me parece que podríamos hacer muchomás, incentivando a nuestros estudiantes a em-prender, apoyando el despliegue de nuevas tec-nologías en el país, y acompañando a la industriaen el difícil camino de la innovación tecnológica.

    Hoy el DCC no se ve muy presente en los esfuer-zos de transferencia que la misma Facultad deCiencias Físicas y Matemáticas de la Universidadde Chile ha comenzado, como el área de innova-ción del Proyecto 2030 o proyectos concretosinternos como el Fab Lab. En algún momentotuvimos roces con la Facultad porque nuestrosacadémicos hacían muchos proyectos aplicadosy poca investigación. Parece que ahora se invir-tieron los roles, tal vez se nos pasó la mano eninsistir tanto en las publicaciones internacionales,el asunto es que nadie parece tener el tiempoque estos esfuerzos requieren.

    Cooperar con las empresas y con los emprende-dores no es fácil ni eficiente. El entorno chilenoes todavía adverso a la innovación y al riesgo,nadie cree que realmente hay valor en desarrollartecnología y arriesgarse en áreas inexploradas.Por lo tanto, no existe ningún incentivo concretopara ir en esa dirección, siendo lo normal hoydormirse en los laureles y revisar cuál es el próxi-mo concurso CONICYT donde postular. Si norompemos esa rutina, demoraremos veinte añosmás en tener una verdadera industria TI.

  • 31

    La Industria del Softwarey TIC en Chile

    El mercado tecnológico chileno es uno de los más desarrollados deLatinoamérica, representando un 1,7% del PIB, según informes recientesde IDC. No obstante, su potencial de crecimiento es aún extenso siconsideramos que en los países desarrollados, el porcentaje invertidoen tecnología llega al 2,5% del PIB.

  • 32

    En Chile, la industria del software está formadapor PyMEs que en general realizan venta deproductos tecnológicos e integración, pero noalta tecnología, que es lo que en Gechs comoAsociación estamos buscando cambiar. Históri-camente hemos sido un gremio de servicios,pero en el último año, gracias a un proyectoejecutado junto a Corfo, denominado SaaS Ge-neration, estamos buscando pasar de ser desa-rrolladores a medida a ser desarrolladores de“productos” tecnológicos que se puedan vendercomo servicios escalables a nivel global.

    ESTRUCTURA DELA INDUSTRIA TICEn Chile, de las aproximadamente 950 mil em-presas registradas en el Servicio de ImpuestosInternos, hay 4.700 con giro TIC, de las cualeshay desde microempresas que se dedican a ven-der insumos para equipos, hasta empresas másformales que desarrollan software.

    De esas 4.700, estimamos que deben haber unas1.600 empresas que realizan servicios mássofisticados, tanto servicios tecnológicos, comodesarrollo a medida o empresas de basetecnológica, que son las que pueden crecerexponencialmente si logramos abrirnos a nuevosmercados. El modelo de Software as a Service(SaaS), que estamos promoviendo entre losmiembros de la Asociación, así como en jóvenesinnovadores y emprendedores, va en esa línea.

    MARÍA EUGENIARIQUELMEIngeniero en Comercio Internacional, con Diplomado en Gestión y Desarrollo de Negocios. Cuenta con 18 añosde experiencia en gestión de Asociaciones Gremiales, actualmente dirige la Asociación de Empresas de Softwarey Servicios, GECHS (9 años), siendo responsable de las relaciones institucionales de la Asociación con el sectorgubernamental, privado, académico y medios de comunicación, a ef ecto de contribuir a una mejor imagen,posicionamiento y concreción de los objetivos