Técnicas de reingeniería y MDA
Bibliografía Las gráficas fueron extraídas de 1. Demeyer, S.; Ducasse, S.; Nierstrasz, O. Object-Oriented Reengineering Patterns, Morgan-Kaufmann Publishers, 2002 2. Systa, Tarja. Static and Dynamic Reverse Engineering for Java Software Systems. Ph. D. University Tempere, Finland, 2000 3. Tonella, P. Potrich, A. Reverse Engineering of Object-Oriented Code, Springer, 2005
Ingeniería directa, inversa y reingenieía
Ingeniería directa, inversa y reingeniería Ingeniería directa Es el proceso que transforma diseños en un alto nivel de abstracción a la implementación de un sistema. Ingeniería inversa Es el proceso que analiza un sistema para identificar sus componentes y sus interrelaciones y crea representaciones del sistema en otra forma o en un mayor nivel de abstracción. Reingeniería Es el proceso que transforma una representación de bajo nivel en otra, mientras reconstituye artefactos de mayor nivel de abstracción a lo largo del proceso. Es decir, transforma implementaciones concretas en otras concretas transformando al sistema en todos sus niveles.
Otras definiciones relacionadas a reingenieía Reestructuración Es el proceso de transformar una representación en otra en el mismo nivel de abstracción, preservando el comportamiento externo del sistema. Refactoring Es el proceso de reestructuración en un contexto orientado a objetos Mantenimiento El proceso de modificación de un producto de software para corregir fallas, mejorar la performance o adaptarlo a un cambio de entorno.
Otras definiciones relacionadas a reingeniería Evolución de software La evolución de software se caracteriza por la existencia de un código del sistema y la actividad típica es la implementación de un cambio que puede ser requerido para: corregir el software ( mantenimiento correctivo) agregar funcionalidad ( mantenimiento perfectivo) adaptarlo a un cambio de ambiente ( mantenimiento adaptativo) reestructurarlo para facilitar su futuro mantenimiento ( mantenimento preventivo) Durante la evolución, la descripción más precisa y confiable del software es su código.
Ingeniería inversa
Ingeniería inversa(reverse engineering) Las técnicas de ingeniería inversa permiten analizar y representar software en una forma abstracta a fin de facilitar mantenimiento, reingeniería, reusabilidad y documentación. Proveen una manera de extraer vistas de alto nivel desde el código sistema, que resumen aspectos relevantes de la computación ejecutada por las sentencias del programa.
Chikofsky y Cross(*) definen a la ingeniería inversa como el proceso de analizar un sistema target con dos objetivos: Identificar los componentes del sistema y sus interrelaciones Crear representaciones del sistema en otra forma o en un mayor nivel de abstracción
* Reverse Engineering and design Recovery: A taxonomy. IEEE Software, January 1990
Ingeniería inversa(reverse engineering)
Ingeniería inversa estática + Ingeniería inversa dinámica
Análisis estático Describe la estructura del software a partir del código (texto) Análisis dinámico Describe el comportamiento en ejecución del software. Extraer información en código OO es difícil (o imposible?) Naturaleza dinámica de los lenguajes OO Creación de objetos, garbage collector, dynamic binding,
Ingeniería inversa Inconvenientes La única fuente confiable es el código que está poco (o nada) documentado y se ha perdido contacto con los diseñadores y/o programadores. Las herramientas CASE proveen buen soporte para análisis estático pero limitado para análisis dinámico.
Ingeniería inversa de programas OO
Ingeniería inversa de código OOInconvenientes UML JAVA Por ejemplo, las construcciones JAVA no se alinean con UML: Generalización/ especialización Agregación/composición Asociaciones Cuerpo de los métodos
Propuesta de :
Tonella, P. Potrich, A. Reverse Engineering of Object-Oriented Code. Springer, 2005
Describe ingeniería inversa de diagramas UML de clases, objetos, interacción, estados y paquetes. Propone especializaciones de algoritmos de data-flow basados en una estructura llamada OFG (Object Flow Graph).
Arquitectura general de una herramienta de ingeniería inversa
Ejemplo de modelo del lenguaje para JAVA simplificado
Ingeniería inversa estática OFG: representación básica para el análisis estático. Permite seguir el flujo de información de objetos desde su creación, a través de asignaciones a variables, su uso en invocaciones de métodos, almacenamiento en atributos de una clase,… El tipo de información que se propaga en el OFG depende del objetivo del análisis en el que se use.
Un lenguaje abstracto Un algoritmo de propagación de flujo que es genérico en el tipo de información procesada
Ingeniería inversa estática Análisis estático sobre JAVA Sensible al flujo de datos Insensible al flujo de control Representación por grafos de flujos de objetos basada en una versión abstracta, simplificada de JAVA que omite sentencias de control (condicionales, iteraciones, etc) Evita conflictos de nombres (los identificadores son precedidos por un punto separados por la lista de packages, clases y métodos que los incluyen)
Ingeniería inversa estática ¿Porqué el análisis es sensible al flujo de datos/ insensible al flujo de control?
Complejidad computacional Naturaleza de LOO Puede automatizarse
OFGLenguaje abstracto
OFGLenguaje abstracto
OFGLenguaje abstracto return y this
EjemploeLib- Diagrama de clases
EjemploLenguaje abstracto-Declaraciones Library.loans Declaración de atributo loans Library.Library() Declaración de constructor implícito
EjemploLenguaje abstracto-Declaraciones Library.borrowDocument(Library.borrowDocument.user, Library.borrowDocument.doc) Declaración de método
EjemploLenguaje abstracto-Sentencias 60-62 Library.borrowDocument.loan = new Loan(Library.borrowDocunent.user, Library.borrowDocument.doc); Library.borrowDocument.this. Library. addLoan(library.borrowDocument.loan)
EjemploLenguaje abstracto-Sentencias 42 Library.addLoan.user=Loan.getUser.return 43 Library.addLoan.doc = Loan.getDocument.return;
Generación del OFG OFG = (N, E) N: conjunto de nodos E: conjunto de arcos Para cada variable local, atributo o parámetro formal, se agrega un nodo a OFG. Por ejemplo, el OFG de la clase Library de eLib contiene: Un nodo asociado al atributo loan rotulado Library.loans Dos rótulos asociados con los parámetros formales del método borrowDocument rotulados Library.borrowDocument.user Library.borrowDocument.doc La variable local loan asociada con el nodo rotulado Library.borrowDocument.loan El objeto current en BorrowDocument está asociado con un nodo rotulado Library.borrowDocument.this
Generación del OFG Los arcos se insertan de acuerdo a las siguientes reglas
Generación del OFG Library.borrowDocument.loan = new Loan(Library.borrowDocument.user, Library.borrowDocument.doc) Library.borrowDocument.this.Library.addLoan (Library.borrowDocument.loan) genera los siguientes arcos:
Generación del OFG x = y {(y,x) ? E}
genera los siguientes arcos
Generación del OFGContainers Si una función de librería introduce un flujo de dato de una variable x a otra y, debería incluirse el arco (x,y) Clases que implementan la interfaz Collection (vector, linkedList, HashSet, TreeSet,..) Clases que interpretan la interfaz Map (Hashtable, HashMap, TreeMap, ) Los dos casos básicos (1) c.insert(x) (x,c) ? E (2) x = c.extract() (c,x) ? E Los mismos arcos son los que serían introducidos en el OFG en presencia de las siguientes asignaciones (1) c = x (2) x = c
Generación del OFGContainers Library.loans = Library.addLoan.loan
Generación del OFGContainers Library.printAllLoans.i = Library.loans – el flujo desde el container(loans) al iterador i Libray.printAllLoans.loan =Library.printAllLoans.i; – El acceso al objeto contenido ( invocación de next) y la asignación a la variable local loan
Generación del OFGContainers
Generación del OFGContainers – Un objeto user es extraído del container users Library.getUser.return = Library.users – Un objeto user es insertado en el container users Library.users = Library.addUser.user
Algoritmo Data-Flowforward
Algoritmo Data-Flow forward La solución provista por el algoritmo es conservativa(segura), ningún flujo de datos que no esté contemplado ocurre. Sin embargo, es imposible decidir estáticamente si un camino es factible o no. Análisis insensible a objetos
OFG para análisis sensible a objetos En un análisis sensible a objetos los atributos de clase no estáticos y los métodos(incluyendo sus parámetros y variables locales) se replican para cada objeto identificado estáticamente. Para cada punto de asignación, se crea un identificador de objeto y todos los atributos y métodos en la clase son replicados. Construcción es más complicada ( se analizará más adelante)
OFGSensible a objetos Asumiendo que dos objetos son creados Loan1 y Loan2
OFGSensible a objetos Parte de código dentro del método main de la clase Main 5 objetos son asignados en el fragmento de código: User1, Document1, Loan1, Document2, Loan2
OFGData-flow Insensible a objetos
OFGData-Flow Sensible a objetos
OFGData-Flow
OFGData-Flow
OFGData-Flow
OFGData-Flow
OFGData-Flow
OFGData-Flow
Desde JAVA a diagramas de clases
Desde JAVA a diagramas de clase Los diagramas de clase resumen importantes decisiones de diseño sobre la organización del sistema.
Elementos de un diagrama de clases Clases Interfaz, clases abstractas, clases parametrizadas Relaciones de dependencia, generalización y asociación Especificaciones OCL
Desde JAVA a diagramas de clase Algoritmo basado en el análisis sintáctico del código Inconvenientes Las relaciones entre clases llevan información semántica que no puede ser inferida del análisis del código.
b) Los tipos declarados son una aproximación de las clases instanciadas en el programa debido a la presencia de relaciones de herencia y al uso de interfaces.
Algoritmo basado en OFG para resolver a) y b)
Extracción de clases La información mostrada en una clase (atributos, métodos, el tipo de los atributos, los parámetros de los métodos, su visibilidad y alcance) puede extraerse analizando la sintaxis.
EjemploExtracción de clases
EjemploExtracción de clases
EjemploExtracción de clases
EjemploExtracción de clases
Extracción de relaciones
EjemploExtracción de dependencias Dependencia entre Library y User
EjemploExtracción de dependencias Dependencia entre Library y Document
EjemploExtracción de asociaciones Loan está asociada a User y Document
Tipos actual vs. declarados Los tipos declarados de atributos, variables locales y parámetros de los métodos son usados para determinar la clase target de asociaciones y dependencias. Es bastante común que el tipo declarado sea la raíz de una jerarquía de herencia o que sea una interfaz. Ejemplo InternalUser es una subclase de User. Book, Journal, TechnicalReport son subclases de Document Si la aplicación usa sólo una parte del subárbol de herencia, el target de la asociación o dependencia puede ser incorrecto. Por ejemplo en una instancia específica una asociación debería conectar Loan y Book en vez de Document.
Tipos actuales vs. declarados Ejemplo Una aplicación puede contener una clase BinaryTreeNode con un atributo obj que almacena información asociada con cada nodo del árbol y su tipo declarado Comparable, la interfaz implementada para objetos que pueden ordenarse totalmente por el método compareTO. Esto generaría la asociación entre BinaryTreeNode a Comparable. Si la aplicación define a una clase Student que implementa a Comparable, el método propuesto no recupera la asociación entre BinaryTreeNode y Student El método propuesto no detecta que los tipos declarados pueden ser una superclase del tipo del objeto actual o una interfaz implementada para el objeto actual.
Data-Flow
Especialización para determinar el tipo de objetos actuales
EjemploÁrbol binario de búsqueda
EjemploÁrbol binario de búsqueda
Ejemplo-Árbol binario de búsquedaSintaxis abstracta
Ejemplo-Árbol binario de búsquedaOFG
Ejemplo-Árbol binario de búsquedaOFG Es detectada una asociación entre BinaryTreeNode y Student
Containers Clases que implementan estructuras de datos (Listas, árboles grafos, vectores, ) Los containers débilmente tipados coleccionan objetos cuyos tipos no son declarados, por ejemplo, Containers en versiones de JAVA que no soportan genericidad. Esto dificulta la ingeniería inversa dado que la información acerca de las clases de los objetos contenidos no se encuentra disponible en el código.
Containers Map y Collection son interfaces. Las clases que las implementan son HashMap y LinkedList, dos containers débilmente tipados, que son clases de biblioteca y no serán explicitadas
Ejemplo
Data-Flow forward para Containers
Data-Flow backward para Containers
EjemploContainers
EjemploContainers
EjemploContainers- Sintaxis abstracta
EjemploContainers- Sintaxis abstracta
EjemploContainers- Sintaxis abstracta
EjemploContainers- OFG
Desde JAVA a diagrama de objetos
Ingeniería inversa de diagramas de objetos El diagrama de objetos muestra una instantánea de un conjunto de objetos y sus relaciones. Los elementos en este diagrama (objetos y relaciones) son instancias de los elementos (clases y asociaciones) en el diagrama de clases. El diagrama de objetos muestra explícitamente cómo diferentes instancias pueden desempeñar diferentes roles y estar involucradas en diferentes relaciones.
Ingeniería inversa de diagrama de objetos Análisis estático + análisis dinámico Un análisis estático del código basado en OFG para aproximar estáticamente la creación de objetos y sus interrelaciones. Un análisis dinámico basado en trazas de ejecución donde cada una de ellas está asociada con un diagrama de objetos y las relaciones que son instanciadas. El análisis estático es seguro con respecto a los objetos y relaciones que representa, sin embargo, no provee información sobre multiplicidad y no permite detectar caminos que no son factibles
Extracción de diagramas de objetos Los puntos de asignación (líneas de código que contienen sentencias de asignación) son usados para aproximar el conjunto de objetos creados por un programa, mientras que el OFG es usado para determinar las relaciones entre objetos. Especialización de la propagación del flujo de datos
Extracción de diagramas de objetos Cada sitio de asignación ( 5) está asociado con un único identificador ci (el nombre de la clase c y un entero incrementado i). Cada identificador de objeto ci genera un nodo en el diagrama de objetos. Cada nodo en OFG asociado a un atributo, es decir con un prefijo c y sufijo a, donde a es un atributo de clase c, se tiene en cuenta cuando se generan asociaciones entre objetos. El conjunto out de tal nodo de OFG( es decir out[c.a]) da el conjunto de objetos alcanzables desde todos los objetos ci de clase c a lo largo de la asociación implementada a través del atributo a.
EjemploÁrbol binario de búsqueda- JAVA
EjemploÁrbol de búsqueda-Sintaxis abstracta
EjemploÁrbol de búsqueda-Sintaxis abstracta Los objetos de tipo BinaryTreeNode se asignan en 3 puntos distintos del programa, originando 3 identificadores: BinaryTreeNode1, BinaryTreeNode2, BinaryTreeNode3, los que están incluidos en el conjunto gen de BinaryTree.root, BinaryTreeNode.addLeft.n, BinaryTreeNode.addRight.n respectivamente. Hay una única asignación para objetos BinaryTree, el único identificador es BinaryTree1, insertado en el gen de BinaryTree.main.bt
EjemploÁrbol binario de búsqueda- OFG
EjemploÁrbol binario de búsqueda – OFG Construcción del diagrama de objetos Cada identificador se convierte en un nodo en el diagrama.Los conjuntos out de los atributos de clase determinan las interelaciones
EjemploÁrbol binario de búsqueda – OFG
Extracción del diagrama de objetosAnálisis sensible a objetos Un identificador de objeto ci se asocia a cada punto de asignación en el programa que se analiza. Una ubicación n originalmente alcanzada por una clase c, se asocia ahora a un conjunto de nodos n´, alcanzados por identificadores de objetos ci. Específicamente, para cada identificador de un objeto ci, creado para la clase c, una réplica de la ubicación n alcanzada por ci se inserta en el OFG
Análisis sensible a objetosReglas para la construcción del OFG
Extracción del diagrama de objetosEjemplo- Árbol de búsqueda
Extracción del diagrama de objetosEjemplo- Árbol de búsqueda
Ejemplo- Árbol de búsquedaOFG
Ejemplo- Árbol de búsquedaOFG Sensible a objetos
Ejemplo- Árbol de búsquedaOFG Sensible a objetos
Ejemplo- Árbol de búsquedaOFG Sensible a objetos
Ejemplo- Árbol de búsquedaOFG Insensible a objetos Sensible a objetos
Ejemplo- Árbol de búsquedaOFG El análisis sensible a objetos da información precisa sobre los elementos de datos almacenado en los dos árboles binarios bt1 y bt2. El OFG indica que el primer árbol es usado para administrar objetos de clase A y el segundo de tipo B1. El análisis insensible es menos preciso y no distingue los elementos almacenados en los dos árboles
Análisis dinámico Un análisis dinámico provee un conjunto de diagramas de objetos, cada uno asociado con un test. Las ejecuciones de un programa se asocian a una traza de ejecución de cuyo análisis surge un diagrama de objetos. Es parcial, está basado en un caso limitado de casos de prueba
Ejemplo- Árbol de búsquedaAnálisis dinámico Asumamos que los elementos del árbol están ordenados de acuerdo a compareTo disponible para el atributo object (en la clase BinaryTreeNode) que implementa una interfaz Comparable. Un test puede consistir en la creación de 1 o más objetos BinaryTreeNode, con un String asignado al atributo object y la inserción de los nodos en el mismo árbol. Supongamos 3 cadenas(a, b, c) para test TC1, TC2 y TC3
Análisis dinámico
Análisis dinámico
Ejemplo- Árbol de búsquedaAnálisis dinámico