jueves, 18 de julio de 2013

Mocking de servicios REST

No se si a vosotros os pasará como a mi , pero cada vez más tiendo a dejar los frameworks web JAVA como Struts, Spring MVC, JSF, GWT, etc a un lado y uso más HTML5, servicios REST y Frameworks MVC Javascript.

Desde que descubrí este tipo de frameworks  MVC Javascript cada vez los uso más, Os recomiendo que le echéis una ojeada a AngularJS,  Backbone o a mi favorito EmberJS.

Las aplicaciones desarrolladas con estos frameworks acaban siendo normalmente aplicaciones web "monopágina" donde la mayor parte de trabajo de ejecución no se lleva a cabo en el servidor sino en el navegador del usuario de la aplicación (por fin un poco de justicia! :) ).   Esto no quiere decir que el servidor solo se encargue de servir páginas y recursos estáticos: aquellas funciones que no pueden implementarse en Javascript en el cliente se pueden implementar en el servidor con la ayuda de las herramientas de nuestra elección y con servicios REST y peticiones y respuestas en formato JSON.

El ciclo de desarrollo de una aplicación web con HTML, CSS y Javascript es muy ligero, uno modifica el código de estos elementos refresca el navegador y puede comprobar los resultados.  Con los componentes del lado de servidor desarrollados en Java la cosa cambia...;  hay que compilar, empaquetar y desplegar.  Algunos sabréis que existen herramientas que alivian este ciclo tan pesado, yo soy muy fan por ejemplo del servidor web Jetty el cual lo puedes usar como un plugin desde Maven y lo ejecutas en el mismo espacio de trabajo de tu aplicación, con lo que al menos las tareas de empaquetamiento y despliegue te las puedes ahorrar, pero aun y así puede resultar demasiado pesado y además Jetty está limitado en cuanto a prestaciones se refiere.

Mocks

Lo que explico aquí solo vale para una aplicación web desarrollada con HTML, CSS  y Javascript : nada de JSPs, ni taglibs, ni scripts de servidor solo AJAX (con JQuery por ejemplo).  En este escenario de lo único que depende esa aplicación es que los servicios REST que usa respondan correctamente a las peticiones AJAX.   ¿Y si pudiéramos simular los servicios REST?  Si pudieramos generar dobles de los servicios originales de los servicios REST con la misma "firma", o sea que respondieran a las peticiones Ajax de la misma manera en que lo hacen los originales, entonces podríamos desarrollar y probar la capa de presentación de nuestra aplicación web sin necesidad del servidor de aplicaciones.  Dicho de otra manera:  Los componentes de servidor  (desde los servicios REST hacia abajo) y la capa de presentación (la aplicación Javascript) se podrían desarrollar en paralelo.

Wiremock

Wiremock es un librería para crear dobles de pruebas de servicios web, funciona creando un servidor web (Jetty casualmente) mediante el que se pueden servir los recursos estáticos de la aplicación y ejecutar los dobles de pruebas de los servicios web.

Para hacerlo bien los dobles de pruebas deben estar en la misma dirección / url que los originales, deben aceptar el mismo tipo de peticiones, con el mismo tipo de cabeceras y métodos http (GET; POST, PUT, ...), deben devolver datos con el mismo formato y los mismos códigos de respuesta HTTP.

Así pues imaginemos que tenemos un servicio REST que devuelve la información de un usuario en JSON,  la url de dicho servicio es rest/user/{login_usuario} y atiende a peticiones mediante el método GET.  El JSON devuelto por el servicio podría tener este aspecto:



Para simular com wiremock un doble para este servicio hay que hacer dos cosas:

  1.  Crear un fichero JSON con ese contenido u otro similar.
  2. Crear un mapeo para dicho servicio, un ejemplo de esto sería crear un fichero como este:

{
    "name": "Julian Rodríguez",
    "role": "OPERATOR",
    "userName": "jrodriguez",
    "organizationName": "Rodriguez industries s.l.",
    "organizationId" : 2
}

Wiremock está pensado para ser usado con frameworks de pruebas como JUnit, sin embargo en esta entrada os explico como lo he integrado yo en mi entorno de trabajo para ejecutar mi aplicación web y probarla si necesidad de los servicios REST reales.

Integración en un proyecto Maven

No os voy a marear con todos los detalles acerca del proyecto que estoy desarrollando, lo único que importa es que estoy desarrollando una aplicación web java con Maven como herramienta de construcción.
Eso significa que mi proyecto tiene una estructura de directorios similar a esta:



Todos los que useis Maven ya debéis conocer esta estructura:  Para poder usar wiremock tuve que incluir la siguiente dependencia en mi proyecto:



<dependency>
          <groupId>com.github.tomakehurst</groupId>
          <artifactId>wiremock</artifactId>
          <version>1.32</version>
         <classifier>standalone</classifier>
          <scope>test</scope>
</dependency>

Puse el scope test en tanto que la librería solo la uso con la finalidad de hacer pruebas y no quiero tenerla incluida en el war final resultante del proceso de construcción.

Para configurar wiremock son necesarios pocos parámetros:  Un número de puerto http donde se ejecutará el servidor web y un path para especificar el directorio raíz.  Dicho directorio raiz debe contener dos directorios:  uno llamado __files/ que debe contener los recursos estáticos de la aplicación y otro llamado mappings/ que contiene ficheros de mapeo como el que os he descrito en el apartado anterior.  Para los que conocéis bien maven seguramente seguramente os debe chocar eso del directorio __files, pues bien si queremos usar wiremock hay que cambiar el nombre del directorio webapp/ por __files/ ;  si después de leer esto alguien encuentra la manera de hacer lo mismo sin tener que cambiar el nombre de este directorio comentadlo.  Así pues mi estructura de directorios queda de la siguiente manera:



Para que todo funcione bien  hay que cambiar la configuración del plugin war para que coja los recursos del directorio que corresponde y no incluya en el war los ficheros relacionados con los mocks:


<plugin>
    <groupId>org.apache.maven.plugins</groupId>
    <artifactId>maven-war-plugin</artifactId>
    <version>2.3</version>
    <configuration>
 <warSourceDirectory>src/main/__files/</warSourceDirectory>
 <excludes>mocks/**</excludes>
    </configuration>
 </plugin>

Para iniciar wiremock sobre los ficheros de nuestro proyecto creé una clase que incluí dentro los tests (en src/test/java) , el código de esta clase:


 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
public class MockServerRunner {

    public static void main(String[] args) {        
        WireMockConfiguration wireMockConfiguration = WireMockConfiguration.wireMockConfig();
        wireMockConfiguration.withRootDirectory("src/main");
        wireMockConfiguration.port(8082);
        Log4jConfiguration.configureLogging(true);

        WireMockServer wireMockServer = new WireMockServer(wireMockConfiguration);

        wireMockServer.start();
    }

}

En esa clase he destacado los dos parámetros que os comentaba antes, el puerto http y el directorio raiz:  como src/main contiene __files y mappings wiremock debe funcionar sin problemas.

El último ingrediente de la mezcla es la configuración del plugin exec-maven-plugin para que ejecutar nuestro servidor wiremock sea más fácil:


<plugin>
              <groupId>org.codehaus.mojo</groupId>
              <artifactId>exec-maven-plugin</artifactId>
              <version>1.2.1</version>
              <configuration>
                    <mainClass>MockServerRunner</mainClass>
                    <classpathScope>test</classpathScope>
              </configuration>
</plugin>

Con esto ejecutar nuestra aplicación web en modo "desarrollo" con la capa de presentación y los mocks es tan fácil como ejecutar en la carpeta del proyecto mvn exec:java  .

Usando esta configuración es posible ejecutar nuestra aplicación web y simular de una forma fácil todo el tráfico de datos de los servicios REST lo cual nos puede ayudar en los siguientes casos:

  • Simular servicios REST de terceros y ver como se comporta nuestra aplicación.
  • Crear prototipos de nuestros servicios REST antes de implementarlos.
  • Probar casos de error excepcionales al ejecutar servicios REST.
  • y como no, ejecutar y modificar nuestra aplicación Javascript sin necesidad de despelgarla.



miércoles, 8 de febrero de 2012

Algunas notas sobre Visual VM









Para empezar con este blog comenzaré hablando sobre ese tipo de utilidades que tan poco parecen ser utilizadas: estoy hablando de los "profilers" o analizadores.

¿Qué es un profiler?

Un profiler es una herramienta que nos ayuda a encontrar y a identificar cuellos de botella en nuestras aplicaciones JAVA: situaciones en las que nuestras aplicaciones se vuelven incomprensiblemente lentas o consumen más memoria de lo deseable o recomendable.  Estas herramientas acostumbran a ofrecer una visión detallada sobre el consumo de cpu y de memoria y ayudan a identificar qué ocupa esa memoria o en qué invierte el tiempo de cpu el programa.

Lo cierto es que cuando uno abre por primera vez una de estas herramientas y ve todo lo que hay dentro se marea un poco, así que compartiré con vosotros alguna de mis últimas experiencias para que os hagáis una ligera idea de como le podéis sacar partido a esto.

Existen muchos y muy buenos profilers para Java, algunos de los que he oído nombrar y/o he tenido oportunidad de utilizar son:
Hay muchos otros y muchos de ellos disponen de características muy interesantes que ayudan a realizar análisis muy detallados de diferentes aspectos de un programa, aunque en esta entrada hablaré de Visual VM, el cual además de ser gratuito es muy fácil de usar y cubre la mayor parte de las necesidades que pueda tener un programador / analista a la hora de encontrar problemas y cuellos de botella. 

¿A quién le puede interesar un profiler?

Un profiler es una herramienta interesante para cualquier persona que desempeñe alguno de los siguientes roles:
  •  Desarrollador de aplicaciones JAVA
  • Administrador encargado de supervisar servidores de aplicaciones Java.
  • Analista encargado de realizar pruebas de rendimiento a aplicaciones Java.
  • Cualquier técnico o usuario que quiera proporcionar un informe de error detallado sobre un bug de una aplicación Java.
  • Cualquier curioso que le guste mirar las entrañas de una aplicación Java ... :)  
¿Qué me puede ofrecer Visual VM?

 Visual VM funciona conéctandose a una máquina virtual Java que ejecute la aplicación que queráis analizar, una vez conectado tiene acceso a cualquier dato o detalle de dicha máquina virtual y os permite hacer las siguientes cosas:
  • Podeis analizar aplicaciones que se ejecutan en una máquina virtual Java local (la de tu ordenador) o en una máquina virtual de un equipo remoto (por ejemplo el servidor de desarrollo que compartes con tus compañeros de fatigas).
  • Os permite consultar todo tipo de información sobre la máquina virtual a la que se haya conectado:
    • Argumentos de inicialización de la máquina virtual.
    • Propiedades de sistema de la máquina virtual.
    • Gráficas de consumo de cpu, memoria heap y PermGen, número de clases cargadas, número de hilos / threads. 
    • Lista de hilos / threads y actividad de los mismos.
  • Realizar volcados de threads, pila.
    • Cargar, analizar y explorar volcados de pila y de nucleo (core dump).
    • Analiza en tiempo real el consumo de CPU (desglose de ocupación de CPU) y de memoria (lista de clases cargadas, número de instancias de cada clase).
      • Crear "capturas" o "fotos" (snapshots) del estado de la memoria  o de la CPU en un instante concreto.  Esta característica es muy interesante para poder hacer comparativas o análisis "offline".
    • En los volcados de pila podemos navegar dentro de sus contenidos viendo los objetos y sus contenidos.
    • Permite realizar consultas y filtros ad-hoc sobre los contenidos de los volcados como si realizáramos una consulta sobre una base de datos, usando un lenguaje de consultas llamado OQL (Object Query Language).  
Un ejemplo de uso

Hasta aquí la promoción gratuita de la aplicación, imagino que querréis ver de qué manera se utiliza la aplicación, a continuación os resumo una de mis últimas experiencias con esta herramienta.

Bien, pues erase una vez :) una aplicación web JAVA que se ejecutaba en un servidor de aplicaciones jboss y consumía mucha memoria, ¿os suena de algo el cuento?, tanto era así que cada vez que era probada el servidor se quedaba sin memoria heap.  El servidor tenía mucha memoria asignada para su heap y no estaba siendo usado por nadie más así que no cabía mucho la excusa acerca de que la memoria se la estuviera comiendo otra aplicación.

Alguien me pidió si era posible averiguar qué hacía que la aplicación usara tanta memoria así que armado con mi herramienta Visual VM, me puse a investigar un poco que se estaba cociendo allí.   Tomé la aplicación y la desplegué en mi servidor JBoss local, arranqué el servidor y desde Visual VM me conecté.

Lista de aplicaciones activas en el equipo local
  Al acceder al proceso "Jboss" local empecé a obtener más información, de entrada las propiedades generales de la máquina virtual a la que me acababa de conectar:

Resumen propiedades Visual VM


El problema que estoy investigando tenía que ver con el consumo de memoria en un escenario concreto, que se daba cuando el usuario de la aplicación realizaba una acción concreta, así que repetí la acción y me dispuse a investigar más a fondo, ... ¿por dónde empezar?, bueno hay varias opciones,  primero me perdí un rato mirando entre las pestañas de detalle de la máquina virtual que estaba inspeccionado, concretamente me fui a la pestaña "monitor" dónde pude constatar gracias a las gráficas que vi allí que efectivamente el tamaño de la memoria de pila había crecido después que realizara la acción.
Ejemplo de la pestaña "monitor" de la máquina virtual




Bueno, pero esto no me resolvía el problema, solo me daba pistas de que efectivamente andaba en la dirección correcta, ¿cómo llegaría a identificar el motivo del crecimiento de la memoria?, después de estar buscando un modo entre la documentación de Visual VM fui a dar con el principio de la solución, si quería esa información necesitaba muestras de datos de la máquina virtual.   Wait a minute? ¿muestras de datos? pues si, es un poco parecido a cuando quieres llevar a cabo un estudio estadístico, hasta que no tienes una base muestral significativa no puedes realizar el estudio, y además no valía cualquier base muestral, tenía que ser una base muestral "estática" dado que para la acción que quería llevar a cabo necesitaba una "instantánea" del estado de la máquina virtual justo en aquel momento después de realizar la prueba en la que el consumo de memoria se había disparado.  Por suerte esto Visual VM te permite realizarlo a las mil maravillas, primero de todo si quieres muestras de datos en vivo y cambiantes en tiempo real debes ir a la pestaña Sampler (muestreador en inglés).  Allí en función del tipo de muestras que quieras obtener debes seleccionar un botón u otro:  CPU o Memory, en mi caso la elección era fácil, enchufé el Memory y empezó el baile de datos delante mío ...
Muestras en vivo de estadísticas de clases


Delante de mis ojos estaban bailando las cifras , pero a ver, ¿qué era todo aquello? después de mirarlo unos segundos comencé a entender, estaba viendo las estadísticas de las clases que había cargadas en memoria, junto con el número de bytes que ocupaban dichas clases y el número de instancias que tenían.  Lo de decir que era un baile "en vivo" no es para nada exagerado porque iban cambiando de posición en la tabla constantemente, aunque eso si las clases de las primeras posiciones de la tabla no se movían mucho.


Al ver la casilla de texto de la parte inferior , donde dice "Class Name Filter" me sentí tentado de escribir el nombre del paquete que pertenecía a la aplicación que estaba investigando (y de la que tenía el código fuente), al hacerlo voilá! automaticamente aparecieron únicamente las clases de mi aplicación, pero me llevé una decepción al ver que en porcentaje ninguna de ellas representaba ningún volumen significativo de datos (ni siquiera un 1%).  Algo no encajaba, y era normal que fuera así dado que poco después descubrí que los volúmenes de datos expresados para cada clase representaban el tamaño que las instancias de dichas clases ocupaban en la memoria virtual, pero para cada clase por separado, esto es, si una clase tenía un atributo de otro tipo (por ejemplo char[]) el tamaño ocupado por los valores de dichos atributos no eran sumados al de la clase contenedora.  Además tampoco era posible ver las instancias de dichas clases.  Al final resulta normal que las clases con mayor volumen de datos fueran de tipos de datos primitivos o arrays de estos dado que en última instancia todo está construido sobre estos.  

Con tanto baile de números arriba y abajo era difícil que pudiera tener una imagen estable de lo que pasaba, así que aquí vino la segunda parte:  había que tomar una instantánea del estado de la aplicación en pleno estado de colapso de la memoria.  Tomar una instántanea de aquella situación no podía ser mas fácil:  Haces clic en el botón "Snapshot" encima de la tabla y obtienes una captura de la misma tabla pero congelada.  Pero seguía con el mismo problema, ¿como ver qué instancias tenía cada clase y como ver sus contenidos? la respuesta no está lejos:  lo que necesitaba era un "Heap Dump" (un volcado de pila de toda la vida... ).  De hecho el botón para realizar un Heap Dump no está muy lejos del botón para el snapshot, encima de la tabla a la derecha.


La primera cosa que notas al hacer un "Heap dump" es que Visual VM se queda parado un rato más largo que con un "Snapshot", sobre todo si tu pila está bien cargadita ;) . Al terminar obtienes algo como lo de la siguiente pantalla ...
Volcado de pila


Ok, uno empieza a leer de izquierda a derecha y ves la fecha en que se hizo el volcado, el fichero donde se ha guardado el volcado, el tamaño del volcado, # bytes, # clases, propiedades de la máquina virtual, etc ... y de repente te encuentras a la derecha con un panel que pone "Inspect" y debajo pone "Find 20 biggest objects by retained size" y un botón Find, evidentemente si sabes un poco de inglés piensas ... "ahí le has dao", "los cuarenta / 2 principales del consumo de memoria" servidos en bandeja, busqué un poco por el manual para averiguar que quería decir "retained size" y averigué que era el tamaño de un objeto + el de los objetos contenidos, genial! ya estaba en la pista, le di al botón Find.  Primero de todo Visual Vm te advierte que va a calcular los "retained sizes" y que eso le va a llevar un rato, así que pensé: "me voy a por un café". Cuando volví, excitado por el café y por el subidón de la expectativa creada encontré la lista de resultados.


Lista de los 20 objetos que consumían más memoria


Después de investigar un rato entre la lista y comencé por descartar aquellos objetos cuya clase no se correspondía con la aplicación que estaba investigando ni con ninguna de sus actividades acabé centrando mi atención en la clase org.apache.catalina.session.StandardManager, después de "googlear" un poco averigué un poco sobre esa clase, por lo que dice en su descripción tiene que ver  corresponde con la persistencia de sesiones web de usuario en Tomcat / JBoss.  Ese objeto en aquel momento en que realicé el volcado ocupaba la nada despreciable cifra de 5574570 bytes = 5443 kilobytes = 5,31 MB, nada mal (lo de mal era un decir) para una aplicación web JAVA.  Por ahí empecé a entender que el problema que estaba buscando estaba relacionado con el tamaño de la sesión.

Además desde el listado se podía clicar en el enlace de la fila correspondiente a la clase y me permitía ver los contenidos de dicho objeto, con lo que pude averiguar más sobre mi problema y navegar dentro del objeto:


Navegando por la pila de memoria, dentro del objeto session de JBoss

Navegar dentro del objeto me permitió visualizar otro detalle interesante:  muchos de los objetos que encontré dentro del objeto StandardManager eran de hecho objetos que ya aparecían en el listado inicial (java.util.concurrent.ConcurrentHashMap y derivados ...), después de navegar un poco más dentro de estos objetos acabé dando con un objeto que estaba dentro de una sesión web de usuario cuyo tamaño era casi igual al de toda la sesión.


Otras cosas que podría haber hecho (y que probé)


He descrito una forma de acabar identificando al causante de un problema como un "memory leak" que puede requerir tiempo y paciencia para llevarla a cabo, otras cosas que podría haber hecho y que probablemente hubieran requerido menos tiempo de trabajo hubieran sido las siguientes:


1. Ampliar la lista de objetos con mayor tamaño de la pila


Si en el paso inicial después de cargar el volcado de pila hubiera solicitado 40 objetos en vez de veinte hubiera encontrado antes el objeto de mi aplicación que estaba ocupando tanto espacio; resulta fácil reconocerlo por la ruta de paquetes.


2. Usando el lenguaje de consultas OQL


Sabiendo que mis problemas tenían que ver con la sesión de usuario podría haberme dedicado a buscar sesiones de usuario (o sea implementaciones de la clase javax.servlet.http.HttpSession), ¿cómo hacer esto? primero hay que saber qué buscas: para averiguar como se llama la clase que implementa esta interfaz en Tomcat usé los javadocs de la API de Tomcat y un poco de Google y acabé dando con el nombre de dicha implementación dentro de Tomcat, en el caso de Tomcat (versiones 5 y 6, ...) / Jboss se llama org.apache.catalina.session.StandardSession .  Usando este dato  y la consola OQL de Visual Vm puedes hacer cosas realmente espectaculares, como la siguiente:


Consola de consulta de objetos dentro de la pila
Simplemente introducís la consulta
select o from org.apache.catalina.session.StandardSession o

, le dais al botón execute y obtendréis la lista de objetos de tipo sesión que haya en la pila.



Ok, hay dos sesiones, podemos, usando los enlaces, navegar dentro del contenido de dichas sesiones, lo cual está bastante bien.  Pero, ¿cual de ellas merece la pena mirar? en nuestro contexto sería la que ocupara más espacio, ¿cómo averiguarlo? retocamos un poco la consulta:  





La nueva versión de la consulta (que podéis ver en la imagen de arriba) nos permite ver por cada objeto el tamaño de este y sus objetos asociados / contenidos ( rsizeof(o) ) además del identificador del objeto.  Claramente una de las sesiones es más grande que la otra y la mayor ocupa 5571593 bytes = 5,31 MB, unos pocos menos bytes que el objeto en el que nos fijamos al principio pero la diferencia es insignificante.

El lenguaje de consultas OQL nos permite hacer verdaderas virguerías, basándonos en los resultados de la anterior consulta podemos por ejemplo buscar todos los objetos contenidos dentro de la sesión usando por ejemplo la siguiente consulta:

select reachables(o) 
from org.apache.catalina.session.StandardSession o 
where objectid(o) == 400519176


La función reachables devuelve el conjunto de objetos que son referenciados directa o indirectamente desde "o" (todo el grafo de objetos contenido dentro de la sesión).  La función objectid(o) devuelve el id del objeto "o" el cual podemos usar para filtrar los resultados de la consulta y quedarnos con la sesión que nos interesa (que tiene id 400519176).

Al ver los resultados de la consulta anterior encontraríais demasiados objetos y muchos de ellos no serían relevantes dado que no pertenecen al conjunto de clases de vuestra aplicación, ¿qué podemos hacer? ampliemos la consulta ...

select top(
map(
        filter(reachables(o),
"/com.tuaplicacion./classof(it).name"),
        "{object: it, size: rsizeof(it)}"),
        "rhs.size - lhs.size",20
        )
from org.apache.catalina.session.StandardSession o 
where objectid(o) == 400519176

Esta consulta devuelve el "top 20" de los objetos más grandes de la sesión, por partes:  top(<array>,"rhs.size - lhs.size",20) devuelve un array con los 20 objetos más grandes del array usando como expresión de comparación el segundo parámetro.    

La función map(array,"{object: it, size: rsizeof(it)}")
) devuelve un array en el que cada posición del mismo es un mapa con las claves y valores indicados en la expresión del segundo argumento.

La función filter(array,"/com.tuaplicacion./classof(it).name") devuelve un array en el que cada elemento es un objeto cuya clase pertenece a un paquete cuyo nombre empieza por "com.tuaplicacion".

Concluyendo 


Podría escribir varias entradas del blog hablando del lenguaje de consultas OQL, de las capacidades de análisis del consumo de CPU y de otras muchas cosas.  Realmente Visual VM es una herramienta muy completa y vale mucho la pena usarla.  Os puede costar varias horas identificar cuellos de botella, pero sin herramientas como esta os acabareis basando en suposiciones y muy posiblemente os perderéis entre documentación y pruebas sin sentido e invertiréis más tiempo del que hubierais necesitado usándola para además no poder cuantificar de una forma fiable la magnitud de vuestro problema.